Ups, METAPODATKI

Prispevek ni primeren za forenzike, ki preiskujejo računalniško kriminaliteto!

Ta tema je meni precej smešna, za nepoučene pa vedno predmet paranoje in večinoma lažnega občutka, da so neprestano nadzorovani.

Za kaj gre?

V sami besedilni datoteki so običajno shranjeni poleg besedila še ostali podatki, kot so recimo avtorstvo dokumenta, mesto, kjer se dokument nahaja na strežniku ali v računalniku, kdaj je bil dokument ustvarjen, popravljen, kdaj natisnjen in še cela kopica ostalih zanimivih podatkov. Nekateri podatki so običajno vidni prek menijskega ukaza Datoteka – lastnosti urejevalnika besedil.

Pa to še ni najhuje.

Zmogljivi urejevalniki besedil, kamor sodijo najbolj razširjeni MS Word, OpenOffice.org Write in Corel WordPerfect, imajo vgrajene napredne funkcije, ki shranjujejo v datoteko poleg samega besedila še celo kopico ostalih podatkov. Tako recimo poznana funkcija Razveljavi (Undo), seveda mora shranjevati nekam v datoteko tudi brisano besedilo, če bo uporabnik kasneje preklical brisanje.

Pa tudi to še ni najhuje.

V dokumentih so lahko shranjeni celo celi programi (makri), vključno s povezavami na podatkovne stržnike ter SQL poizvedbami, ki razkrijejo tako strukturo podatkov, imena zbirk podatkov, tabel in še celo vrsto zanimivih, a za nepovabljeno oko neprimernih podrobnosti.

Mnogi dokumenti danes nastajajo tudi s pomočjo skupinskega dela, ko isto besedilo datoteko popravlja več oseb, potem se pa nekateri popravki sprejmejo, drugi pa zavržejo, pri čemer so seveda še vedno dostopni v sami datoteki. Tako lahko nekdo, ki pozna možnosti izrabe metapodatkov, pride do celotne poti, kako je nek dokument nastajal v neki delovni skupini, kateri predlogi in čigavi so bili sprejeti in kateri zavrženi.

Tu tiči razlog, zakaj pridejo v javnost razni dokumenti, ki dokazujejo, da je recimo hipotetično Zakon o zavarovalništvu dejansko nastal v zavarovalnicah in ga Ministrstvo za finance samo vizualno oblikuje in poda naprej državnemu zboru v rutinski sprejem. Obstajajo dokumenti, ki dokazujejo, da je razpisna dokumentacija nastala kasneje, kot je bil objavljen razpis. Dokumenti, ki dokazujejo, da pogodbe pripravljajo prodajalci in ne kupci. Dokumenti, ki dokazujejo, da poslovni partner na dokumentu ni delal cel mesec, temveč je najel študenta, ki je dokument pripravljal doma in samo nekaj dni, račun pa je bil seveda polno obračunan in tako naprej. Tega je res ogromno.

Običajni uporabniki in vodstveni delavci vseh področji informatike ne morejo poznati, običajno za take neprijetnosti krivijo lokalne hišne informatike (HIŠMATIKE – izraz je copyright by dr. Onyx), ki naj bi ves čas pregledovali pošto, vohljali za datotekami in prek oddaljenega dostopa spremljali vsak gib z miško visokih uradnikov ter tako pridobljene podatke za denar prodajali medijem. In tu se tudi sam počutim UŽALJENEGA in GLOBOKO PRIZADETEGA.

Domišljija ima tu prosto pot, resnica pa običajno drugačna in večino teh primerov, za katere izvedo novinarji, dejansko povzroči NEZNANJE, saj besedilne datoteke pošiljajo v nespremenjeni obliki po elektronski pošti z vsemi metapodatki kar sami ali službe za stike z javnostmi, ker želijo čim hitreje in čim bolj ustreči zvedavim novinarjem.

Iznajdlivi novinarji lahko tako vse datoteke, ki jim pridejo v poštni predal, usmerijo lokalnemu guruju za računalnike, ki iztisne iz dokumenta kar največ zanimivih in nevidnih podatkov. To, da se enako počne tudi pri korespondenci z EU je zgolj dokaz, da problema pač ne razumejo, ali samo ignorirajo.

Rešitve za ta problem obstajajo in nekako industrijski standard oziroma splošno sprejeta je uporaba zapisa Adobe PDF, ki je nekakšna elektronska različica natisnjenega dokumenta, brez zgoraj navedenih bolj ali manj skritih metapodatkov, ki običajno spremljajo besedilne datoteke.

Uporabnik, ki dobi tak dokument, potrebuje za pregledovanje in tiskanje samo program Acrobat Reader, ki je brezplačno dostopen in vidi dokument tak, kot bi bil natisnjen na papir.

Za pretvorbo dokumentov v PDF obliko je originalna rešitev polna različica programa Adobe Acrobat, ki pa je plačljiva in katere cena ni zanemarljiva, sploh če se namešča na več delovnih postaj. Obstajajo pa tudi druge rešitve, za pretvorbo dokumentov v PDF obliko, nekatere pa so tudi povsem brezplačne in tako primerne za širši krog uporabnikov, tudi uporabnikov doma.

OpenOfice.org ima privzeto v novejših različicah že vgrajeno možnost Izvozi v PDF, tako da je postopek za uporabnika enostaven.

Potem obstaja tu še nekaj brezplačnih pretvornikov dokumentov v obliko PDF, ki se namestijo v sistem kot tiskalniki in na katere se lahko potem dokument “natisne”, kot na običajni tiskalnik, le da tu nastane datoteka oblike zapisa PDF.

Primer takih pretvornikov so Primo PDF, PDF995, CutePDF, PDF4Free in podobni, povezave na spletne strani teh programov so objavljene na koncu prispevka.

Vsi našteti pretvorniki bolj ali manj zadovoljivo opravljajo pretvorbo, pri nekaterih dokumentih pa lahko nastopijo tudi napake pri pretvorbi, ali pa zahtevajo recimo višje pravice za delovanje od navadnih uporabniških, zato jih je potrebno za profesionalno in množično uporabo v podjetjih in državni upravi morda jemati z nekoliko rezerve, predvsem pa preveriti pred širšo uporabo, kako se dejansko obnesejo v praksi z dokumenti, ki nastanejo v poslovnem procesu.

Za domače potrebe so pa nedvomno prva in najboljša izbira, brez veliko razmišljanja.

Ker je po mojem mnenju za pretvorbo dokumentov v PDF obliko še najbolši Adobov Acrobat sem za potrebe pretvarjanja dokumentov zbirke MS Office v omrežnih okoljih, kjer dela veliko uporabnikov na skupnem datotečnem strežniku, razvil program, ki je zamišljen kot nekakšen “robot”, ki neprestano teče na za to namenjenem računalniku in ki ima dostop do omrežnih diskov.

Na računalniku, kjer program teče, mora biti nameščena polna verzija Adobe Acrobata (vključno z “distillerjem”) ter zbirka MS Office. Program vsakih nekaj sekund preverja vsebino mrežne mape in če se v njej nahaja MS Word ali MS Excel datoteka, jo odpre in prek Acrobat distillerja natisne v PDF obliko in shrani v izhodni imenik ter izvorno datoteko pobriše.

Tako lahko vsi uporabniki, ki imajo dostop do map, s kopiranjem običajnih datotek izvajajo pretvorbo v PDF.

Rešitev se trenutno, kakor mi je znano, uporablja že skoraj leto dni za pretvorbo dokumentov v PDF obliko za objavo na spletu v neki “ustanovi” in nekako deluje (sistem WIN XP SP1, Adobe Acrobat 7 Standard in MS Office 2002).

Ideja je sicer bila, da bi PDF obliko zapisa za izmenjavo z zunanjimi subjekti državna uprava sprejela kot standard, vendar kakor mi je znano, temu ni tako in se še vedno pošilja po elektronski pošti karkoli pride pod roko oziroma “attachment”. Seveda, ko pa potem pride do odtekanja informacij, so pa vedno krivi HIŠMATIKI, ki so domnevno neprestano na zvezi z novinarji.

Programček je bil napisan na hitro, brez naprednih funkcij in nastavitev ter so bile med samim delovanjem odpravljene nekatere težave. Kdorkoli želi, si lahko program priredi po svojih potrebah (napisan je v Delphi 6 jeziku), morda še boljša rešitev pa bi bila, da bi tekel kot storitev in morda imel tudi možnost, da bere poštni predal in pošiljatelju vrne pretvorjene dokumente kar po elektronski pošti.

PDFPretvornik (programska koda)

Funkcionalno podobna, a naprednejša rešitev, sicer obstaja tudi za prgišče dolarjev in je na voljo na spletnem naslovu:

http://www.pdfpdf.com/batch.html

V vsakem primeru, ne glede na uporabljeno orodje za pretvorbo v PDF dokument, pa mora uporabnik sam poskrbeti, da iz dokumenta odstrani komentarje, revizije in če je potrebno tudi podatke o avtorstvu dokumenta. Microsoft za svoj urejevalnik omogoča prenos iz spleta orodja za Office 2003 “remove hidden data“, ki odstrani navedene metapodatke.

Nekatere metapodatke, ki jih hrani dokument vrste MS Office, lahko pogledamo prek lastnosti datoteke (meni Datoteka – lastnosti), kjer so metapodatki navedeni na večih zavihkih ter s pomočjo možnosti obnavljanja dokumenta iz katerekoli datoteke (izberemo Datoteka – odpri ter vrsta datoteke Reši besedilo iz poljubne datoteke *.*). Na koncu odprte datoteke so tudi prikazani metapodatki.

Kar se tiče ostalih metod za odstranjevanje metapodatkov, se uporablja še pošiljanje dokumentov v obliki slike (običajno zapis vrste tif), ali pa shranjevanje dokumenta v RTF obliko, ki večine metapodatkov ne pozna.

Sam osebno še vedno menim, da je PDF oblika za večino primerov elektronske distribucije dokumentov izven zaprtega okolja najprimernejša.

Povezave:

Adobe Acrobat
Openoffice.org

PDFCreator
PrimoPDF
CutePDFWriter
PDF4Free
PDF995

Advertisements

5 komentarjev to “Ups, METAPODATKI”

  1. sonny Says:

    jp, zdaj pa si zaslužiš aplavz. Vsaj nekdo, ki ne pričakuje, da bodo vsi imeli nameščen MS Word in potem veselo pošilja te datoteke okoli.
    So pa zato v veliki (največji) meri krive izobraževalne ustanove, ki forsirajo word kot edini urejevalnik besedil in s tem povezane datoteke.
    Zadnjič je bila punca na izpitu (informatika al karkoli že) in ji nekaj ni delalo (relativne in absolutne poti dokumenta). Vrli vseznali prifesor tega seveda ni znal usposobit in na koncu ji še zabiča: “Ja to morate naredit na kak drug način, kako se boste pa znašli, ko boste z besedilom prišli na seminar v Bruselj”
    Meni osebno niti na misel nebi prišlo, da bi šel na tak seminar z *.doc ali pa powerPointom (vsaj brez prenosnika ne 🙂 )

  2. rockstar1707 Says:

    Jaz osebno prisegam na PDFCreator: http://sourceforge.net/projects/pdfcreator/

    Oz. LaTeX ali OOo.

  3. buba švabe Says:

    Pri nas se že dolgo časa fura samo PDF. Vse, kar se sprinta na papir in podpiše, se pretvori v PDF in to je to. Izvorni .doc ali karkoli pač že je, je samo za potrebe delovnega procesa.

    Doma pa itak ni variante, da bi uporabil karkoli drugega kot PDF. Če je že kaj treba naredit v OpenOffice, je za distribucijo na koncu export v PDF. Za vse ostalo je pa samo LaTeX in pretvorba v PDF.

    Še ena stvar, za kaj je PDF koristen, je printanje internetnih strani. Printanje direktno iz browserja je v večini primerov popolnoma neuporabno. Če pa “sprintaš” v PDF (npr. s Primo PDF) in potem pošlješ ta PDF na tiskalnik, dobiš na papir točno to, kar vidiš v browserju.

  4. dronyx Says:

    @Rokstar1707

    Ja, PDFCreatorja sem pozabil. Dodal med povezave.

  5. ikari Says:

    nadvse zanimivo… a tako na faksih prfoksi pridejo do tega kdo je vajo oblikoval in jo zavrnejo… o fak.

    thnx za tole.. velik novga sem zvedel je rekel blont tip 😉

Oddajte komentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

Komentirate prijavljeni s svojim WordPress.com računom. Odjava /  Spremeni )

Google photo

Komentirate prijavljeni s svojim Google računom. Odjava /  Spremeni )

Twitter picture

Komentirate prijavljeni s svojim Twitter računom. Odjava /  Spremeni )

Facebook photo

Komentirate prijavljeni s svojim Facebook računom. Odjava /  Spremeni )

Connecting to %s


%d bloggers like this: