Milline peab olema Vironia arhiivindus eelseisval sajandil?

Informaatika areng viimase kahekümne aasta jooksul on toonud vajadust mitte ainult säilitada, vaid ka süstematiseerida, suur hulk arvutifaile, luues nendest korralikult sirvitavat ehk "navigeeritavat" digitaalset kapitali. Kokkupanemist ootava korralikult läbitöödeldud digitaalse kapitali toormaterjal on heterogeenne. Esiteks (kui alata kõige vähemtähtsa ainega) on pidev, Vironia hetkeseisu elavalt peegeldav, elektronposti vool, mõnesaja või mõne üksiku tuhande sõna ulatuses päeval, eeskätt vestluslistil <korp.vironia@lists.ut.ee>. Teiseks (seega märksa tähtsam kategooria) on formaalsemad dokumendid, näiteks konventide koosoleku protokollid, pea alati paberile printitud, kuid koostatud ning salvestatud tekstiredaktorite failidena. Kolmandaks on digitaalne pildimaterjal - eeskätt failid loodud skänneril pimikus toodetud fotodest, kuid alatest umbes 2000. a. ka tunduv hulk digitaalsete kaamerate ülesvõtteid. Neljandaks (kõige tähtsamaks kategooriaks) on kõige suuremad, kõige formaalsemad dokumendid, tervete raamatute elektroonilised failidekogumikud (praegu juba Eestis 2000. a. välja antud uus "Album Vironorum", Torontos käesolev juubelialbum). Tuleb veel loota, et kaugemas tulevikus saab kõige tähtsam osa vanadest materjalidest, eeskätt EAA-s asuvad Edgar Saksa II.A ning II.B seeriad, ehk koosolekute protokollid-lisad, üle kantud digitaalsesse formaati - mitte skännimise ehk digitaalse pildistamise, vaid tegeliku tippimise näol, et digitaalne toodang oleks ka otsingumootoritega käsitletav.

Digitaalne arhiivindus seab arhivaarid huvitavate probleemide ette:

Järelikult on soovitav digitaalses arhiivinduses usaldada küberneetikat nii vähe kui võimalik, olles igas asjas kõige hullemaks valmis. Selle asemel, et sälitada informatsiooni mõnes format du jour'i raamistikus nagu Microsoft Office, tuleb rakendada kõige tugevamat riigivalitsusvaheliste lepetega kaitstud, ebakommertsiaalset, tehnikat. Selleks on juba 1986. a. saadik olnud Standard Generalized Markup Language ehk SGML (kui International Organization for Standardization tava ISO 8879; välja antud kommentaariga oma peamise autori poolt kui [Goldfarb 1990]). Praegu, 2001. a., on küll nihe toimumas, kuna SGML-i kõrval võrsub XML. XML on SGML-i lähedane sugulane, sisuliselt SGML mõningate süntaktiliste kitsendustega. (Kus SGML-is on lubatud n. o. variandid a, b, c, d, e, ... , siis a on alles jäetud XML-is, teised variandid keelatud.) Üldpilt jääb siiski kehtima - XML, või see SGML-i alamhulk mis on XML-legaalne, on arhiivinduses eelistatud.

Kui arhiiv on peetud SGML/XML-is, siis seda saab igal aastakümnel konverteerida ajutiselt populaarsust võitnud kommertsiaalsetesse formaatidesse. Näiteks 2001. a. Linux'i ünhiskonnas levinud "jade" ladumismootor võtab vastu SGML-i, annab välja RTF-i (kui tekstitöötlemise üks format du jour), PostScript'i (kui peenema trükkaritindi tüpograafia format du jour ning HTML-i (kui veebide format du jour). Sealjuures on SGML-i ühiskond ettevalmistatud RTF-i, PostScript'i ning HTML-i kunagiseks aegumiseks.

Radikaalsem mure kui piiratud ajaks populaarsust võitnud formaatide kadumine on magneetiliste ning optiliste digitaalsete salvestuste degradeerumine. Kaitse salvestusmeediumite hävingu vastu seisab SGML-i allikate väljaprintimises, happevabale paberile. Kui siis tekiks vajadus näiteks 2100. a. taastada SGML-i tekstiallikat bait baidi järgi, piisaks happevabade paberite laskmist läbi selle ajastu optiliste karakteride äratundmise ehk Optical Character Recognition seadeldiste.

Mis aga, kui juhtuks kõige hullem, s. o., kui eelseisvas ökoloogilises-sotsiaalses-poliitilises keerises küberneetika oskusedki häviksid? Kuna SGML on 7-bitine ASCII (mitte binaarne failiformaat nagu Word ning WordPerfect), ta on ka ilma raalita loetav. Kus laotud tekstis seisab

välja antud kommentaariga oma peamise autori poolt kui [Goldfarb 1990]

siis SGML-i allikas seisab veidi eemalepeletav, kuid siiski tavalisele arvutita arhiivitöölisele mõistetav

välja antud kommentaariga oma peamise autori poolt kui <citation>Goldfarb 1990</citation>

Nii siis ka viimse katastroofi stsenaariumis, kus raalinduse oskusedki kaovad, saaksid tulevased põlved kogutud digitaalse kapitali sõnu ja nende ladumistehnika rolle kuidagi (veidi vaevaliselt) deshifreerida.