De mythe van het internet als archief
Zolang het er niet meteen om gaat momentane gemoedstoestanden uit te wisselen of je hart op te halen aan geklets en geroddel – dingen die eigenlijk (als dat al gebeurde) een behoorlijk onderkomen vonden in oude media – wordt ‘het internet’ graag als een reusachtig, wereldwijd archief opgevat, waarin alle mogelijke interessante kennis op lange termijn opgeslagen is. Dat is een vergissing met fatale gevolgen. Nieuwe media treden doorgaans als flauw afkooksel van oude media voor het voetlicht. Precies omdat het internet oorspronkelijk geen applicatie was ontwikkeld om je dagboek bij te houden, in een encyclopedie te lezen, tv te kijken, cd’s te kopen, aan teleshopping te doen of waar het nog allemaal voor wordt gebruikt, beschouwt men het maar al te graag simpelweg als een archief.
De archieffunctie van het net is de gemeenschappelijke basis van een reeks misverstanden die typisch zijn voor het gebruik van internet tot dusver. Tegelijk zijn die misverstanden niet alleen een eigen leven gaan leiden, ze lijken ook een aanzienlijke invloed uit te oefenen op de fundamentele opvattingen over het bewaren van documenten die geen onmiddellijk nut meer hebben – om nog te zwijgen over de razendsnel afnemende mogelijkheden om ze in nieuwe omgevingen weer te raadplegen.
Op het eerste gezicht lijkt het alsof het nauwelijks beter had gekund: de massale digitalisering van archieven had slechts één bedoeling, namelijk de algemene en in principe openbare toegang tot de kennis van de mensheid, waar dan ook verzameld, om te vormen tot een kwestie van muisklikken, gekoppeld aan het intikken van een paar zoektermen, en dat tot en met complexe semantische verbindingen.
De droom van een onbeperkte en onmiddellijke beschikbaarheid, onafhankelijk van de plaats waar je je bevindt, verenigt verschillend gemotiveerde projecten als de digitale wereldbibliotheek van Google, fotoarchieven als Corbis of Getty Images, globaal opererende foto- en videoplatformen als ‘YouTube’, ‘Flickr’ of de niet-commerciële online-encyclopedie Wikipedia. Hun manier van zaken doen en hun bedrijfsprincipes zijn intussen ook voor een groot deel als voorbeeld gaan fungeren voor lokale verzamelingen of voor zowel institutionele als niet-institutionele praktijken van zelfarchivering.
In dit verband worden enkele fundamentele aspecten van de digitalisering onder de mat geveegd of ten minste genegeerd. Zelfs al spelen ze in commerciële contexten geen enkele of slechts een ondergeschikte rol, ze plaatsen ernstig onderzoek of wetenschappelijk werk voor ongekende uitdagingen.
1. Anders dan algemeen wordt aangenomen, zijn digitale databanken althans voor buitenstaanders verbazingwekkend vluchtig. De levensduur van afzonderlijke pagina’s op het world wide web bedraagt gemiddeld nauwelijks meer dan honderd dagen. Daarna is de inhoud ofwel verdwenen, ofwel ontoegankelijk of naar elders verhuisd.
Projecten zoals het internetarchief ARCHIVE.ORG proberen dat verschijnsel de baas te worden door zogezegd het archief te archiveren. Net als een lokale back-up kan dat voor documenten die hoofdzakelijk uit tekst bestaan nog een tussenoplossing vormen. Zodra het beelden of zelfs films betreft, bots je echter niet alleen op kwantitatieve, maar vooral ook op kwalitatieve grenzen.
Zo zijn de standaarden voor het coderen en decoderen van bewegende en niet-bewegende beelden voortdurend aan wijzigingen onderhevig, die soms abrupt kunnen zijn. Die wijzigingen worden hoofdzakelijk door marktbelangen gestuurd, zijn slechts zelden compatibel met vroegere versies en nopen daarom tot tijd- en geldrovende transcoderingen met steeds kortere tussenpozen. Het feit dat ze meestal met eigendomsrechten verbonden zijn, legt het beschikkingsrecht over de verzamelde objecten uiteindelijk in de handen van consortia of patenthouders.
Het paradigma van het onmiddellijke, niet-exclusieve gebruik dat de digitale netwerken kenmerkt, gaat gepaard met een verschuiving van de bezitsverhoudingen. Zij worden voortaan helemaal anders geformuleerd: het eigenlijke object boet zienderogen aan waarde in, terwijl toegangs- en gebruiksvoorwaarden nieuwe vormen van imaginair bezit in het leven roepen; die laatste genereren overduidelijk waarde, maar die wordt in andere sferen gerealiseerd.
2. Een bijkomend fundamenteel probleem is gekoppeld aan een tendens die kenmerkend is voor de digitale wereld, namelijk om redundantie te elimineren. Bij het comprimeren van formats die zeer rijk aan data zijn, worden stukken informatie die tot op zekere hoogte als voorspelbaar worden beschouwd, opgevat als een teken van herhaling en met het oog op meer gebruiksvriendelijkheid uitgeschakeld. Zulke vormen van redundantie zijn misschien niet echt zichtbaar of slechts moeilijk waarneembaar, en daarom zijn ze vanuit het oogpunt van de consument rustig te verwaarlozen. Als bescherming tegen het gedeeltelijke verlies van gegevens of om de authenticiteit in te schatten, waren ze in het analoge echter onontbeerlijk voor de conservering en restauratie op langere termijn.
Het onderscheid dat bij digitale compressie wordt gemaakt tussen nuttige en nutteloze informatie, de verbanning van al wat niet meteen bruikbaar is naar een gebied onder de ruisgrens, vormt een breuk met de traditionele ethiek van het archief, dat zulk onderscheid niet mag maken. De voorafgaande beoordeling van het nut, zeker als dat in real time en zonder enige vorm van onderhandeling of inspraak gebeurt, ontneemt het archief een van zijn belangrijkste functies. Het archief degenereert tot een publicatie-instrument dat nog slechts dient om de resten te verwerken van informatie die zo weinig mogelijk verouderd is.
3. Wat vandaag op het net toegankelijk wordt gemaakt, is slechts een fragment van wat lokaal ingerichte archieven bezitten. Dit gedeelte kan met behulp van relationele databanken, navenant geprogrammeerde interfaces en grafische gebruikersinterfaces ook op afgelegen locaties worden geraadpleegd. De voorwaarde is dat de relaties tussen de respectievelijke objecten kunnen worden geanticipeerd, dat combinaties kunnen worden voorspeld en verrassingen kunnen worden uitgesloten. Wat niet vooruitlopend geprogrammeerd is, bestaat niet. Erger nog: het zal waarschijnlijk ook nooit bestaan.
Het resultaat en bijgevolg ook de potentiële zin van elk onderzoek is niet alleen op voorhand vastgelegd, het heeft ook geen betrekking meer op het voorwerp van het onderzoek, maar bestaat vooral in verhouding tot de al geëxtrapoleerde belangstelling van anderen: mensen die voor dezelfde of tenminste soortgelijke informatie eveneens interesse hebben getoond en al vergelijkbare of zelfs identieke aanvragen hebben ingediend.
Onderzoek op het web verloopt noodzakelijkerwijs over platgetreden paden. Elke afwijking van de norm wordt uit het systeem geëlimineerd. Het vermeende toeval, dat een traditioneel onderzoek pas waardevol maakte, kwijnt jammerlijk weg zodra de lange en moeizame overgang van zoeken naar vinden, zoals die buiten netwerken om plaatsvindt, dankzij zogenaamde zoekmachines tot fracties van een seconde is herleid.
Zelfs al ziet het er in het licht van de retoriek die de aanbieders ontplooien niet zo naar uit: bij opzoekingen in netwerken valt wat er ooit de eigenlijke zin van vormde uit de boot – de ontdekking van iets nieuws, of preciezer gezegd: het onberekenbare, onvoorziene, onverwachte.
Maar de prijs die men betaalt voor real time opzoekwerk in verafgelegen digitale archieven, overtreft nog de bezwaren die het vluchtige karakter van de gegevens, het elimineren van redundantie en het principe van vooraf bepaalde relaties zouden moeten oproepen. Het documentaire karakter van de afzonderlijke objecten moet min of meer noodgedwongen worden opgeofferd aan het primaat van de toegankelijkheid.
Het gaat daarbij niet in de eerste plaats om het tactiele, dat de analoge status van het object kenmerkt, hoewel dat het onderzoekende subject – zelfs wanneer het voorwerp louter technisch gereproduceerd werd – uiteindelijk zekerheid belooft omtrent hun beider bestaan. De digitale modus van het archief gaat vast gepaard met het vaak aangehaalde verlies van een auratische zekerheid, die in de virtuele omgeving niet langer kan worden gewaarborgd. De gebruiker kan de afzonderlijke stukken uit een collectie immers niet zelf inkijken, vastnemen en in hun directe toestand waarnemen.
Het subjectkarakter, dat om nog veel andere redenen problematisch is, komt op de helling te staan, maar nog belangrijker dan dat is het feit dat het even ingewikkelde als unieke weefsel van relaties tussen de onderzoeker en het onderzoeksobject vervluchtigt. Het verdwijnt naar het niveau van digitale metagegevens: gegevens over gegevens, met als doel ‘door machines leverbare informatie over elektronische bronnen of andere zaken’ te bevatten, zoals Tim Berner Lee, van beroep uitvinder van het world wide web en directeur van het World Wide Web Consortium (W3C), het formuleert.
Eeuwenlang hebben metagegevens een miezerig bestaan geleid. Als een soort geheime code van archivarissen en bibliothecarissen hadden zulke regels meestal slechts op een specifiek bestand betrekking en als ze al betekenis hadden, was die strikt beperkt, ronduit lokaal. In een tijdperk van globale netwerken en gekoppeld aan steeds ingewikkelder elektronische informatiesystemen, krijgt de interoperabiliteit van metagegevens om bronnen efficiënt te beschrijven, plots een enorme praktische betekenis, die over de afzonderlijke archieven heengaat.
Bepaalde eigenschappen of veranderingen in de toestand die het gevolg zijn van gebruik, zijn niet meer als sporen op het object af te lezen. Dat verlies zou best te dragen zijn, vermits het overduidelijk de basis vormt voor talrijke voordelen van de digitale opslagwijze. Ze zijn tegenwoordig niet meer weg te denken uit ons dagelijkse leven: onmiddellijke beschikbaarheid en vermeend kosteloze reproductie, zonder verlies.
Maar tegelijk worden de rechtstreekse en onrechtstreekse gevolgen van het gebruik op een metaniveau bepaald, dat zich onttrekt aan elke vorm van toezicht, en al zeker aan elke vorm van kritiek. Het wordt als het ware een handelsgeheim. Het documentaire karakter dat moest worden gedestilleerd uit de retrospectieve herovering, de omschrijving of de reconstructie van het nut, het gebruik en de gebruiksgeschiedenis, is geabstraheerd van het voorwerp zelf en wordt voortaan alleen nog op metaniveau zichtbaar.
Door het digitale object in het netarchief op te slaan, houdt het documentaire in de digitale wereld op te bestaan. De zin van het zoeken, het primaire effect van het documentaire, lijkt verloren te zijn gegaan. Maar slechts voor zolang tot die weer opduikt op het niveau van de werkelijkheid van de metagegevens, die voor, tijdens en na het gebruik wordt gefabriceerd. De zin van het zoeken duikt daar op als zijn eigen vertekend beeld en gaat een merkwaardig, maar beslist winstgevend eigen leven leiden.
De betekenis van een document resulteert niet uit de concrete vorm die het aanneemt door ruil of aanpassing aan de markt, en evenmin uit het vroegere tegendeel, de mummificatie van wat het ooit aan gebruikswaarde had in het archief. In het tijdperk van digitale netwerken wordt de zin afgeleid uit het bepalen van de relationele waarde, en dat vindt ad hoc plaats, en passant.
Die relationele waarde doet de tegenstelling van uitwisseling en gebruik formeel teniet en regelt exclusief de mogelijkheid om het eigenlijke object terug te vinden. Relationele waarde ontstaat door de kortsluiting van metagegevens en gebruikersgegevens. Die worden door steeds verder vertakkende netwerken in ongeziene hoeveelheden verzameld en in real time met elkaar vergeleken. Op basis daarvan wordt het object pas toegankelijk gemaakt. Door hun directe koppeling worden de gegevens onafscheidelijke bestanddelen van een gesloten systeem, dat als doel heeft aan een stuk door zichzelf te beschrijven.
Onvermijdelijk wordt aan elke zoekopdracht een incestueus vlechtwerk onttrokken van door de gebruikers gegenereerde gebeurtenissen, tijdelijke omstandigheden en bijbehorende afhankelijkheden. Zij hadden al plaats, zullen plaatshebben of zouden zelfs maar kunnen plaatshebben. Met het eigenlijke onderzoeksobject zijn ze nog slechts losjes of van verre verbonden, zo ze dat al zijn.
Elke zoektocht naar een trefwoord wordt pas na verfraaiing van de lijst met treffers op basis van de ervaringen met vroegere aanvragen (in sterke mate of gewoon voor het eerst) bruikbaar gemaakt. Geen literatuuronderzoek of het vestigt de aandacht op producten waarmee andere mensen met vergelijkbare interesses bezig hadden kunnen zijn. Geen beeld of het is al door talloze andere gebruikers – vrijwillig of onvrijwillig – van trefwoorden voorzien, uit een context gehaald of opnieuw in een context geplaatst. Geen beeld of het patroon ervan is eveneens herkenbaar in een bijna eindeloze reeks andere beelden.
In zijn huidige fase werkt het net als een gigantisch bureaucratisch systeem dat het documentaire, en nog veel sterker, iedere vorm van zeldzaamheid van hun waarde berooft. Elk verzet ertegen lijkt zinloos of hooguit een vorm van nostalgie. Zelfstandig denken, autonoom onderzoek moet er zich in een reflex aan onttrekken om elders te kunnen overleven.
Een beslissende factor zou daarbij een radicale herdenking kunnen zijn van de waarde die het documentaire heeft. In het licht van omgevingen die elke uiting van verstand of onverstand, op het moment dat ze bekend gemaakt wordt, al tot voorwerp van redundante verzamel-, opslag- en archiveringsprocessen maken – op voorhand werkelijkheid fabriceren valt samen met de documentatie ervan in real time – moet een nieuwe definitie van het documentaire volstrekt nieuwe strategieën bedenken om het onzichtbare zichtbaar te maken.
Vertaling uit het Duits: Erik De Smedt