Archiveren van World Wide Web verdient meer aandacht

Een kwart van de webpagina’s die tussen 2013 en 2023 zijn geplaatst, is verdwenen. Een paar organisaties proberen de geschiedenis te redden, maar worden geconfronteerd met rechtszaken, meldt de BBC. Papyrus, mozaïeken en wastabletten hebben duizenden jaren overleefd, maar de geschiedschrijving van de 21e eeuw is een stuk lastiger omdat we tegenwoordig een digitaal leven leiden, en het archiveren daarvan geen prioriteit heeft. Het Pew Research Center, een denktank gevestigd in Washington DC, heeft recentelijk alarm geslagen. Zo’n 8 procent van de webpagina’s die ergens in 2023 werden gepubliceerd, was in oktober van datzelfde jaar al verdwenen. Dit probleem werd eind jaren negentig al onderkend, en toen stond het World Wide Web nog maar amper op de wankele benen. In 1996 werd het Internet Archive in het leven geroepen, een Amerikaanse non-profitorganisatie gevestigd in San Francisco onder leiding van internetpionier Brewster Kahl. Sindsdien zijn 866 miljard webpagina’s, 44 miljoen boeken, 10,6 miljoen video’s van films en televisieprogramma’s gearchiveerd. Het is een standaardpraktijk geworden om op Wikipedia om kopieën van websites uit de Wayback Machine van het Internet Archive te citeren, in plaats van de originele websites zelf, want die bestaan niet meer. ‘Nieuwsorganisaties worden opgeslokt door andere nieuwsorganisaties, of steeds vaker worden ze gesloten’, zegt Mark Graham, directeur van de Wayback Machine van het Internet Archive. Een recent voorbeeld is CNET, dat vorig jaar duizenden artikel heeft gewist. In Nederland besloot KPN het complete archief van de nieuwssite Planet Internet op te heffen. Er zijn wel verschillende initiatieven om oude websites te bewaren. De Amerikaanse Library of Congress bewaart overheidswebsites, sites van congresleden en een verzameling Amerikaanse nieuwssites. De Library of Congress bewaarde tot 2017 ook kopieën van elke tweet die sinds de oprichting van Twitter (nu bekend als X) is verzonden. Het UK Web Archive maakt minstens één keer per jaar een momentopname van het Britse internet. En dat is niet zonder risico. Het Internet Archive wordt steeds vaker geconfronteerd met financiële bedreigingen, technische uitdagingen, cyberaanvallen en juridische veldslagen omdat uitgevers niet willen dat vrij beschikbare kopieën van hun intellectuele eigendom op het internet circuleren. Vorige week kondigde de organisatie een omvangrijk partnerschap aan met Google, waarbij de techgigant links naar de Wayback Machine zal opnemen in zoekresultaten.
emerce
19-09-2024 08:15