Wat je niet ziet, bestaat niet – deel II

Over historisch onderzoek en de digitale wereld

3.) internet vertekent

Er is een reeël gevaar dat de bronnen die dominant worden, de dingen zijn die digitaal beschikbaar zijn. Ik merk het aan mijn eigen gedrag. Het is heerlijk om in Delpher lukraak allerlei oude boekjes en documenten door te struinen, ik doe het vaak voor de lol. Het maakt ook dat ik bijvoorbeeld heel snel artikeltjes over eten en koken kan schrijven met wat historische achtergrond. Tegelijkertijd ben ik steeds minder vaak ter plaatse om naar de dingen te kijken die niet zijn ingescand, hoewel ik maar al te goed weet dat die in de meerderheid zijn.

Mijn studenten aan de kunstacademie wisten dit vaak niet. Het internet is zo groot en alomtegenwoordig, dat het ook alomvattend lijkt. Ik heb meerdere studenten gehad die écht niet konden geloven dat ze in de bieb andere (of meer) informatie zouden kunnen vinden dan van achter hun laptopje. Dat ging pas over toen ze in het magazijn van de Koninklijke Bibliotheek stonden, tussen de schier eindeloze rekken boeken.

Wat je niet ziet, bestaat niet. En dat geldt ook binnen het digitale domein. Oudheidkundige Jona Lendering haalt vaak het voorbeeld aan van de boeken die Google inscant. Vanwege auteursrecht is het goedkoper om oudere boeken in te scannen, waardoor allerlei archaïsche, achterhaalde theorieën uit Lenderings vakgebied weer tot leven gewekt worden. Ondertussen staan de nieuwste inzichten achter de betaalmuren van de grote wetenschappelijke uitgevers. Een bibliotheeklidmaatschap is alleen al daarom waardevol, leg ik mijn studenten uit, omdat je dan achter de voornoemde betaalmuren kunt kijken. Ja juf, knikken ze. Ze begrijpen het principe wel, maar ze voelen meestal niet hoe diep dit gaat. Vaak blijven ze toch hangen in Wikipedia, en de gratis PDFs die ze via Google kunnen opduikelen.

klik hier voor een gedetailleerd voorbeeld van digitale vertekening uit mijn vakgebied, de geschiedschrijving van de moord op de Joden

4.)  digitale precisie is bedrieglijk

Bronnen die gedigitaliseerd zijn, zijn niet waarder of waardevoller dan de bronnen die niet gedigitaliseerd zijn. Maar ze lijken dat wel te zijn. We voelen de menselijke feilbaarheid duidelijker wanneer we papier in onze handen houden, dan wanneer we naar een scherm turen. De letters op een scherm zien er exacter uit.

beeld:  een slogan uit de campagne Libraries Transform van de American Library Association

Een computer is een menselijk product. De digitale wereld zit daarom net zo vol omstandigheden, keuzes en aannames als de analoge. En dus ook vol beperkingen, fouten, vooroordelen, kortzichtigheid. Het zijn mensen die trefwoorden bedenken en de associaties tussen trefwoorden inprogrammeren; die de leesvaardigheid van het algoritme trainen door het te corrigeren. Het zijn mensen die bepalen wat er wordt ingescand en wat niet. Een vriend werkte bij een tijdschrift dat alle oude jaargangen ging digitaliseren. Zonder zijn wakkere optreden waren de zogenaamde staartstukjes niet aan de desbetreffende artikelen gehangen. Dat achteraf corrigeren, was een hels (en kostbaar) karwei geweest.

beeld:  de krochten van het internet

Achteraf rechtzetten is moeizaam: als het digitaliseringsproject af is, is het geld vaak op, of moeten er andere dringende zaken gebeuren. Voor mijn proefschrift werkte ik met een gedigitaliseerd archief van de Amerikaanse Library of Congress (waarvoor ik overigens wel naar Washington moest, want het grootste deel van het archief was niet openbaar). Het zat vol met mislukte scans. Pagina’s die eruit zagen als televisiesneeuw. Of dun papier waar de tekst aan de andere kant doorheen schemerde, zodat de scan nauwelijks leesbaar was. Ik heb die fouten doorgegeven waar ik ze tegenkwam, maar er gebeurde lange tijd niks mee. Het desbetreffende papieren archief was ondertussen zeer moeilijk toegankelijk geworden: alles is immers gedigitaliseerd. En hoe minder handen eraan zitten, hoe beter je het kunt conserveren.

beeld: uit de instructie Zorg voor bibliotheekmaterialen tijdens de digitalisering, voor medewerkers van de Koninklijke Bibliotheek

Recent heeft de Library of Congress een geheel nieuwe website gekregen. Daarbij zijn zo te zien de scans opnieuw geüpload, of in ieder geval gecontroleerd. Een en ander is nu veel beter leesbaar. Er staan inmiddels ook meer documenten op, dankzij vervallen rechten dan wel verkregen toestemming (en inmiddels kun je het deel van het digitale archief dat niet openbaar is, op drie plekken bekijken).

Tot zover het goede nieuws. Helaas is de structuur van het archief in de nieuwe layout dramatisch onoverzichtelijk geworden. Je moet weten waar de oude pagina met het overzicht staat, om er een beetje je weg in te kunnen vinden, heen en weer klikkend tussen het overzicht en de zoekpagina. En voor sommige dingen zou ik nog steeds het papieren archief willen bekijken om ze te ontcijferen, namelijk de doorschemerende en dubbelgetypte pagina’s. Want Arendt tikte haar antwoorden in klad (of liet ze tikken?) op de achterkant van de desbetreffende brief, soms over de tekst heen.

En dan is er nog de eigenzinnigheid van het systeem zelf, dat er zo exact uitziet, maar soms onlogische dingen lijkt te doen. Dat merk ik bijvoorbeeld in Delpher. Soms vind ik een document op het ene woord, dat ik om onverklaarbare redenen niet op het andere woord kon vinden – terwijl het systeem aantoonbaar beide woorden herkent in de tekst…?

Nog één keer het citaat van Gerhard de Kok, waar dit stuk mee begon: “Sommige historici zijn bang dat door deze [digitalisering] het traditionele archiefonderzoek zal verdwijnen. Dat blijft echter nodig, net als klassieke bronnenkritiek.” In een tijd waarin de digitale wereld zoveel belooft en zo hard aan ons trekt, is het cruciaal dat we onszelf (en onze studenten) naar fysieke boeken en documenten blijven leiden. Over bronnenkritiek heb ik ook nog wel wat te zeggen, maar dat is voor een andere keer.

Wie zich verder wil verdiepen in de razend interessante materie van geschiedschrijving in een tijd van digitale en gedigitaliseerde bronnen, kan terecht op de fantastische website Ranke.2 van de Universiteit van Luxemburg. Een verzameling gratis lessen (opdrachten, bronnen, artikelen) over het onderwerp, uiterst toegankelijk én inhoudelijk.

beeld: drukvoorbeeld voor poster, behorend bij eindexamenwerk van Radek Górniak
Radek mailt: “Scanning the prints has proved tricky so far — the colors don’t translate well at all through the scanner. I have tried to do digital ‘simulations’ of the prints, with an artificial halftone, but it didn’t look that great. Which I guess also fits into the disadvantages of digitisation ;)”