Wat je niet ziet, bestaat niet – deel I

Over historisch onderzoek en de digitale wereld

“Een handschrift ontcijferen. Dikke notarisboeken uit de zeventiende en achttiende eeuw of kilometers VOC-administratie doorploegen. Dat hoeft (straks) niet meer.” Zo begint een recent artikel in NRC Handelsblad, over de grootscheepse digitalisering van een aantal Nederlandse archieven (11 juni 2021). Het artikel eindigt met de woorden van Gerhard de Kok, één van de historici die bij digitalisering betrokken is: “Sommige historici zijn bang dat door deze ontwikkelingen het traditionele archiefonderzoek zal verdwijnen. Dat blijft echter nodig, net als klassieke bronnenkritiek.”

Tussen dit begin en einde wringt het. Het handwerk is gewoon nog nodig, zegt De Kok. Maar de verwachting die de auteur van het stuk (Theo Toebosch, tevens archeoloog) aan het begin uitspreekt, is dat het straks niet meer hoeft. Die verwachting baart me zorgen.

Ben ik een historicus die “bang” is voor deze “ontwikkelingen”? Integendeel. Mijn hart gaat sneller kloppen wanneer ik lees dat er weer meer digitaal ontsloten wordt. Dat er nieuwe verbanden gelegd kunnen worden. Dat er ongeziene stukken komen bovendrijven. Dat een computer meer of andere dingen ziet dan een mens. Echter. Ontwikkelingen die op het eerste oog geweldig lijken, kunnen onverwachte effecten hebben. Er is een verschil tussen de mogelijkheden die nieuwe technologie in zich draagt, en de manier waarop het uitpakt in de werkelijkheid. Dat onderscheid in de gaten houden, is niet altijd makkelijk. De verwachtingen kunnen zo hoog gespannen zijn, dat het lang kan duren voordat de realiteit tot ons doordringt.

Als onderzoeker heb ik de opkomst van de digitale wereld van dichtbij meegemaakt. Voor mijn proefschrift groef ik in een archief dat net volledig ingescand was, toen dat nog cutting edge was: ik heb van dat archief geen velletje papier in mijn handen gehad. Ik heb me als onderzoeker ontwikkeld terwijl digitale catalogussen zich ontwikkelden. Heb met vallen en opstaan geleerd hoe je het maximale uit verschillende zoeksystemen haalt (en kan daarom een stuk beter googelen dan mijn studenten). Ondertussen stierven de kaartenbakken uit.

Uit deze ervaringen komen de volgende observaties voort. Zaken waar je beducht op moet zijn bij een voortschrijdende digitalisering van bibliotheken en archieven.

1.) onderschat de fysieke ervaring niet

2.) win some, lose some

3.) internet vertekent

4.) digitale precisie is bedrieglijk

1.) onderschat de fysieke ervaring niet

“Ik zag allemaal dingen die ik niet op de scan kon zien!” Een student van me, op stage in Berlijn, was een exemplaar van de Kroniek van Neurenberg gaan bekijken (ik was tot voor kort scriptiebegeleider bij een kunstacademie). Als grafisch ontwerper vielen hem allerlei details op die hem duidelijk maakten hoe het werk gemaakt was. De drukletters bijvoorbeeld waren zichtbaar in het papier gedrukt, wat de pagina’s reliëf gaf. Andere letters lagen op de bladzijde; ze bleken onderdeel van houtsnedes die speciaal voor het boek gemaakt waren. Door die observatie ging hij ook andere verschillen tussen de letters zien.

Hoe waanzinnig gaaf het ook is dat we allerlei documenten op afstand kunnen bekijken, het fysieke object bevat altijd meer informatie. Een fysiek document lees ik ook anders dan een scan ervan; mijn ogen blijven aan andere woorden haken. De doorzoekbaarheid van een scan zorgt er dan weer voor dat je sneller overzicht hebt, sneller dingen aan of bij elkaar voegt.

Op een scherm bladerde mijn student razendsnel door honderden high-res afbeeldingen van de Kroniek. In de bibliotheek bleek het boek een reusachtig manuscript, de bladzijden van A3-formaat. Het boek had een geur, er zaten vlekken op de bladzijden, het had een houten kaft. Dit alles zorgde ervoor dat hij veel meer tijd nam om een bladzijde te bekijken. Tot dan toe bevond zijn onderzoek zich volledig in de digitale wereld, waar je zo snel en zo veel kunt verzamelen dat je er dol van wordt. De nabijheid van het boek gaf hem rust, richting, focus. Belangrijker nog: het omslaan van de bladzijden hadden een vuur in hem aangestoken. (“Heb je even de handschoenen uitgetrokken om de bladzijden te voelen,’”vroeg ik, volstrekt onverantwoord. “JA!” biechtte hij meteen op.)

beeld: stamboom van figuren uit het Oude Testament, detail uit de Kroniek van Neurenberg, exemplaar van de Universiteit Utrecht, p 26.

Het Kupferstichkabinett volgde, waar hij prenten van Dürer bekeek. En voor zijn afstudeerproject toog hij naar een oude tapijtfabriek in zijn geboortestad, waar hij voormalige werknemers interviewde over het productieproces, en mappen vol archiefmateriaal mee kreeg van de dolgelukkige fabrieksarchivaris. Het resulteerde in grafisch eindexamenwerk met een prachtige diepte en contextualisering (de foto bij dit artikel is er onderdeel van).

In mijn eigen opleiding tot historicus heb ik die fysieke ervaring gemist, zonder dat ik wist dat ik iets miste. Bij een excursie naar het Internationaal Instituut voor Sociale Geschiedenis mochten we het enig bewaard gebleven kladje van het Communistisch Manifest bekijken — achter glas. Onze docent archiefonderzoek deelde kopietjes van oude handschriften uit; we gingen ze niet zelf opsnorren. Pas na mijn studie dook ik de archieven in, en merkte ik hoeveel enthousiasme en inzichten het werken met Echte Historische Documenten kan genereren. (Na anderhalf jaar op afstand lesgeven vanwege corona, kan ik hetzelfde zeggen over mensen.)

Daarom neem ik studenten niet alleen mee naar bibliotheek of archief; ik zorg ervoor dat er boeken of documenten klaar liggen, die ze mogen aanraken. En liefst ook dat er een communicatief vaardige archivaris klaarstaat, om hun vragen te beantwoorden. Bij sommige studenten verlaagt dit de drempel om terug te komen en zelf te gaan snuffelen. Want een drempel is er. Ik kan me nog heel goed herinneren hoe klein en onwetend ik mij voelde, toen ik voor het eerst archieven bezocht. Ik had geen idee waar ik moest beginnen. En ik schaamde me om het te vragen: ik dacht dat ik het hoorde te weten.

2.) win some, lose some

Digitalisering betekent winst én verlies. Je wint een nieuwe context; je verliest een oude context. Je wint tijd; maar krijgt soms ook weer extra werk op je bord.

Zo kan een digitaal archief kan prachtige nieuwe inzichten opleveren. Als het op woord doorzoekbaar is, kun je razendsnel verschillende documenten naast elkaar leggen, verbanden vinden die anders weken en misschien wel jaren werk geweest waren. Tegelijkertijd ben je andere bijvangst kwijt: de dingen waar je niet gericht naar op zoek bent. In een archiefmap zitten verschillende documenten. Soms zit er een verdwaald document in je map, of krijg je van een gehaaste archivaris een verkeerde map in handen. Daar kan dan weer iets in zitten dat je een heel ander pad op stuurt.

Met de voortschrijdende digitalisering stallen sommige bibliotheken steeds minder uit, wisselen hun planken in voor meer werktafels voor de bezoekers. De kranten en tijdschriften staan op de computer; een boek is zó uit het magazijn gevist. Ook hier gaat bijvangst verloren. Wat heb ik veel geleerd over de historische context van een artikel, wanneer ik door de hele krant of het hele tijdschrift kon bladeren. Hoe vaak heb ik niet gezocht naar een boek, en een ander boek gevonden op dezelfde of een belendende plank, dat minstens zo relevant was voor mijn onderzoek – maar dat ik nooit op titel of trefwoord gevonden had. Ik kijk daarom altijd naar de tentoonstellinkjes en leestafels die bibliothecarissen en archivarissen maken, met hun kennis van de rijkdom die hun domein te bieden heeft.

Digitalisering bespaart tijd, maar levert vaak ook weer extra werk op. Digitale catalogi zijn geweldig, omdat je zoveel sneller zoveel meer kunt vinden dat relevant is voor je onderzoek. Maar met de jaren heb ik zoekmachines zowel beter als slechter zien worden: soms geven ze preciezere resultaten, soms juist meer ruis. Zo krijg je tegenwoordig in veel bibliotheek-catalogi, wanneer je zoekt op de volledige naam van een bekende auteur, eerst boeken en artikelen over die auteur, en daarna pas boeken en artikelen van die auteur. Dat is een keuze: het algoritme is ingesteld om andere zaken voorrang te geven bij het ordenen van de zoekresultaten.

De eerste digitale zoekmachines waren heel letterlijk: als ik iets intikte, kreeg ik als eerste resultaat datgene wat dat het letterlijkst benaderde. Nieuwere zoekmachines zijn een stuk bemoeizuchtiger en nemen ongevraagd allerlei beslissingen voor je. Daardoor moet ik vaak (veel) meer moeite doen om te vinden wat ik zoek.

Een voorbeeld. Stel, ik wil weten waar ik het boek Eichmann in Jerusalem van Hannah Arendt kan lenen. Als ik nu in de bibliotheekcatalogus van de Universiteit van Amsterdam zoek op arendt eichmann in jerusalem, krijg ik eerst mijn eigen proefschrift te zien (zoekresultaat 2 en 3, pagina 1). Arendts boek daarentegen bevindt zich diep in de resultatenlijst (zoekresultaat 45, pagina 5), vér onder allerlei werken over Arendt en haar boek. Daarbij heeft het systeem automatisch gezocht op ‘alles’ (dus zowel auteur als titel als omschrijving als trefwoord als…), en de resultaten automatisch gesorteerd op ‘relevantie’. Mysterieus genoeg belandt de Hebreeuwse vertaling van het boek hoger in de zoekresultaten dan de oorspronkelijke Amerikaanse uitgave; het Hebreeuws is kennelijk ‘relevanter’…?

beeld: zoekresultaten UvA-catalogus, Hebreeuwse vertaling op 42, Engelse uitgaven op 45

Ik kan een aantal criteria bedenken, die deze contra-intuïtieve invulling van ‘relevantie’ verklaren. Zo lijken recente en online publicaties voorrang te krijgen boven ouder werk, en werk dat je in de bibliotheek moet gaan bekijken. En dat mijn eigen publicatie hoog in de lijst staat, is natuurlijk omdat ik aan de UvA promoveerde: eigen alumni eerst. Andere zaken vind ik raadselachtig: waarom wordt het begin van de lijst gedomineerd door literatuurwetenschappelijke publicaties uit (niet per se belangrijke) digitale tijdschriften? En wanneer ik op ‘oudste eerst’ sorteer, is het eerste resultaat uit 2020, terwijl er veel oudere werken in de lijst staan…?

De Nederlandse centrale catalogus Picarta en het wereldwijde Worldcat doen het in ieder geval stuk beter: met dezelfde zoektermen en hetzelfde uitgangspunt (zoek in ‘alle woorden’), is Arendts boek respectievelijk zoekresultaat 1 en 7.

klik hier door naar deel II

beeld: drukvoorbeeld voor poster, behorend bij eindexamenwerk van Radek Górniak

Radek mailt: “Scanning the prints has proved tricky so far — the colors don’t translate well at all through the scanner. I have tried to do digital ‘simulations’ of the prints, with an artificial halftone, but it didn’t look that great. Which I guess also fits into the disadvantages of digitisation ;)”