In de woorden van Presser

Met de snelgroeiende aanwas aan gedigitaliseerde teksten die online te bekijken zijn (hier, bijvoorbeeld op Archive.org, op Project Gutenberg of, voor Nederlandstalig materiaal, op de rijke Digitale Bibliotheek voor de Nederlandse Letteren), neemt ook het aantal applicaties toe om die teksten te ontsluiten. Wie een tekst heeft gevonden als scans en er graag een tekstbestand van wil maken, kan terecht op een van de vele website die gratis OCR-tools ter beschikking stellen (zoals deze). Dat kan, tot op zekere hoogte, zelfs vrij eenvoudig voor Duitstalige teksten die in het Gotisch schrift (Fraktur) zijn geschreven (hier, bijvoorbeeld).

Andere online tools zijn gemaakt voor tekstanalyse. Een mooi voorbeeld is Voyant Tools. In aansluiting op dit artikel op deze website heb ik Ondergang. De vervolging en verdelging van het Nederlandse jodendom, 1940-1945 van Jacques Presser uit 1965 (immers integraal online beschikbaar en downloadbaar) door de tool gehaald. Of begrippen als ‘Holocaust’ en ‘Shoah’ in de vroege jaren zestig al in de wetenschappelijke literatuur al gangbaar waren, kun je natuurlijk eenvoudig checken via het register achterin het boek. Deze tool biedt een uitputtende woordenlijst met de frequentie van alle voorkomende woorden in de tekst. Ook daarin vind je genoemde woorden niet terug (volgens verwachting). Maar de lijst is vanzelfsprekend wel vollediger (en betrouwbaarder?) dan een register. Wie in dit boek op ‘bij’ zoekt, ziet in één oogopslag niet alleen dat dat woordje meer dan 1500 keer voortkomt, maar ook dat Presser 107 keer ‘bijzonder’ heeft gebruikt (plus 48 keer ‘bijzondere’), tien keer ‘rabbijn’ en 19 keer ‘opperrabbijn’, zeven keer ‘bijbel’, vier keer ‘verbijsterd’ en drie keer ‘verbijsterend’. Net zo eenvoudig kun je zien wáár de woorden in de lopende tekst voorkomen – en dus in welke context en betekenis ze worden aangewend.

Lees verder

Advertenties