OCR’ing and analysing comic books – a workflow report

spidermanI like experimenting with text analysis tools like Voyant. However, most tools for corpus linguistics don’t account for historical change – which I am, as a historian, mostly interested in. Historians working with tools like these have to think of ways themselves to add a time scale to their analyses. The most straightforward way to do so is by arranging a corpus in a chronological order. Highly interesting, for example, is to study linguistic changes in successive volumes of newspapers or periodicals, as I do in my academic research.

Really just as an experiment, I’ve also tried analyzing volumes of comic books. I happen to possess some digital comic book archives, they have a nice chronological order, and they are quite under-studied as historical sources for changes in (popular) culture. As turning digital comic books (in cbr format) into analyzable text files took more effort than I realized, what follows is the workflow I constructed. I don’t know whether it’s the optimal way of doing so, but as someone who is new to bash commands, OCR’ing, and the combination of both, I had a lot of fun figuring this out. No, it’s probably a long way from being optimal. More like quick-and-dirty, although it isn’t quick either (depending on the volume of your dataset). But it does requires hardly any action, so for all its downsides it really is a fun way of experimenting with the (historical) text analysis of some original data. Lees verder

Advertenties

Before your do digital history…

Histogram and word cloud 'Eugenetica'This blog post is the adapted conclusion from the paper ‘A Digital Humanities Approach to the History of Science.
Eugenics revisited in hidden debates by means of semantic text mining’ I wrote in collaboration with Fons Laan, Maarten de Rijke and Toine Pieters. The article was based on the research I did within the historical text mining project BILAND, as well as its predecessor WAHSP. The article is in press as part of the Proceedings of the 1st International Workshop on Histoinformatics
.

In a recent blog post called ‘The Deceptions of Data’, Andrew Prescott has criticized the jubilation of the ‘digital revolution’. He states that “One of the problems confronting data enthusiasts in the humanities is that we feel a need to convince our more old fashioned colleagues about what can be done. But our role as advocates of digitized data shouldn’t mean that we lose our critical sense as scholars. [. . . ] [T]here is a risk that we look more carefully at the technical components of the datasets than the historical context of the information that they represent.” Lees verder

Omzien in bewondering – Anne Kox neemt afscheid

Solvay Conferentie 1911‘Omzien in bewondering’ heette, met een variatie op de beroemde herinneringen van Annie Romein-Verschoor, de afscheidsrede die Anne Kox op 12 september uitsprak in de Aula van de Universiteit van Amsterdam. Met deze rede nam Kox afscheid als hoogleraar in de geschiedenis van de natuurkunde aan deze universiteit.

Kox’ bewondering uit de titel gold – zo was het punt dat hij maakte – de wetenschappers die er door de geschiedenis heen in slaagden buiten de bestaande paradigma’s te denken en de wetenschap voorwaarts te stuwen. Hiervan gaf hij in zijn college enkele voorbeelden, waarbij hij zich concentreerde op zijn specialisatiegebied, de revolutionaire ontwikkeling van de natuurkunde in de eerste helft van de twintigste eeuw. Kox is een groot kenner van veel van de hoofdrolspelers uit die periode en met name van Albert Einstein en de Nederlandse hoogleraar theoretische natuurkunde Hendrik Antoon Lorentz. Hij is de bezorger van Lorentz’ wetenschappelijke correspondentie (deel 1 verscheen in 2008 bij Springer in New York, deel 2 wordt binnenkort verwacht) en sinds 1985 redacteur bij het prestigieuze Einstein Paper Project van Caltech in Pasadena, dat bezig is het volledige archief van Einstein in dikke banden te ontsluiten. Dat duurt nog wel even en zijn Amerikaanse baan houdt Kox dan ook gewoon aan. Lees verder

Archief kleurt leven van Paul Ehrenfest verder in

De archiefdozen met de aanvulling op Ehrenfests nalatenschapMuseum Boerhaave in Leiden heeft een belangrijke aanvulling ontvangen op zijn archief van theoretisch fysicus Paul Ehrenfest (1880-1933). Vrijdag 31 mei organiseerde het museum een symposium over het belang ervan – en van dat van Ehrenfest zelf. Ter afsluiting overhandigde prof.dr. Diana K. Buchwald, directeur van het Einstein Papers Project aan het California Institute of Technology (Caltech) in Pasadena, de archiefdozen symbolisch aan Boerhaave-directeur Dirk van Delft.

Ehrenfests archief is van enorme waarde voor de wetenschapsgeschiedenis. De Oostenrijker Paul Ehrenfest, die vanaf 1912 tot zijn dood  de leerstoel voor theoretische fysica in Leiden bekleedde, was een van de aanjagers van de kwantumrevolutie in de natuurkunde. Hij correspondeerde met al zijn beroemde tijdgenoten, van zijn voorganger Hendrik Lorentz tot Max Planck en van Niels Bohr tot Albert Einstein. Daarmee vormt Ehrenfests archief een unieke ingang in de stormachtige ontwikkeling die de natuurkunde in de eerste helft van de twintigste eeuw doormaakte. Lees verder

Wat deed opa eigenlijk tijdens de oorlog?

© ZDF
Scene uit Unsere Mütter, Unsere Väter © ZDF

Duitsland discussieert weer over zijn nazi-verleden. En hoe. Aanleiding is deze keer de driedelige tv-serie ‘Unsere Mütter, unsere Väter’, die aan de hand van de levenswandel van vijf vrienden inzichtelijk probeert te maken hoe de oorlog en de jodenvernietiging realiteit konden worden. Vooral het persoonlijke perspectief lokt veel reacties uit. De titel suggereert er immers een bedoeling mee te hebben. Onze moeders, onze vaders: Hier wordt het verhaal van een generatie verteld, een generatie die jong de oorlog inging en er in het beste geval gehavend weer uitkwam.

Dit programmatische perspectief roept enerzijds bewondering op. Uitgever Frank Schirrmacher van de Frankfurter Allgemeine Zeitung riep voordat het eerste deel afgelopen zondag werd uitgezonden iedereen op met de hele familie voor de buis plaats te nemen: “grootouders, ouders, kinderen: ze moeten samen kijken.” Dit is de laatste kans, aldus Schirrmacher, om de verhalen aan te horen van degenen die de oorlog bewust hebben meegemaakt. Langzaam sterft die generatie uit en blijven wij met de vragen zitten: wat hebben ze gedaan – en waarom? Lees verder

De (de)constructie van HhhH

Duits grafembleem uit privémuseum Hooge Crater
Duits grafembleem uit privémuseum Hooge Crater

Operatie Anthropoid moest het boek eigenlijk heten. ‘[Ik heb] nooit aan een andere titel gedacht’, schrijft Laurent Binet in en over het boek waarmee hij in 2010 de belangrijkste Franse literatuurprijs won. Als er toch een andere titel op de kaft is verschenen, voegt hij toe, komt dat omdat de uitgever hem heeft overgehaald. Slimme uitgever. Hij had beter door wat de kern van Binets boek uitmaakt dan de auteur zelf.

Daarom titelt het boek nu HhhH, naar de van oorsprong Duitse uitdrukking ‘Himmlers hersens heten Heydrich’, die de verhoudingen moest aangeven tussen de baas van de SS en een van zijn belangrijkste ondergeschikten. Over Reinhard Heydrich gaat het boek. Of eigenlijk ook weer niet. Zo schrijft Binet:

Waar kun je uit afleiden dat een personage de hoofdpersoon is van een verhaal? Aan het aantal bladzijden dat aan hem is gewijd? Zo simpel ligt het hopelijk niet. Als ik praat over het boek dat ik aan het schrijven ben, zeg ik: ‘Mijn boek over Heydrich.’ Toch is het niet de bedoeling dat Heydrich de hoofdpersoon van dit verhaal is.

Een boek dat de gedachtegang van de auteur bij het schrijven ervan onderdeel van het verhaal maakt. Wat Binet doet is het geschiedverhaal deconstrueren. Je bent Fransman of je bent het niet. HhhH is geen verhaal over de moordaanslag van een groep Tsjechoslowaakse verzetsstrijders tegen de Reichsprotektor van Tsjechië, het is de neerslag van het wordingsproces van dat verhaal. Doordat Binet zijn keuzes verantwoordt, zijn twijfels hardop uitspreekt en doordat hij reflecteert op wat het inhoudt om een historisch verhaal te schrijven. Dit is geen roman, schrijft Binet, dit is de neergeschreven zoektocht – inclusief alle moeilijkheden die zich daarbij voordoen – naar de historische werkelijkheid:

Lees verder

Plaatsen van herinnering rond Ieper

Grafzerk voor onbekende Britse soldaat op Tyne Cot Cemetery. Foto: Pim Huijnen © all rights reservedIk was vergeten hoe indrukwekkend een bezoek aan de Vlaamse Westhoek kan zijn als je geïnteresseerd bent in de Eerste Wereldoorlog. Een jaar of tien geleden was ik er al eens, in het kader van een college van Koen Koch. Toen deden we de Westhoek in minder dan een dag, op weg naar de Somme en Verdun. Nu hadden we een weekend de tijd. Wat me opviel aan de begraafplaatsen, monumenten en andere plaatsen van herinnering was de levendigheid ervan. Er moet ongelooflijk veel tijd en energie worden gestoken in het in ere houden van al die plekken en het faciliteren van het herdenkingstoerisme. De massaliteit daarvan verbaasde me ook. Het westelijk front in Vlaanderen lijkt nog altijd een bedevaartsoord voor Canadezen, Engelsen en Fransozen (om niet te vergeten Amerikanen, Australiërs, Nieuw-Zeelandsers, Indiërs, etc.), maar ook voor Duitsers.

Voor zover ik kan nagaan is het dan ook een unieke plaats van herinnering: waar vind je nog meer een plek dat de sporen draagt van vier jaar lang onafgebroken gevechten. Dat in die sporen bovendien een staalkaart biedt voor het verloop van de Eerste Wereldoorlog als geheel? De Eerste Slag bij Ieper maakte deel uit van de Duitse opmars in het najaar van 1914. De Tweede Slag stond in het teken van de eerste gasaanvallen, terwijl de Derde Slag de wanhoop symboliseert van de stellingenoorlog. Ondanks, of misschien ook dankzij, de onbevattelijke cijfers die met de Eerste Wereldoorlog in dit gebied gepaard gaan, de miljoenen doden en gewonden, de miljoenen granaten die het gebied in een waanzinnige modderpoel veranderden, zijn de plaatsen van herinnering niet in eerste plaats pattriotistisch – toch een gebruikelijk doel voor monumenten en andere symbolen die aan het verleden referen. Ik heb de indruk dat de deemoed overheerst.

Lees verder