OCR’ing and analysing comic books – a workflow report

spidermanI like experimenting with text analysis tools like Voyant. However, most tools for corpus linguistics don’t account for historical change – which I am, as a historian, mostly interested in. Historians working with tools like these have to think of ways themselves to add a time scale to their analyses. The most straightforward way to do so is by arranging a corpus in a chronological order. Highly interesting, for example, is to study linguistic changes in successive volumes of newspapers or periodicals, as I do in my academic research.

Really just as an experiment, I’ve also tried analyzing volumes of comic books. I happen to possess some digital comic book archives, they have a nice chronological order, and they are quite under-studied as historical sources for changes in (popular) culture. As turning digital comic books (in cbr format) into analyzable text files took more effort than I realized, what follows is the workflow I constructed. I don’t know whether it’s the optimal way of doing so, but as someone who is new to bash commands, OCR’ing, and the combination of both, I had a lot of fun figuring this out. No, it’s probably a long way from being optimal. More like quick-and-dirty, although it isn’t quick either (depending on the volume of your dataset). But it does requires hardly any action, so for all its downsides it really is a fun way of experimenting with the (historical) text analysis of some original data. Lees verder

Advertenties

Maus in Duitsland

© Museum Ludwig Köln / Art Spiegelman‘Eindelijk onderdeel van de hoge cultuur’ kopte de Tageszeitung naar aanleiding van de uitreiking van de Siegfried-Unseld-Preis aan Art Spiegelman, afgelopen zondag. De Amerikaanse cartoonist moest inderdaad lang vechten om erkenning, zeker na zijn poging de Holocaust in Maus in stripvorm te verbeelden. Tegenwoordig wordt hij bejubeld. Museum Ludwig in Keulen eert hem met een retrospectief.

Mag dat wel, een strip over de Holocaust? Met Duitsers als katten en de joden als muizen? Het gedoe rond de Duitse vertaling van het in 1986 in de Verenigde Staten verschenen Maus spreekt boekdelen. Duitsland had aanvankelijk grote moeite met het werk dat Spiegelman zo beroemd maakte. (In zijn in 2011 verschenen MetaMaus legt Spiegelman zijn keuze voor muizen uit; zie ook dit filmpje op Youtube.)

De Duitse vertaling verscheen uiteindelijk in 1989. Maar ook toen weer leidde de stripvorm en de vraag hoe serieus je die kon nemen tot “verwarring en verontwaardiging” in de feuilletons, zoals historica Christine Gundermann schrijft op het wetenschappelijke online geschiedenisforum HSK.

Lees verder