Brieven als buit · Het lemmatiseren van brieven uit de 17e en 18e eeuw

Lemmatiseren

Vanaf begin februari zijn Marijke Mooijaart en Nina Bouwmeester (beiden van het INL) bezig met het lemmatiseren van zo'n duizend brieven uit de 17e en 18e eeuw. (Lemmatiseren wil zeggen dat aan alle woorden en woordvormen een moderne standaardvorm wordt gehecht, zodat de teksten gemakkelijk doorzoekbaar worden.)

Project

Deze brieven maken deel uit van het project Brieven als buit van Marijke van der Wal (Universiteit Leiden) en zijn in de jaren  hiervoor door vrijwilligers getranscribeerd. Tijdens de Engelse oorlogen zijn deze brieven in beslag genomen en zij geven nu een unieke inkijk in het taalgebruik van de lagere klasse. Mensen uit het 'gewone' volk konden meestal niet schrijven en als ze het konden, deden ze het niet vaak. Hiervan getuigen de hanenpoten, de dialectvormen en de fonetische en onbeholpen spelling. Ook hebben we vaak te maken met niet eerder opgetekende woorden, zoals (de) aanlever, aanmerkingswaardig en aanrecommanderen.

Onderzoek

Met behulp van deze brieven kan er volop onderzoek worden gedaan naar het taalgebruik van de lage klasse. Daarnaast heeft dit project voor het INL als tweede belangrijke doel het testen van een nieuwe lexicontool, door onze computerlinguïsten ontworpen. Ook testen we zo op welke wijze nieuwe corpora aan de bestaande centrale database kunnen worden toegevoegd. Het project zal ongeveer een jaar in beslag nemen.

Duizenden brieven

Er liggen nog vele duizenden brieven te wachten om voor het eerst gelezen te worden. Onder leiding van Nicoline van der Sijs krijgt de transcriptie een vervolg onder de naam Gekaapte brieven en worden er met behulp van een grote groep vrijwilligers 10.000 digitale foto's getranscribeerd.