okt 272019
 

Via Twitter volg ik al een tijdje de ontwikkelingen rond het testen van een softwareprogramma, Transkribus, waarmee oude 17e eeuwse teksten ‘door de computer gelezen kunnen worden’ en vervolgens als transcriptie verwerkt worden.

Een ieder die voor zijn genealogisch of historisch onderzoek te maken heeft gekregen met oude handschriften, vooral van voor 1800, zal beamen dat dit lang niet altijd eenvoudig is. Zeker niet als de dienstdoende ambtenaar ook nog eens een priegelig handschrift had.

Nu worden er in hoog tempo wel vele documenten gedigitaliseerd, dat wil gezeggen: gescand of gefotografeerd, maar daarmee zijn ze nog niet direct doorzoekbaar. Daarvoor heb je eerst nog een transcriptie nodig. En dan kun je er soms na heel veel tijd achter komen dat hetgene wat je zocht niet in het dossier of document voorkomt 🙁

Wat al wel langer mogelijk is, is het zogenaamde OCR-scannen. Dan scan je een ‘getypte tekst’ die vervolgens ook als doorzoekbaar document wordt weergegeven. Dat levert weliswaar nog vaak fouten op (bijvoorbeeld in of m wordt niet onderscheiden) maar kan in ieder geval helpen een deel van de tekst doorzoekbaar te maken. Zelfs als bv maar 70% goed gescand is, dan is in een lange tekst de kans vrij groot dat je je gezochte woord of naam kan vinden.

Maar wat zou het toch mooi zijn als de computer kon helpen om een geschreven 17e eeuwse tekst te kunnen lezen en transcriberen! De ontwikkelingen op dit gebied gaan al razendsnel de laatste tijd. Bij het Stadsarchief Amsterdam en Nationaal Archief is een aantal medewerkers (oa Jirsi Reinders, Pauline vd Heuvel, Mark Ponte) hier al druk mee aan het experimenteren.

Bron: Stadsarchief Amsterdam

U kunt hier nu zelf ook mee aan de slag, thuis achter de computer. Daarvoor wordt deze week een zogenaamd webinar gegeven: een seminar via het web. Deze gratis online les laat u kennis maken met dit fenomeen. En als u zin heeft, kunt u het ook al met eigen documenten uitproberen!
Dinsdagochtend 29 oktober 2019 geeft de Koninklijke Bibioltheek dit webinar van een uur, van 10 tot 11 uur. Aanmelden gaat via deze website.

 Posted by at 13:33

 Leave a Reply

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.