Een van de beste manieren om meer te weten te komen over een historische periode, is door te praten met de mensen die het hebben meegemaakt. Spreken met mensen uit een ver verleden is erg eenzijdig, aangezien ze doorgaans dood zijn en al lang niet meer luisteren. Ze spreken echter boekdelen als je het geduld hebt om te luisteren, of beter gezegd, leest wat ze zeggen in brieven, dagboeken en primitieve notities.
Een internationale groep computerwetenschappers uit Italië, het Verenigd Koninkrijk en Pakistan hebben de handen ineengeslagen om de doden te doen herleven uit geschriften die door de tijd zijn aangetast. Ze ontwikkelden een computerondersteunde methode om documenten virtueel terug te brengen naar een meer leesbare staat. In hun project, “Restauratie en inhoudsanalyse van oude manuscripten via op kleurruimte gebaseerde segmentatie“, ontwikkelde het team hun methode en publiceerde de experimentele resultaten van de digitale restauratietechniek in het tijdschrift PLOS ONE.
We krijgen een idee van oude beschavingen uit hun geschriften, zowel triviale als diepgaande informatie. Bijvoorbeeld: het Sumerische spijkerschrift op kleitabletten onthult 4000 jaar oude handelstransacties, geometrische berekeningen en poëzie die de val van een grote stad beschrijft. Als ze op papier waren geschreven en niet in klei, zouden we vandaag die informatie waarschijnlijk niet hebben.
Het lezen van oude documenten, zelfs als ze in goede staat verkeren, kan van de lezer vereisen dat hij zich verdiept in de methodes van een cryptoloog die gecodeerde berichten ontcijfert. Niet zozeer omdat de schrijver opzettelijk geheimzinnig wilde zijn met zijn teksten, maar omdat combinaties van de geletterdheid van de schrijver, de leesbaarheid van zijn handschrift, de verouderde spelling- en grammatica conventies, maar ook zelfverzonnen ad-hoc afkortingen om ruimte te besparen. Dat kan zelfs een bericht in je moerstaal onbegrijpelijk doen lijken.
Neem datzelfde document en verminder de leesbaarheid ervan nog meer door de inkt te laten vervagen, of te laten uitlopen door blootstelling aan vocht, of door pigment van de ene pagina naar de andere over te brengen. Om dan de informatie weer bij elkaar te puzzelen kan een echt ontmoedigende en wellicht onmogelijke taak worden.
Een aspect, van het project waar we het hier over hebben, dat sterk verschilt van eerdere methoden, is het gebruik van kleur.
Een typische digitale reconstructie van een manuscript zet het document om in zwarte tekst op een witte achtergrond. Daarbij wordt dan gebruik gemaakt van ruisfiltering en contrastverbetering, maar weinig gedaan met de kleuren in het manuscript.
Bij de nieuwe kleurmethode is de afbeelding veel meer een restauratie-inspanning, waarbij veel van het uiterlijk en het virtuele gevoel en kleur van het originele document behouden blijven.
De onderzoekers pasten een complexe integratie toe van verschillende digitale kleurinterpretatie-technieken en Gaussiaanse mengmodellen om kenmerken van tekst, papier en artefacten te identificeren en te scheiden. Dit maakt de selectieve extractie van verschillende informatielagen mogelijk op basis van soms subtiele spectrale verschillen. De onderzoeker kan beslissen of een gekrabbelde aantekening, pagina-versiering, stempel, vlek of ander kenmerk al dan niet van cruciaal belang was voor het begrip van de tekst. Dit kan hij doen door lagen toe te voegen of juist te verwijderen.
In sommige gevallen kon de techniek kenmerken behouden die anders verloren zouden gaan. Bijvoorbeeld vage watermerken van een papierfabrikant; informatie die historici essentiële inzichten zou kunnen bieden. Dit speelde een rol bij de beroemde werken van Leonardo da Vinci. Die documenten zijn in opmerkelijke staat bewaard gebleven en maakten geen deel uit van de huidige studie. Door de watermerken van verschillende papierleveranciers, konden documenthistorici de manuscripten groeperen in waarschijnlijke clusters van schrijfperiodes.
Volgens het artikel in het tijdschrift kan de verwerking worden uitgevoerd op een standaard desktopcomputer (core i5, 4 GB RAM, Windows 10). Het algoritme heeft slechts een paar minuten nodig om een document virtueel weer leesbaarder te maken. Met dit niveau van gebruiksvriendelijkheid zou het een geweldig hulpmiddel maken voor zowel professionele onderzoekers van historische documenten als het huis- tuin en keukengebruik door mensen die oude familierecepten proberen te ontcijferen.