Kunstmatige intelligentie kraakt mogelijk code in 600 jaar oud manuscript

Canadese wetenschappers hebben een grote stap genomen in het ontcijferen van een 600 jaar oud manuscript. De tekst werd ruim honderd jaar geleden ontdekt en zit vol met wat op gecodeerde taal en ondoorgrondelijke afbeeldingen lijkt. Jarenlang konden experts er niet achterkomen wat er precies in de tekst staat. Maar met de hulp van kunstmatige intelligentie zijn de Canadese onderzoekers dichterbij gekomen, meldt Gizmodo.

Het gaat om het Voynich-manuscript, vernoemd naar Wilfrid Voynich. Hij was een Poolse boekenverkoper die het manuscript in 1912 in handen kreeg. Het gehele document is geschreven in een onbekende code, waar een onbekende taal in zit. Het geheel bestaat uit honderden fragiele pagina’s, waarvan sommige vermist zijn. De tekst is met de hand geschreven.

Greg Kondrak, een expert in natural language processing bij de University of Alberta, vond dit een perfecte taak voor kunstmatige intelligentie. Hij ging samen met Bradley Hauer aan de gang met de tekst, en het lijkt er op dat de tekst is geschreven in het Hebreeuws. De letters zijn bovendien neergezet in een vast patroon.

Onderzoek

Allereerst moesten de wetenschappers uitzoeken welke taal er gebruikt werd. De kunstmatige intelligentie onderzocht daarvoor de tekst van de “Universal Declaration of Human Rights”, aangezien die in 380 verschillende talen geschreven is. Daarin werd gezocht naar patronen. Daarna werd het manuscript geanalyseerd en de conclusie was dat het waarschijnlijk om Hebreeuws gaat.

Daarna gingen de onderzoekers aan de slag met een hypothese van eerdere onderzoekers. Die hypothese stelt dat het script gemaakt was met alphagrams, waarbij woorden vervangen zijn door een anagram dat alfabetisch gerangschikt is. De onderzoekers stelden vervolgens een algoritme samen dat de anagrams kon omzetten naar echte woorden uit het Hebreeuws.

“Het bleek dat ruim 80 procent van de woorden in het Hebreeuwse woordenboek staan, maar we wisten niet of ze samen ook logisch waren”, aldus Kondrak.

De laatste stap was het ontcijferen van de eerste zin van het manuscript. Die zin werd vervolgens getoond aan Moshe Koppel, een computerwetenschapper van wie Hebreeuws de moedertaal is. Volgens Koppel was de zin echter niet logisch in het Hebreeuws.

“Maar nadat we een paar spelcorrecties hadden gemaakt, wist Google Translate het om te zetten naar gangbaar Engels. ‘Ze maakte aanbevelingen aan de priester, de man van het huis, en aan mij en de mensen'”, aldus de wetenschappers.

Betekenis nog niet duidelijk

De wetenschappers weten nog steeds niet wat de tekst precies betekent, maar hebben dus wel een begrip gekregen van hoe de code werkt en welke taal er achter moet zitten. De volgende stap is dan ook dat andere experts zich bij het onderzoek voegen, om de betekenis te achterhalen.

Volgens Kondrak wordt de volledige betekenis van de tekst pas duidelijk als historici die zich met eeuwenoud Hebreeuws bezig houden er naar hebben kunnen kijken.

Het algoritme zelf wordt overigens gebruikt om ook andere oude scripts te gaan ontcijferen.