UTwente ontwikkelt innovatief systeem waarmee computers beter begrijpend lezen


Computers worden met de dag slimmer en nemen steeds vaker menselijke taken over. Hiervoor is het belangrijk dat de computer ons goed kan begrijpen en zich zelf ook goed kan uiten. Een wetenschapper aan de Universiteit van Twente heeft hiervoor een nieuwe methode ontwikkeld waarmee computers beter in staat zijn begrijpend te lezen.

Dankzij de methode van Mena B. Habib zijn computers beter in staat de context te bepalen van zelfstandige naamwoorden. Dit gebeurt door het opsporen en interpreteren van zogenaamde ‘named entities’. Dat zijn bijvoorbeeld namen van personen, plaatsen en organisaties waarvan de betekenis afhankelijk is van de context.

Een voorbeeld van een named entity is bijvoorbeeld ‘het Rijksmuseum’ of ‘Paris Hilton’. Door het systeem kan de computer nu beter bepalen om welk rijksmuseum het precies gaat en of Paris Hilton duidt op een hotel in Parijs of op de bekende societyster. Dat wordt onder andere gedaan door te kijken naar de locatie van de schrijver. Woont hij bijvoorbeeld in Enschede, dan is de kans groter dat hij het Rijksmuseum Twenthe bedoeld, en niet het museum in Amsterdam.

Volgens de onderzoekers is er veel vraag naar dit soort systemen die computers beter begrijpend laten lezen. Op dit moment kunnen computers al redelijk veel informatie uit teksten halen, zoals de stemming en zelfs de leeftijd van de schrijver. Maurice van Keulen, begeleider van het onderzoek, vertelt echter:

Deze technieken zijn veelal gebaseerd op een oppervlakkige analyse van platte woorden. Daardoor blijft de meeste informatie ‘verborgen’ en maar beperkt toegankelijk voor computers, tenzij ze op grote schaal leren om begrijpend te lezen. Een computer kan met meer begrip van de genoemde entiteiten en beschikbare informatie daarover, veel meer en beter informatie uit tekst halen voor analysetoepassingen.

De nieuwe techniek zal door de wetenschappers bijvoorbeeld worden gebruikt in de politie- en brandweermeldkamer in de regio Twente. Zo kan met behulp van het slimme systeem Twitter makkelijker in de gaten worden gehouden tijdens grote evenementen. De techniek zou sneller door hebben wanneer er echt iets aan de hand is of wanneer het gaat om vals alarm.