robotjournalistiek

De NOS gebruikte de verkiezingen als testcase voor robotjournalistiek

Elger van der Wel

De NOS testte afgelopen week of het mogelijk is om artikelen met de uitslagen van de Provinciale Statenverkiezingen automatisch te laten schrijven.

Vier jaar geleden hoorde ik op SXSW voor het eerst hoe het Amerikaanse persbureau AP en Yahoo News economische berichtgeving en sportartikelen automatisch lieten schrijven door Wordsmith van Automated Insights. Dat is een systeem dat automatisch nieuwsartikelen kan schrijven op basis van data, vandaar ook het gebruik van de technologie voor economische berichtgeving (kwartaal- en jaarcijfers) en sportuitslagen.

Elger van der WelElger van der WelElke twee weken schrijft Elger van der Wel een column over innovatie in de journalistiek en media. Deze week schrijft hij over het robotjournalistiek-project van het NOS Lab.Toen was dat revolutionair, maar inmiddels is het iets wat internationaal bij heel veel persbureaus en nieuwssites gebeurt. Vorig jaar leerde ik op SXSW bijvoorbeeld hoe de Zweedse uitgever MittMedia niet alleen sportartikelen automatisch laat schrijven, maar ook een automatisch gegenereerd artikel publiceert over ieder verkocht huis.

Robotjournalistiek wordt dit genoemd. Er komt alleen geen robot bij kijken. Er draait enkel een stuk software ergens op een server dat slim gebruik maakt van allerlei toepassingen van kunstmatige intelligentie om artikelen te genereren op basis van data. Hierdoor kun je relatief dom en saai redactioneel werk automatiseren en wordt berichtgeving mogelijk die tot nu economisch niet haalbaar is (het publiceren van een artikel over de uitslag van iedere amateurwedstrijd bijvoorbeeld).

Hoe meer tijd er verstreek, hoe meer ik er internationaal over hoorde en hoe stiller het in Nederland leek te zijn rondom dit onderwerp. Er schijnt in Tilburg onderzoek naar te worden gedaan in samenwerking met De Persgroep, maar tot op heden is daar nog niet echt iets over naar buiten gekomen. Ook het FD en RTL zijn er mee bezig, maar ook die treden nog niet echt naar buiten met resultaten of toepassingen in de praktijk.

NOS Lab

Het was de NOS die afgelopen week tijdens de Provinciale Statenverkiezingen een kleinschalige test deed. Of nou ja, kleinschalig… De tool was afgelopen vrijdag al een half miljoen keer gebruikt

Vanuit het NOS Lab heeft de nieuwsomroep een applicatie gebouwd die, zodra de verkiezingsuitslag in een gemeente bekend werd, een artikel schreef. De winnaar, diegene die de grootste winst boekte in vergelijking met vier jaar geleden, de grootste nieuwkomer en ook de opkomst werden meegenomen in deze artikelen.

De developers hebben een sjabloon gemaakt met 27 verschillende dynamische velden of logicaregels Als je een aantal artikelen bekijkt, krijg je vanzelf een inkijkje in hoe de techniek werkt. Elk artikel heeft namelijk dezelfde opbouw, maar afhankelijk van de uitslagen is de tekst zelf anders. Uiteindelijk is het dan ook niet zo complex als je misschien zou denken. “De developers hebben een sjabloon gemaakt met 27 verschillende dynamische velden of logicaregels”, vertelde Gonnie Spijkstra van het NOS Lab me. “Sommige dingen kun je heel eenvoudig invullen, zoals de naam van de gemeente en het percentage stemmen, andere dingen zijn al wat meer ‘als…, dan…’.”

Uiteindelijk was de grootste uitdaging dat je rekening moet houden met alle uitzonderingen. Het kan bijvoorbeeld zo zijn dat twee partijen een gelijk percentage van de stemmen halen. Als daar vooraf niet over na was gedacht door de makers, dan was het in Appingedam misgegaan. In Dalfsen waren er zelfs twee partijen met hetzelfde aantal stemmen, waardoor er moest worden toegevoegd dat de winnaar later bekend wordt gemaakt.

Journalistiek werk

Los van de cijfers waren er uiteindelijk 7200 verschillende varianten van de tekst mogelijk, varianten in lidwoorden en meervoud vs. enkelvoud niet meegerekend. In de basis zaten al die mogelijkheid in een template dat – in tegenstelling tot de software die de teksten uiteindelijk schreef – gemaakt werd door een journalisten van de NOS.

“Dat was in het begin best raar, want je bent een verhaal aan het maken over iets, terwijl je nog niet weet wat het verhaal is”, legt Spijkstra uit. Hierbij moest echt goed worden nagedacht over hoe een verkiezingsuitslag journalistiek gezien nu eigenlijk in elkaar zit. Wat is er interessant? En wat zijn er allemaal voor scenario’s mogelijk? “Het leek ons bijvoorbeeld leuk om per gemeente aan te geven welke partij het meeste was gestegen in vergelijking met 2015. Maar omdat er ook nieuwe partijen zouden meedoen, zou dat altijd een nieuwe partij zijn en daarmee mogelijk desinformatie. Dus hebben we die alinea gesplitst in een sterkste stijger onder de nieuwkomers en de sterkste stijger onder de partijen die vier jaar geleden al op de kieslijst stonden. Dat was trouwens nog een handmatig uitzoekklusje, want het kan ook zo zijn dat een partij vier jaar geleden wel op de kieslijst stond, maar 0 stemmen had gekregen. Dan lijkt die partij een nieuwkomer, maar is het dat niet.”

Tijd

Ik vroeg Spijkstra ook nog hoeveel tijd het nu eigenlijk kostte om dit project van de grond te krijgen. Dat bleek mee te vallen: een eerste versie was gemaakt tijdens een hackaton en daarna volgde een kort onderzoek. “Wat is robotjournalistiek eigenlijk? Er is gekeken naar automatisch gegenereerde video, besloten om met tekst verder te gaan, Engelstalige tools uitgeprobeerd en toen toch weer verder gebouwd aan de eigen tool. Na een demo dacht men: dit zou wel eens kunnen gaan werken.” Uiteindelijk koste het nog een paar weken om het systeem af te maken en daadwerkelijk aan het publiek te tonen afgelopen week.

We kregen de meeste reacties van mensen over dat ze bijvoorbeeld een daling van 18 naar 15 niet 'fors' vonden. Ondanks het feit dat er heel veel mensen gebruik van hebben gemaakt van de tool, viel het aantal reacties van het publiek mee. Ongeveer 40 mensen mailden de NOS met suggesties voor verbeteringen. “We kregen de meeste reacties van mensen over dat ze bijvoorbeeld een daling van 18 naar 15 niet ‘fors’ vonden. We moeten de volgende keer nog beter kijken naar de mogelijke duidingsvarianten. Mensen kunnen dit natuurlijk gewoon beter dan een robot”, vertelt Spijkstra. “Het enige dat we onszelf kwalijk nemen, is dat we niet vooraf bedacht hadden om bij de twee gemeentes Bergen de provincie erachter te zetten. Dat was verwarrend voor gebruikers.”

De grote vraag is natuurlijk hoe nu verder. Bij de NOS gaan ze het project evalueren, maar ze vonden het in ieder geval erg leuk dat ze nu een artikel voor iedere gemeente konden publiceren. Dat was anders niet haalbaar geweest. Sportuitslagen zouden een meer structurele toepassing van de technologie kunnen zijn, maar daar zijn nog geen concrete plannen voor.

Andere toepassingen

Ondertussen gaan de ontwikkelingen in het buitenland gewoon verder, waarbij de focus overigens niet zozeer ligt op het automatisch publiceren van artikelen. Bij persbureau AP is het doel om alle samenvattingen te laten genereren door een computer en ook shotlists bij beeldmateriaal te automatiseren. Beide functionaliteiten die vooral dienen ter ondersteuning van het journalistieke werk.

Bij The Washington Post hebben ze kunstmatige intelligentie gebruikt om een stylecheck te ontwikkelen. Net als een spellingschecker een tekst doorloopt op spelfouten, controleert dit systeem of het stijlboek (hoe worden getallen, plaatsnamen etc. geschreven) wel goed is toegepast.

In Nederland zullen dergelijke toepassingen nog wel even op zich laten wachten, maar met het robotjournalistiek-project van de NOS is er in ieder geval een belangrijke stap gezet in het gebruik van kunstmatige intelligentie op Nederlandse redacties.