Hackathon: klaagzang rondom de #NSS in beeld gebracht

Vandaag vond de eerste dag van de Nuclear Security Summit plaats en organiseerde de Utrecht Data School een Hackathon om in real-time social media data te monitoren en te interpreteren. Ongeveer dertig deelnemers in zes projectgroepen stortten zich vandaag op de data om zo sociale dynamieken en “issue-networks” in kaart te brengen.

De dag werd ingeleid met korte presentaties over data-analyse, de social media monitoring tool van Buzzcapture en datavisualisatie. Na een klein halfuur klonk het startschot en kon de Hackathon van start gaan met het analyseren van alle “buzz” rondom de NSS. Zo deed een projectgroep bijvoorbeeld onderzoek naar de geo-locaties van tweets, een ander een sentiment-analyse met behulp van Python en weer een ander een visualisatie van retweets.

Mijn projectgroep was voornamelijk geïnteresseerd in een typisch Nederlands fenomeen, namelijk: klagen. Voorafgaand aan de NSS werd er door Rijksoverheid en verkeersdiensten al gewaarschuwd voor overvolle wegen en lange files. Het advies was om thuis te werken of om met het openbaar vervoer te gaan. Onze verwachting was daarom dat veel klachten verband zouden houden met mobiliteits-problematiek.

Met behulp van de social media monitoring tool van Buzzcapture verzamelden wij rond het middaguur allereerst tachtigduizend nieuwsberichten gerelateerd aan de NSS. Deze data-set werd samengesteld op basis van media zoals Twitter, Facebook, NuJij.nl en Fok.nl. Vervolgens hebben we alle tweets geselecteerd en daarvan een selectie gemaakt op basis van een aantal trefwoorden die geassocieerd kunnen worden met klagen, zoals: vervelend, wachten, vertraging, geluidsoverlast, herrie, opgesloten, duur, overdreven en nuchter.

Dit leverde een data-set van tweeduizend tweets op die we vervolgens handmatig hebben geëvalueerd en gecategoriseerd. Uiteindelijk bleken maar 663 tweets ook daadwerkelijk klachten te zijn en konden wij de data visualiseren in onderstaande pie-chart.

Screen Shot 2014-03-24 at 17.51.24

663 Twitter-klachten tot 13:00 uur, gecategoriseerd per onderwerp

Bijna zestig procent van de klachten hield verband met de (hoge) kosten die gemoeid zijn met de nucleaire top. Bovendien vond bijna dertien procent dat de politie-inzet te sterk geconcentreerd was op Den Haag en dat daardoor de rest van het land aan zijn lot werd overgelaten. Elf procent van de mensen die klaagden vond bovendien de NSS overdreven en vindt “het hele circus” dat bij zo’n evenement komt kijken maar niets.

Tien procent van de klachten ging over verminderde mobiliteit en minder dan vijf procent klaagde over de rondcirkelende helikopters die hen van hun nachtrust en concentratie beroofden. De overige klachten gingen over de onderbelichting van andere nieuwsitems (zoals de betogingen in Spanje) en het heropleven van de Zwarte Pieten-discussie.

Opvallend is dus dat van de tienduizenden tweets maar een klein percentage uit klachten blijkt te bestaan. Een veel groter deel van de mensen is onder de indruk van de middelen die worden ingezet om de wereldleiders te beschermen en van Obama die het Rijksmuseum bezoekt. Ook bleef de verwachte topdrukte op de wegen uit waardoor de klachten over mobiliteit voornamelijk kwamen van mensen die hun huis niet uit konden of enige vertraging hadden met de trein.

Daarbij moet natuurlijk in acht genomen worden dat deze tweets alleen iets zeggen over het gedeelte van de bevolking dat Twitter heeft en dat vandaag besloot iets te schrijven over de NSS. Dat zou kunnen betekenen dat het daadwerkelijke percentage dat overlast heeft ervaren een stuk hoger ligt.

Thomas Boeschoten, mede-intiatiefnemer van de Hackathon, maakte vandaag een visualisatie van het retweet-netwerk rondom de NSS. Dat leverde onderstaande interactieve netwerkvisualisatie op waarin bijvoorbeeld duidelijk een cluster van activisten te herkennen is die elkaars berichten retweeten.

Screen Shot 2014-03-24 at 20.21.13

De overige projectgroepen zijn nog druk bezig met de analyse en visualisatie van hun data-sets en zullen morgen de projecten verder oppakken en uitwerken. De kruisbestuiving die ontstond door de samenwerking van mensen vanuit verschillende disciplines en met verschillende achtergronden was in elk geval interessant om te zien. Zo was de groep die onderzoek deed naar de geo-locaties meer bedreven in het doen van geautomatiseerd data-onderzoek en gebruikten zij bijvoorbeeld Python voor het doen van analyses terwijl een andere groep gebruik maakte van visualisatie-tool Gephi voor het maken van visualisaties.

Ook de politie was vandaag aanwezig op de Hackathon. Henk van der Linden, projectleider social media bij de landelijke politie, vertelt tegen Trouw dat dat niet zo tegenstrijdig is als het lijkt: “hackers zijn gewoon mensen die slimme dingen doen met computers en datasets. Maar dat wil niet zeggen dat ze ook illegale dingen doen. Wij zijn hier omdat we er wat van willen leren. Het is eigenlijk de erkenning dat er buiten de politie ook kennis zit.”

[Foto door Nienke Schipper]