Datawetenschappers maken overzicht van beste restaurants op basis van Twitter

Persoonlijk leun ik bij de jacht naar een goed restaurant op vreemde bodem vaak op de reviews van Foursquare en Yelp, maar de meningen kunnen daar nog wel eens te gekleurd zijn. Het filteren van updates via Facebook en Twitter zou zomaar kunnen leiden tot een onbedoelde en dus gemeende review, zo dachten onderzoekers aan de Universiteit van Rochester.

En zo ging het team van datawetenschappers aan de slag met het verzamelen van tweets over slechte maaltijden of bediening en hun gekoppelde GPS locatie. Al snel kwam het team op een overzicht van mogelijk matige restaurants in een bepaalde regio.

Maar het door de onderzoekers ontwikkelde nEmesis-systeem gaat eigenlijk nog een stap verder. Het bekijkt namelijk elke update van Twitter in zijn context en bepaald of de verzender te maken heeft met fysieke klachten na het eten op een bepaalde locatie. Op deze manier brengt het direct alle “gevaarlijke” restaurants in kaart.

In totaal ging het systeem langs liefst 3.8 miljoen tweets van meer dan 94.000 personen uit New York. Het zorgde er echter wel voor dat het algoritme in staat was om een voorspelling te doen die te matchen viel met de officiële data van de US Departement of Health and Mental Hygiene.

Wie meer wil lezen over het onderzoek en het onderliggende algoritme, check vooral deze PDF met uitgebreide uitleg over het nEmesis-systeem.