Met meer dan 230 miljoen actieve gebruikers is Twitter een behoorlijk vergaarbak aan menselijke emoties geworden. En zo langzaam maar zeker beginnen steeds meer datawetenschappers de kracht van die data in te zien. Het maakt het delen van je toiletbezoek of je rondje hardlopen ineens weer hartstikke relevant.
Bij de Universiteit van Washington zijn ze in elk geval om. “Our attitude is that Twitter is the largest observational study of human behavior we’ve ever known, and we’re working very hard to take advantage of it“, laat Tyler McCormick van het Center for Statistics en de opleiding Sociale Wetenschappen weten.
Maar nog een stap verder: zou een algoritme op basis van je berichtjes op Twitter kunnen herkennen in welke stemming je bent en of je wellicht zelfs tegen een depressie aan hikt? Bij Microsoft Research zijn ze al langere tijd bezig met het onderzoeken van een methode om stemmingen te herkennen, zoals bijvoorbeeld het MoodScope-systeem dat zou kunnen draaien op smartphones.
De analyse van je bijdrages op Twitter spelen daar volgens directeur Eric Horvitz een belangrijke rol in, sterker nog – het team van Microsoft heeft al een eerste model gemaakt: “We wondered if we could actually build measures that might be able to detect if someone is severely depressed, just in publicly posted media. What are people telling the world in public spaces?” aldus Horvitz. “You might imagine tools that could make people aware of a swing in mood, even before they can feel it themselves.”
Horvitz en zijn team hebben de afgelopen maanden hard gewerkt aan een algoritme dat met een zekerheid van 70% zekerheid kan inschatten dat een bepaalde gebruiker van Twitter tegen een depressie aan zit. Het team is met die uitkomst overigens alles behalve tevreden, zo mist het algoritme bepaalde signalen waardoor die 30% die uiteindelijk ook met een depressie te maken krijgen, niet worden gesignaleerd. Daarnaast heeft het systeem nog een ‘false positive’ score van zo’n 10%.
Voor het eerste onderzoek analyseerde het Microsoft team zo’n 476 gebruikers van Twitter, waarbij het 171 mensen wist te identificeren die te maken hadden met een serieuze depressie. Om tot die diagnose te komen, dook het algoritme een jaar terug in de tijd en analyseerde het alle tweets sinds die tijd. In totaal werden er meer dan 2.2 miljoen tweets door het model geanalyseerd.
Het werk van Horvitz en zijn team zijn voor de projectleider slechts de eerste stappen, de komende periode willen zij echt meters gaan maken in het aanscherpen van de formules. Niet gek, want in de Verenigde Staten plegen jaarlijks liefst 30.000 mensen zelfmoord door een aanhoudende depressie. “If we can even save through interventions a few of those 30,000 people each year, it will make this research well worth it!”