Google ook aangedaan door griepvirus

Enkele jaren geleden creëerde Google een slimme formule om in kaart te brengen hoeveel mensen er op een bepaald moment griep hebben, en waar. De formule luidt ruwweg als volgt: locatie + griepgerelateerde zoekopdrachten op Google + een aantal superslimme algoritmes = het aantal mensen met de griep in een bepaald gebied. De resultaten zijn verbluffend goed en Google rapporteerde er een aantal jaren geleden al over in het wetenschappelijke tijdschrift Nature.

Ondertussen blijft Google het algoritme verder verfijnen. In onderstaande grafieken kun je zien hoe de correlatie tussen de Google gegevens en de feitelijke situatie verloopt.  Daaronder de huidige griepsituatie ‘according to Google’ en de officiële cijfers van het NIVEL, Het Nederlands Instituut voor onderzoek van de gezondheidszorg. Google loopt een aantal weken voor en laat zien dat de NIVEL-cijfers nu ongetwijfeld gaan zakken.

Die trends zijn mooi, maar in absolute cijfers bleek Google er – in elk geval in de VS – dit keer wat naast te zitten. Volgens een artikel in Nature waren de Google-resultaten dit jaar twee keer zo hoog als de werkelijke cijfers  van de Centers for Disease Control en Prevention. De verschillen zijn waarschijnlijk te wijten aan de grote (online) media- aandacht dit jaar voor het griepseizoen. De social media, die het nieuws van de griep sneller verspreiden dan het virus zelf, deden de rest.

Met andere woorden, het algoritme van Google keek alleen naar de cijfers, niet naar de context van de zoekresultaten. En, zoals de New York Times betoogt, het benadrukt nog maar eens dat cijfers interpreteren buiten context heel gevaarlijk kan zijn. Zeker bij Big Data. Maar Google zal zijn algoritme ongetwijfeld weer verder aanscherpen. Google Grieptrends blijft dus voor zowel dokters als patiënten een goede voorspellende waarde hebben.