Kaggle: Big Data als sport, met flink wat prijzengeld

Stel dat je als bedrijf een Big Data-vraagstuk op te lossen hebt, maar je komt er niet zelf uit. Of misschien is het juist wel verfrissend om anderen los te laten op je datasets, waardoor nieuwe inzichten krijgt die je zelf anders nooit had gevonden. Oftewel: ga je Big Data-vraag crowdsourcen!

Kaggle is een platform waarop je met je data terecht kan. Het leuke aan Kaggle is dat het een soort competitie is. Je stelt je vraag, en je daagt eventuele deelnemers uit met een oplossing te komen op grond van de data die je aanlevert. Degene die met de beste oplossing komt, krijgt flink wat prijzengeld mee in ruil voor het intellectuele eigendom op bijvoorbeeld het algoritme dat ze ontwikkeld hebben.

Het klinkt leuk en aardig, maar het is een serieuze zaak. Partijen als NASA, Deloitte, Facebook en Ford hebben al competities gestart op Kaggle.

Het prijzengeld is vaak ook niet misselijk. Er is gisteren een inschrijving gesloten voor een datacompetitie waar het winnende team maar liefst $ 3.000.000,- mag bijschrijven. De opdracht: bepaal op basis van historische patiëntgegevens welke individuen het komende jaar hoogstwaarschijnlijk opgenomen zullen worden in een ziekenhuis, en hoe lang hij daar zal verblijven.

Een andere competitie die nu openstaat is Follow the Money, en gaat over het geld dat gedoneerd wordt aan de presidentskandidaten in de V.S. Kun je op basis van slimme analyses of visualisaties bepaalde patronen herkennen in de geldstromen? Wie geeft geld aan welke kandidaat, en waarom? Dit is overigens ook een mooi voorbeeld van datajournalistiek.

Kortom: Kaggle wil een marktplaats zijn voor data scientists. Volgens eigen zeggen hebben ze een netwerk van meer dan 50.000 mensen die zich hebben ingeschreven om mee te doen aan die competities. Bedenk eens wat een creatieve rekenkracht daar achter moet zitten….