Dat Big Data zo langzamerhand een belangrijk agendapunt in de media branche begint te worden bleek afgelopen week wel weer. De Media Werkgroep organiseerde afgelopen dinsdag een themamiddag voor alle MWG leden waar het onderwerp ‘Big Data’ centraal stond. Zelf mocht ik acte de presence geven met onderstaande presentatie, een inleiding in ‘Big Data’.
In het inleidende verhaal werd onder meer stil gestaan bij de vraag wanneer er eigenlijk sprake is van big data, en waar deze op dit moment allemaal vandaan komt. Social media is natuurlijk een belangrijke veroorzaker: We delen waar we zijn, wat we doen, met wie, wat we luisteren, kijken en kopen tegenwoordig allemaal online, een spoor van data achter ons latend. Maar ook de digitalisering van enorme (historische) archieven zorgt voor een toename in de hoeveelheid data, om nog maar te zwijgen van alle hardware die er tegenwoordig voorhanden is om dingen over onszelf te meten: Van Fitbit tot iPhone.
Het is een misvatting om te denken dat we met big data alleen duiden op de enorme omvang die gegevens inmiddels innemen. We hebben het namelijk ook over de snelheid die nodig is om die data te kunnen verwerken en de vorm van data die vaak niet langer uniform of volledig is. Big data is dus groot in volume, snelheid en variëteit. En de afgelopen jaren namen alledrie in enorme hoeveelheid toe. 90% van alle data werd de afgelopen 2 jaar gecreëerd. Negentig procent in twee jaar!
Veel online diensten – zoals bijvoorbeeld Facebook, Google, Amazon en Twitter – werken daarom al jaren aan het big data vraagstuk, en zagen zich genoodzaakt nieuwe technologische oplossingen te zoeken om alle data zo realtime mogelijk te kunnen verwerken. Bijvoorbeeld door over te stappen van relationele databases (MySQL) naar non-relationale databases (NoSQL). Daardoor kunnen queries sneller verwerkt worden, maar zijn ze niet altijd accurater. In het huidige medialandschap telt echter maar één ding: Actualiteit boven accuratesse. What’s trending now?
Het verzamelen van data is dan ook niet onze grootste uitdaging de komende jaren: Het zal voor veel bedrijven namelijk veel belangrijker worden om die data op de juiste manier te gaan duiden, combineren en communiceren in toegepaste producten en diensten. Bijvoorbeeld door niet alleen naar de actuele file informatie te kijken bij het maken van een routeberekening op bijvoorbeeld je TomTom, maar ook naar historische data van automobilisten, het weerbericht, nieuws en sensoren in het wegdek. Hoe optimaal kunnen we de producten van de toekomst maken als we al die parameters zouden meenemen in onze berekeningen? Google Now is daar inmiddels al een heel eind mee.
Voor al deze vraagstukken zullen we de komende jaren veel nieuwe mensen nodig hebben: Data Scientists. Mijn verwachting is dan ook dat data science binnen no time een belangrijke – en hopelijk populaire – afstudeerrichting gaat worden aan veel hogescholen en universiteiten. In hoeverre kunnen combinaties van data leiden tot slimmere producten? Bij Google, Facebook en Amazon werken inmiddels al complete afdelingen van data wetenschappers aan deze opdracht, dus het zal waarschijnlijk niet lang meer duren voor bedrijven wereldwijd met big data aan de slag gaan.
Bekijk hieronder de presentatie van afgelopen dinsdag, of lees hier een compleet verslag van het MWG Big Data event.