Google Ngram Viewer maakt een ranking van de meest gebruikte woorden in boeken

De Google Ngram viewer is een interessant Big Data project van Google Labs. De Ngram viewer indexeert namelijk alle voorkomende lettercombinaties – ‘Ngrams’ – in meer dan 5,2 miljoen boeken die Google inmiddels gedigitaliseerd heeft. Een schitterend big data project waardoor bijvoorbeeld heel veel trends van de afgelopen jaren inzichtelijk te maken zijn. Zo toont onderstaande visualisatie bijvoorbeeld het gebruik van de woorden newspaper, radio, magazine, television, cinema en online sinds 1900. Een grafiek waaruit duidelijk valt op te maken dat ‘online’ sinds zijn eerste vernoeming in 1979 steeds populairder werd en radio weliswaar het populairste medium-in-boeken was van de afgelopen decennia, maar de laatste jaren toch met een flinke terugloop te maken heeft.

In manier van reizen zien we een minstens net zo interessante ontwikkeling: Het paard en de trein worden steeds minder relevant, auto en vliegtuig winnen terrein:

Meest opmerkelijk is misschien nog wel de visualisatie rondom de veelvoorkomendheid van woorden die met natuurrampen te maken hebben. Zowel de woorden flooding, landslide, tsunami als climate change, zijn sinds 1800 in toenemende mate een belangrijk thema in onze literatuur geworden: