Deze hilarische grafieken laten zien waarom correlatie en oorzaak niet hetzelfde zijn

Spurious Correlations is de virtuele verschijningsvorm van een vaak voorkomende misvatting: correlatie is niet zonder meer hetzelfde als een verband. Als je door datasets heen zoekt dan vindt je allerlei statistieken die je tegen elkaar af kunt zetten bijvoorbeeld de consumptie van margarine en het aantal scheidingen, de olie-import en het aantal doden door treinongelukken, de groei van bijenkoloniën en het aantal bruiloften.

Met deze tool kun je demonstreren dat twee volledig, willekeurige datasets toch een relatie aan kunnen tonen – ofwel puur toevallig ofwel door een externe factor. Ook als je graag over een opmerkelijk onderwerp wilt schrijven en je neemt het niet zo nauw met de feiten, dan is deze tool geschikt; de grafieken zijn namelijk nog steeds “technically accurate”.

Screen Shot 2014-05-12 at 14.29.24

Spurious Correlations maakt er geen geheim van dat de relaties volledig willekeurig worden gegenereerd. Zodra je aanklikt dat je een nieuwe correlatie wilt ontdekken, kun je uit een lijst van categorieën kiezen (bijvoorbeeld “interesting cause of death” of “sunlight by state“). Vervolgens krijg je een lange lijst te zien met andere datasets die hetzelfde verloop kennen. De grafiek die je als resultaat krijg kun je vervolgens markeren als “interesting” of “not interesting“.

Gegarandeerd succes behaal je in elk geval met een obscuur, matig interessant sociaal feitje dat je kunt onderbouwen met een grafiek. Mensen hebben een verlangen naar het herkennen van patronen dus zelfs als je weet dat een correlatie semi-willekeurig is gegenereerd dan proberen de meeste mensen alsnog het verband te rechtvaardigen. Helemaal ongelijk hebben ze niet want uiteindelijk zal één van de verbanden vast wel een écht verband aantonen.

Meer volkomen willekeurige grafieken ofwel “spurious correlations” vind je hier.