Het is niet makkelijk om inzicht te krijgen in New York’s data over verkeersongelukken. Het New York Police Department (NYPD) maakt de data namelijk alleen in PDF formaat beschikbaar omdat het publiek de data toch niet zou begrijpen. Dat maakt het voor analisten en onderzoekers heel lastig om de data te interpreteren.
Hackers zoals John Krauss doen hun best de data inzichtelijk te maken door het aan te bieden in andere formaten op NYPD Crash Data Band-Aid en als een interactieve map op NYC Crashmapper. Deze data heeft echter wat beperkingen, zo is niet helemaal duidelijk waar het ongeluk precies heeft plaatsgevonden, maar het is in elk geval bruikbaarder dan de PDF documenten.
Ben Wellington, assistent professor op het Patt Institute heeft de data van Krauss gebruikt voor een van zijn cursussen over stadsplanning. Hij gebruikte hiervoor open data van de stad New York zodat de studenten met echte data aan de slag kunnen. Voor de uitkomsten van de kwantitatieve analyses van de New York data heeft Wellington het blog I Quant NY opgericht.
Op een van de kaarten van zijn website is te zien dat in verschillende wijken zoals Williamsburg, Queens Boulevard en de Grand Concourse in de Bronx de meeste ongelukken gebeuren. Uit zijn data blijkt bovendien dat 23 procent van de verkeersongelukken die in 2013 plaatsvonden in vijf procent van de wijken zijn voorgevallen. Daarnaast heeft hij een kaart gemaakt met alle fietsongelukken die in 2013 aan de politie zijn gerapporteerd, wat leidde tot een visualisatie van 3800 ongelukken.
Wellington voegt daar wel aan toe dat de data wat onvolledigheden kan bevatten en dat er bij de interpretatie bovendien rekening gehouden moet worden met dichtheid en verkeerspatronen.
You have to be careful about looking at a map with colors. I do my best. If I make a conclusion, I try to make it clear that it’s a hypothesis.
Bovendien heeft meer dan zestig procent van de ongelukken plaatsgevonden in wijken met minder dan twee doden per jaar en kunnen drukke locaties met weinig doden ook inzichten bieden in hoe de straat veiliger te maken. Wellington wil hiermee laten zien dat data op meerdere manieren te interpreteren is en stelt daarom dat “people can use data to tell any story they want”.
Het is dus belangrijk om altijd kritisch naar een visualisatie te kijken en zoveel mogelijk de context er bij in acht te nemen. Echter, wanneer dit soort data openbaar is dan zal waarschijnlijk de meest aannemelijke conclusie naar boven drijven; de conclusie is immers door iedereen te controleren.