Een groep onderzoekers uit Denemarken heeft de profielen van 70.000 gebruikers van de website OkCupid gescraped en vervolgens op internet gezet. Officieel zijn het openbare profielen, maar ethisch voelt het desondanks als een privacyschending. De onderzoekers overtreden officieel de regels van OkCupid en de actie gaat ook in tegen de gedragsregels voor universitaire onderzoekers, meldt Vox.com.
De onderzoekers gebruikten software om de informatie van de webpagina’s van OkCupid te scrapen. Datawetenschappers en -journalisten gebruiken dit soort tools vaker om datasets te genereren. De Denen hebben vervolgens de complete set van 70.000 profielen geuploaded naar Open Science Framework, een platform waarop wetenschappers data delen.
In de dataset ontbreken de volledig naam en toenaam van de gebruikers, maar hun gebruikersnaam, locatie en informatie over bijvoorbeeld politieke voorkeur of seksuele geaardheid zitten wel in de dataset. In veel gevallen zou de data herleidbaar kunnen zijn tot personen en ook al hebben gebruikers de informatie zelf ingevoerd op de site, het is nog steeds privacygevoelige informatie buiten de context van de datingsite.
If your OkC username is one you've used anywhere else, I now know your sexual preferences & kinks, your answers to thousands of questions.
— Scott B. Weingart (@scott_bot) May 11, 2016
De data is inmiddels al honderden keren gedownloaded en er zijn verschillende mensen bezig om de dataset te analyseren.
In principe kun je op allerlei semi-openbare plekken op internet op deze manier data van personen verzamelen en daar is technisch weinig tegen te doen. De enige waarmee dit te voorkomen is, is juridisch. Het is onduidelijk of OkCupid juridische stappen gaat ondernemen tegen de onderzoekers. De dataset zelf is inmiddels offline gehaald ‘for legal reasons’.