Numrush

‘Aannemers Microsoft luisteren naar opnames vertalingsdienst Skype’

Skype

Foto: Shutterstock.com

Het is inmiddels duidelijk: om ervoor te zorgen dat spraakoplossingen met kunstmatige intelligentie zo goed mogelijk werken en blijven werken, worden audio-opnames door mensen beluisterd. Maar als bedrijf moet je dat wel duidelijk aan je gebruikers vertellen, wat niet altijd gebeurd. Ook Microsoft blijkt dat nu niet goed gedaan te hebben.

De afgelopen weken hoorden we dat werknemers van Google, Apple en Amazon audio-opnames van spraakopdrachten beluisteren, om hun spraakassistent te verbeteren. En ja, soms zitten daar ook opnames bij die niet voor hen bedoeld waren. De spraakassistent denkt soms namelijk dat je het tegen haar hebt, ook al is dat niet zo.

Nu blijkt dat aannemers van Microsoft ook gesprekken horen. In dit geval gaat het om gesprekken die Skype-gebruikers hebben via de vertalingsdienst van de app, schrijft Motherboard op basis van een klokkenluider, interne documenten, screenshots en audio-opnames.

Audio door mensen beluisterd

Probleem is echter dat de website van Skype wel vermeldt dat het bedrijf mogelijk audio van telefoontjes die een gebruiker vertaald wil hebben analyseert, maar niet dat een deel van de analyse door mensen gedaan wordt. Die analyse is nodig om de diensten van het chatprogramma te verbeteren.

Een deel van de audio die Motherboard in handen heeft, komt specifiek van de Translator-functie in de Android-app van Skype. In een FAQ van die dienst staat dat zinnen en automatische transcipts “geanalyseerd” worden en dat “correcties in ons systeem worden doorgevoerd om betere diensten te maken”. Dat mensen naar de audio luisteren, staat er dus niet. En dat staat ook niet in het beleid van de dienst.

Je kunt je natuurlijk voorstellen wat voor audio daar allemaal bij zit, aangezien het hier niet om een spraakassistent gaat. Mensen zitten te bellen met vrienden, familie en geliefden. Dus het gaat hier om persoonlijke gesprekken, bijvoorbeeld over persoonlijke problemen als gewichtsverlies of relatieproblemen. De opnames duren veelal tussen de vijf en tien seconden.

Daarnaast luisteren de aannemers van Microsoft naar spraakcommando’s van Cortana, net zoals dat gebeurde bij Google, Apple en Amazon. Google en Apple hebben die programma’s inmiddels stilgelegd. De bedrijven willen duidelijker maken aan gebruikers hoe de programma’s in elkaar steken.

Reactie Microsoft

Een klokkenluider bij één van de aannemers van Microsoft stelt dat het niet al te best is gesteld met de bescherming van data. “Het feit dat ik een deel hiervan met jullie kan delen, toont hoe laks ze zijn als het gaat om het beschermen van gebruikersdata.” De klokkenluider deelde de cache van interne documenten met Motherboard.

Een woordvoerder van Microsoft bevestigt in een e-mail tegenover Motherboard dat het bedrijf spraakdata verzameld om diensten met spraak te verbeteren. Het gaat bijvoorbeeld om de zoekmachine, spraakopdrachten, dicteerdiensten en vertalingsdiensten.

“We doen ons best transparant te zijn over onze verzameling en het gebruik van spraakdata om er zeker van te zijn dat klanten geïnformeerde beslissingen kunnen maken over wanneer en hoe hun spraakdata gebruikt wordt. Microsoft krijgt de toestemming van klanten voordat het spraakdata verzamelt en gebruikt.”

Privacy

Daarnaast wordt de data geanonimiseerd en worden er geheimhoudingsverklaringen met bedrijven en hun werknemers opgesteld, aldus Microsoft. “Bedrijven moeten voldoen aan de hoogste privacystandaarden in de Europese wet.”

Volgens Microsoft is bovendien duidelijk in de FAQ van de Skype Translator en de documentatie van Cortana dat het bedrijf spraakdata gebruikt om hun diensten te verbeteren. Maar ze zeggen dus niet dat er een mens naar luistert.

De data is volgens het bedrijf alleen beschikbaar via een beveiligd online portal voor aannemers. Daarentegen vond Motherboard vacatures voor het werk, waarin staat dat het ook vanuit huis gedaan kan worden. De opnames kunnen dus ook bij iemand thuis beluisterd worden.

Foto: Shutterstock.com