Een kijkje achter de schermen bij Nuance: 'In de toekomst heeft iedereen zijn eigen virtuele assistent'

Dirk Wolthuis

Nuance's spraakherkenningssoftware is bijna in iedere product terug te vinden en binnenkort ook in auto's te gebruiken.

Nuance is het bedrijf dat iedereen kent zonder het te kennen. De onderneming doet zoveel op het gebied van text-to-speech en stemherkenning dat de kans groot is dat hun technologie zit in het apparaat dat je nu gebruikt. In iPhones, Galaxy’s, BMW’s en zelfs in de automatische hulplijn van ING: de technologie die Nuance ontwikkelt, is werkelijk overal terug te vinden.

Nuance CommunicationsNuance CommunicationsOpgericht in 1992 als Visioneer en nu marktleider op het gebied van spraakherkenningssoftware. Je vindt het bedrijf terug in nagenoeg ieder slim apparaat. Recentelijk werd ik uitgenodigd om hun kantoor in Aachen te bezoeken. Daar werken ongeveer 200 medewerkers van de in totaal 13.500 werknemers die Nuance in dienst heeft. Na de eerste kennismaking met het bedrijf is er één ding duidelijk: diversiteit is niet een streven voor het bedrijf, maar een keiharde voorwaarde om te overleven in de wereld van dicteren en stemherkenning. Zo worden er 80 talen binnen het bedrijf gesproken en was zelfs hun kantoor in Aachen een samensmelting van culturen. Om de impact te laten zien van de technologie van Nuance is het gemakkelijk om een aantal statistieken aan te halen. Hun technologie is terug te vinden in 130 miljoen voertuigen en 800 miljoen handsets. Op hun servers voeren ze jaarlijks 16 miljard stemopdrachten uit: ze analyseren wat iemand zegt, proberen te achterhalen wat de intentie is en sturen vervolgens opdrachten naar de auto, computer of smartphone.

Tijdens mijn bezoek wilde het bedrijf laten zien hoe al die techniek tot stand komt en welke toekomstige ontwikkelingen impact gaan hebben op de mogelijkheden die we als consumenten hebben. De nadruk lag vooral op de steeds slimmer wordende auto’s: ondanks dat je het vaak niet ziet, zijn de meeste high-end voertuigen afgeladen met technologie van Nuance. Maar de directe aanleiding is dat Nuance begonnen is met het verkopen van hun eigen auto-interface, die niet geheel verassend voornamelijk op stemherkenning werkt.

Tijdens de CES 2016 liet Nuance voor het eerst deze interface zien. Dragon Drive functioneert als pro-actieve assistent en stelt gebruikers in staat om op een natuurlijke manier te communiceren met hun voertuig. Je kunt de Dragon Drive overigens niet zomaar kopen en inbouwen in jouw auto, het systeem is gericht op autofabrikanten die het vervolgens afnemen, aanpassen en integreren.

Interfaces moeten menselijker worden

De missie van Nuance is volgens Stefan Ortmanns (Senior VP of Mobile Engineering) heel simpel: “We willen interfaces menselijker maken.” En of ze nu technologieën ontwikkelen voor hun eigen producten of voor één van hun honderden partners: alles staat in dienst om het contact tussen machine en mens zo persoonlijk mogelijk te maken.

Om de innovaties van Nuance op waarde te kunnen schatten maken we klein sprongetje terug in de tijd. Het herkennen van stemmen is op de dag vandaag nog niet optimaal, maar het is een wereld van verschil met de jaren tachtig en negentig. Daar moesten stemherkenningssystemen wennen aan de stem van de gebruiker. Vandaag de dag kun je tegen Siri op iedere iPhone praten, soms zelfs met een accent als je een vreemde taal spreekt, en de software herkent toch wat je zegt.

Die vooruitgang is voornamelijk te danken aan nieuwe technieken die Nuance kan inzetten om de intentie van stemopdrachten te analyseren en herkennen. Waar je in de jaren negentig nog woord voor woord moest opzeggen op het moment dat het systeem daar om vroeg (Tijd? [Antwoord] Plaats? [Antwoord]), kun je nu in volzinnen praten. Dat is mogelijk door gebruik te maken van zogenaamde diepe neurale netwerken, computerprocessen die op basaal niveau hersenen imiteren.

Evolutie van spraaktech

Een deep neural network is niet hetzelfde als kunstmatige intelligentie: maar wel een stuk geavanceerder dan een regel met code. Bij diepe neurale netwerken zitten er tussen de input (de stemopdracht) en de output (wat moet er gebeuren?) verschillende verborgen lagen. Eén laag is gespecialiseerd in het herkennen van een bepaald element en zodoende worden complexe taken in één proces gegoten. Het zorgt er in ieder geval voor dat het algoritme zichzelf steeds kan verbeteren. Nuance updatet bijvoorbeeld elke avond hun cloud services zodat het algoritme weer iets slimmer is dan de dag daarvoor.

De ideale personal assistent

Maar de techniek achter de producten van Nuance is niet wat het bedrijf per se interessant maakt. Het is vooral hoe het bedrijf de toekomst van interactie tussen apparaten en mensen ziet, en niet geheel verrassend denken ze dat daar verbale communicatie een grote rol bij gaat spelen. Hoe Nuance dat voor zich ziet? “Wij snappen wat een personal assistent is en moet doen. Ze kennen de persoon waarvoor ze werken en communiceren onderling. Dat is het belangrijkste”, aldus Fatima Vital (Director Marketing).

Ze vervolgt haar verhaal: “Alle apparaten/persoonlijke assistenten moeten hun eigen specialiteit hebben, zoals een business PA, driver en butler, maar ze moeten wel op de achtergrond met elkaar communiceren.” En precies dat probeert Nuance te faciliteren met hun producten en diensten.

'Wij snappen wat een personal assistent is en moet doen.'

Een goede (virtuele) assistent moet over bepaalde vaardigheden beschikken. Zo is anticipatie erg belangrijk, maar moet de virtuele PA ook goed kunnen communiceren, problemen zelfstandig oplossen en zich aanpassen aan de situatie. Als ik deze eisen vergelijk met wat mijn personal assistent (Siri) op dit moment kan, dan is er nog een hoop te doen voor Nuance.

Jouw eigen persoonlijke chauffeur

Ondanks dat het beeld dat Vital beschreef nog als toekomstmuziek klinkt, maakt Nuance wel grote stappen op het gebied van een virtuele persoonlijke chauffeur. Tijdens mijn bezoek heb ik de mogelijkheid gekregen om te zien hoe Dragon Drive precies werkt. Het systeem functioneert als een soort van persoonlijke laag tussen jou en het internet. Het bijzondere aan het systeem is dat het eigenlijk twee standen kent. Het systeem is te gebruiken zonder toegang tot het het internet via je smartphone, maar is dan alsnog in staat om te navigeren en je op andere manieren te helpen. Maar als je besluit om je telefoon aan te sluiten kun je ineens een stuk meer met het systeem. Ook houdt de Dragon Drive op de achtergrond allerlei informatie over je bij zodat het betere suggesties kan doen. Tank jij altijd bij Shell? Dan krijg je voortaan eerst de Shell-tankstations te zien als je daarom vraagt.

Een andere opvallende functie is een zogenaamd ‘stemslot’. Nuance heeft namelijk ingebouwd dat je automatisch op basis van je stem herkent wordt, zodat de auto allerlei persoonlijke informatie kan inladen en de stoel goed kan zetten. Tijdens de demo werkte het systeem heel accuraat: door driemaal ‘OK, Dragon’ te zeggen heb je het systeem ingesteld. Volgens Nuance werkt het systeem zo goed dat het zelfs je stem kan herkennen als je bijvoorbeeld verkouden bent.

Risico’s en zelfrijdende auto’s

Toch zijn al deze ontwikkelingen niet zonder risico’s en roepen ze volgens Fatima weer nieuwe vragen op. Want wie is er verantwoordelijk in de auto als software steeds meer te zeggen krijgt? Nuance werkt met diverse automerken samen en is daardoor er betrokken bij de creatie van de zelfrijdende auto. Volgens het bedrijf blijft de verantwoordelijkheid over het voertuig ten alle tijden liggen bij de bestuurder, maar ze proberen bij Nuance er wel rekening mee te houden. Zo zijn ze momenteel bezig met een onderzoek om te kijken wat nu de veiligste momenten zijn om met een bestuurder te communiceren.

Niets gaat overigens automatisch bij Nuance. Om de virtuele persoonlijke assistent ooit werkelijkheid te maken zijn er overal ter wereld ontzettend veel mensen bij het bedrijf bezig met vertalingen en het inspreken van stemmen. Want hoe complexer de taken worden, hoe meer menselijke input er vaak nodig is. Ooit praat je via Nuance-technologie met een zelfdenkende computer die je bij van alles kan helpen. Maar voor nu gaat het bedrijf door waar het iedere dag mee bezig is.