We hebben het allemaal wel eens gehoord of uitgesproken: soms gaat het niet om wát je zegt, maar hóé je het zegt. Leg dat maar eens uit aan Siri. Intonatie en empatisch vermogen zijn misschien wel de grootste bruggen die stemherkenningsoftware nog moet slaan en juist daaraan werkt een Britse startup het klokje rond.
In het hartje van de Silicon Roundabout, Londen’s technologische epicentrum, werkt het team van EI Technologies hard aan een algoritme wat nuances in stemmen kan herkennen met een accuratesse die nu al beter is dan het gemiddelde menselijke oor.
It’s better to be more accurate or at least as accurate as a trained human, rather than trying to expand your basic emotions initially. You’ve got to look at the value and think – there’ a value when a process can tell someone’s getting angry with it. Whereas where’s the value in knowing the difference between boredom and sadness or loneliness? It becomes a bit less obvious when you start to look at it.
EI Technologies algoritme analyseert de diverse toonhoogte in een uitspraak en kijkt dan naar opvallende afwijkingen in de toonsoorten, in plaats van naar de inhoud van de boodschap. Omdat het algoritme niet het subjectieve oor van een mens heeft, kan hij vaak ook beter inschatten welk sentiment de spreker wenst over te brengen. De uitkomst van het algoritme kan gebruikt worden om te combineren met de inhoud van de uitspraak om zo een empatische reactie te formuleren.
Om het algoritme echt goed te testen werkt het team van EI Technologies nu aan een app die vooral in de Quantified Self-hoek veel aftrek moet vinden: XPression. De app moet gebruikers helpen bij het analyseren van hun gemoedstoestand, maar heeft uiteraard als bijeffect dat het Britse bedrijf hun werk in de praktijk kunnen ervaren.
Het team van EI Technologies hoopt XPression aan het eind van dit jaar te lanceren.