Google DeepMind kan nieuwe taken leren op basis van eerdere ervaringen

Google’s DeepMind heeft zijn slimme zelflerende algoritnes weer een nieuw trucje geleerd: zo efficiënt mogelijk door het metrosysteem navigeren. Dat klinkt als iets wat al jaren mogelijk is door het gebruik van wat wiskundige formules, maar het bijzondere is dat de computer het helemaal zelf heeft aangeleerd en deze kennis opnieuw kan gebruiken in een geheel nieuw metrosysteem. Dit schrijf Wired.

De onderzoekers van DeepMind noemen de techniek een “differentiable neural computer” (DNC). Het systeem kreeg van het team een kaart van de London Underground (de metro) en vond al snel de meest efficiënte route. Maar omdat het algoritme informatie – en daarmee ook aangeleerde vaardigheden – kan bewaren in het geheugen, is het mogelijk om dezelfde techniek toe te passen op een vergelijkbare situatie, bijvoorbeeld de metro van Parijs.

Bijzonder aan dit alles dat je normaal gesproken eerst de kaart van de metro van Parijs in het systeem zou moeten zetten, maar dat is nu dus niet meer nodig. In principe leert het neurale netwerk dus van een eerdere ervaring om een herkenbaar probleem op te lossen, net zoals mensen dat doen. “Het is een belangrijk type geheugen dat we tot nu toe nog miste in neurale netwerken”, vertelt onderzoeker Alex Graves.

Bij normale neurale netwerken zou de ingevoerde informatie bovendien op een bepaald punt overschreven worden, waardoor het systeem de data vergeet. Maar in de DNC kan informatie voor onbepaalde tijd opgeslagen worden. De aangeleerde vaardigheden blijven daardoor dus ook beschikbaar. “Onze resultaten laten zien dat DNC’s de capaciteit hebben om complexe, gestructureerde taken op te lossen, die niet te doen zijn voor neurale netwerken zonder een extern geheugen”, schrijven de onderzoekers in hun rapport.

Google DeepMind maakt kunstmatige intelligentie weer wat menselijker: Het leert van ervaringen

Star Wars: New Jedi Order loopt opnieuw vertraging op door wisseling van schrijvers

Over Auteur Eveline Meijer