Verdeel en overheers. Dat was de strategie waarmee Microsofts AI een perfecte score kon behalen in het spel Ms Pac-Man — een prestatie die de mens nooit geleverd heeft.
Sommige taken zijn gewoon te complex en genuanceerd om in een keer op te lossen. Een van die taken bleek een perfecte score bij het spelMs Pac-Man, waarbij 256 levels overwonnen moeten worden op een Atari 2600. Daarom trainde Microsoft hun kunstmatige intelligentie ook niet om dat in één keer te tackelen. Ze deelden het spel op in kleine taken die door 150 AIs samen opgelost werden als team.
De kunstmatige intelligentie is gemaakt door Maluuba, een Canadees AI-bedrijf dat onlangs door Microsoft overgenomen is. Het systeem maakt bij de training gebruik van reinforcement learning. Dit is een techniek waarbij het algoritme een beloning ontvangt wanneer hij een efficiëntere mogelijkheid gebruikt, en het afgeraden wordt om dat niet te doen. Het idee hierbij is dat het systeem na genoeg pogingen uiteindelijk zelf ontdekt wat de beste route naar de overwinning is. Het is dezelfde techniek als Google’s AlphaGO gebruikt om de beste Go-spelers ter wereld te verslaan.
150 AI-agents
Microsoft gebruikte 150 ‘AI-agents’ die samenwerkten omMs Pac-Man aan te sturen. Iedere agent lette op een verschillend aspect. De reden hierachter is dat het makkelijker is dat iedere AI een kleine taak krijgt en die perfectioneert, dan dat één AI alles zelf moet leren. Uiteindelijk was er één agent die de baas was, en op basis van alles suggesties de eindbeslissingen nam.
De samenwerking zorgde voor 999.990 punten, een perfecte score binnen het spel. Nog niemand haalde die score en het is een viervoud van het hoogste puntentotaal ooit.
Spelletjes spelen is het doel niet
Het uiteindelijke doel van grote techbedrijven is niet om spelletjes te perfectioneren. Ze gebruiken die spellen om te demonstreren hoe ze hun kunstmatige intelligentie verbeteren. Computerspellen lenen zich hier goed voor, omdat ze de intelligentie vereisen die we als mens bezitten.