Nederlands SciSports verandert de voetbalwereld met data

Wim Kopinga

De invloed van data op ons leven wordt steeds groter en is nu ook merkbaar in de voetbalwereld.

De Nederlandse startup SciSports probeert de voetbalwereld te veranderen. Door een enorme database met de gegevens van 350.000 voetballers moet de komende transferperiode op zijn kop gezet worden. Als de film Moneyball in het voetbal.

Met een nieuwe transfertermijn die nadert heeft Giels Brouwer het extreem druk met zijn bedrijf SciSports. “Het is echt bizar. “Ik kwam zondag uit Cardiff, maandag was een vrije dag – Tweede Pinksterdag – , en toen had ik dinsdag en woensdag de hele dag meetings met Nederlandse en internationale clubs. Donderdag was ik in Londen en maandag vlieg ik naar Zwitserland.”

Met SciSports, een bedrijf dat nog maar 4 jaar bestaat, doet Brouwer iets unieks in de voetbalwereld. “We hebben het spel Football Manager nagemaakt in het echt”, zegt hij op SAS Forum Nederland. “Daarbij kruip je in de rol van een manager bij een middelmatige club, om uiteindelijk groot te worden. Daarbij zoek je heel Chili af of pluis je de tweede divisie van Roemenië uit op zoek naar talent.”

Met de opkomst van steeds meer data om ons heen lijkt het niet vreemd dat we ons ook in het voetbal hier op gaan richten, maar vier jaar geleden verbaasde Brouwer zich over de ouderwetse gang van zaken in die wereld. “Ik dacht dat de grote clubs hetzelfde zouden handelen als binnen Football Manager, op basis van data. Daarom schreef ik een voorstel van FC Twente — ik studeerde aan de Universiteit van Twente. Ze waren net kampioen geweest en het ging nog heel goed, maar ze stonden er voor open. Ze wilden ook naar de data kijken om spelers te scouten. Nu zijn we vier jaar verder en werken er 46 mensen voor SciSports. Dit jaar hebben we alleen al zes jongens met een PhD in machine learning binnengehaald.”

De EU ziet SciSports als the next unicorn, een bedrijf dat een waardering van meer dan een miljard kan krijgen. “Dat is nu nog toekomstmuziek, maar het gaat de goede kant op.” En grote spelers, als Memphis Depay, baseren zich inmiddels al op de data van SciSports wanneer ze opzoek zijn naar een nieuwe club.

Hoe kwam Memphis Depay bij jullie terecht?

De makelaar van Depay stuurde ons gewoon een berichtje via Facebook. “We werken wel vaker voor zijn makelaarsbureau, want een aantal makelaars zag al dat die data er aan zat te komen. Ze wilden dat gaan gebruiken in hun beslissingsproces. Als ze een jonge speler naar een volgende club wilden brengen, moest de keuze wél goed zijn. Ze betaalden ons dan per rapport om die analyse voor ze uit te voeren. De eerste keer ging dat gewoon via Facebook. Ze hadden een berichtje gestuurd.”

Depay ging uiteindelijk na een tijd op de bank te hebben gezeten bij Manchester United naar Olympique Lyon. Hoe kwamen jullie bij die club terecht?

“Je hebt een aantal harde criteria waar je van uit kunt gaan en een aantal clubs sowieso afvalt. Hij wilde veel spelen, en dan vallen clubs als Real Madrid en Barcelona al af — dat had wel gekund als ze een tekort op die positie gehad hadden, maar dat was niet het geval. Naar een aantal landen wilde hij ook niet, waardoor er een lijst met 60 clubs overblijft. Toen hebben we gekeken naar welke clubs matchen bij zijn speelstijl. Dat doen we door een bewegingsanalyse: Hoe er gepasst wordt, is dat snel of langzaam? Of een aanval vaak over links of rechts gaat. Speelt het team hoog of laag. Daar kun je heel snel herleiden hoe de speelstijl is.”

Bij het scouten voor clubs bepalen jullie de waarde van een speler. Bij Amerikaanse sporten wordt er al veel langer gekeken naar data, omdat die teamsporten vaak een individueel element hebben. Een honkballer staat bijvoorbeeld alleen aan slag. Bij voetbal is het teamverband veel belangrijker. Hoe kan je dan toch, zoals in de film Moneyball, een speler een waarde geven?

“Waar ons systeem puur en alleen op gebaseerd is, is wat gebeurt er wanneer er een speler in het veld staat? Daarbij kijken we alleen naar de doelpunten en uitslagen. Eigenlijk alleen naar de teletekstdata, of iets meer dan dat. Dat is voor ons noodzakelijk, omdat we anders de data van bijvoorbeeld Colombia niet meepakken. Daar beschikken we niet over méér data dan die basisgegevens.”

“Als we dan bij een speler echt de diepte in willen gaan geven we cijfers voor bepaalde skills. Wat voor cijfer geven voor aanvallen, of hoe goed is hij in dribbelen bijvoorbeeld.”

Giels BrouwerHoe belangrijk blijft een menselijke scout binnen jullie systeem?

“Die is cruciaal. In dat kan je heel veel vangen, maar het menselijk oog blijft van belang. Persoonlijkheid vind je niet in data. Als iemand een wegwerpgebaar naar zijn coach maakt, of soms te veel drinkt zie je dat niet terug in de data. Als je bij het scouten data gebruikt als pre-selectieproces en je laat erna de scouts er naar kijken en ze geven beiden een positief oordeel, dan elimineer je een groot deel van het risico.”

Wat willen clubs het meest weten van je?

“Welke linksbenige linksback transfervrij zijn. Dat is nu de grootste vraag, samen met spitsen. Maar die zoeken ze altijd. Vorig jaar zochten ze ook al veel linksbenige linksbacks. Blijkbaar is daar een tekort aan.”

Welke Nederlandse speler dicht jij de komende transferperiode de mooiste kansen toe?

Davy Klaassen heeft grote kansen voor een mooie internationale transfer. “Dat is Davy Klaassen (24), van Ajax. In de huidige selectie is hij met Joël Veltman de speler met de meeste invloed op het teamresultaat. De ideale clubs in Europa zijn voor hem Napoli, Everton, Liverpool, Bayer Leverkussen en AS Roma.

Waar haal je de uiteindelijke preciezere data van zo’n  speler vandaan?

“Bij andere bedrijven die dat bijhouden. We kijken dan puur naar de aan de bal genoteerde data: van waar naar waar iemand passt of waar iemand een dribbel inzet bijvoorbeeld. Hier hebben we zelf ook een statistiek uit opgemaakt. Wanneer iemand in the final third staat, het laatste deel richting het strafschopgebied van de tegenstander, en hij zet daar een dribbel in, hoe lang kan hij dan een actie maken, dus hoe lang heeft hij de bal aan de voet? En hoe vaak geeft hij daar een succesvol gevolg aan? Dan zie je alleen spelers als Ozil, Sánchez en Messi hier goed in zijn. De rest van de spelers .. dat zijn geen échte dribbelaars.”

Nu worden de gegevens waar SciSports zich hier op baseert nog bijgehouden door mensen. Bij zo’n acht bedrijven zitten ze achter een computer en klikken ze bij de wedstrijden wie naar wie passt en waar dat op het veld was — allemaal handmatig. Maar de mens is voor SciSports niet betrouwbaar en diepgravend genoeg. “Hoe weet diegene nou wat wel en niet een goede pass is?” Brouwer had Football Manager nagebouwd, maar wilde vervolgens FIFA in het echt maken. Daar zie je onderin het scherm live een radar in het scherm., waarop je ziet waar iedereen loopt, hoe snel de bal gaat en waar een schot geplaatst wordt. Brouwer wilde in de huid van de speler kruipen, maar er was nog geen manier om 3D-data te genereren.

Hoe heb je dat gedaan?

“Spelers willen geen hesjes aan om de bewegingen bij te houden. Daarom doen we dat met camera’s. We hebben bij Heracles een systeem opgehangen met 14 camera’s rond het veld, dat hangt daar al een jaar en creëert automatisch 3D-pixels. Alle bewegingen van spelers worden bijgehouden: hoe schiet iemand? hoe passt iemand? Door deep learning toe te passen herkennen we hoe een speler loopt. Als dat anders is dan normaal, is de kans groot op een blessure.”

Hoe zien jullie de toekomst? Je hebt 14 camera’s opgehangen bij Heracles. Hoe wil je dat verder uitbreiden, hoe wil je de de komende 5 jaar verder?

“Dat vind ik heel lastig. Als je mij vier jaar geleden verteld had dat ik hier nu zou staan had ik je uitgelachen.”

Toen zat je misschien nog op je studentenkamer.

Twee jaar vooruit kijken is voor mij al lange termijn. “Ja, de eerste anderhalf jaar was dat nog zo en heb ik geen cent verdiend. Mag ik twee jaar vooruit kijken? Dat is voor mij lange termijn. Over twee jaar denk ik dat elke club aan een vorm van datascouting doet en er zullen ook een aantal concurrenten voor ons opkomen. Wij willen dan 30 procent van de clubs in de twee hoogste divisies per land in Europa binnengehaald hebben.”

Hangen dan bij al die clubs ook camera’s?

“Dat hoeft niet, maar in 2020 is het EK. Dan willen we in heel Europa de dataprovider zijn, dat is het hoofddoel. Die data komt dan van onze camera’s.”