Het is je vast niet ontgaan: WhatsApp, Facebook én Instagram lagen er gisteravond urenlang uit. Dat alles had te maken met een flinke storing bij Facebook. KPN zag een flinke piek in het aantal sms’jes ontstaan – want wie smst er tegenwoordig nou nog – en WhatsApp alternatieven Signal en Telegram verwelkomden een hoop nieuwe gebruikers. Ook Twitter werd door een hoop mensen weer erbij gepakt. Maar hoe kon zo’n gigantische storing nou ontstaan?
Het storing werd waarschijnlijk veroorzaakt door een mislukte routinematige update.
Storing
De storing begon maandagmiddag rond 17.45 uur. Pas rond 1.00 uur ‘s nachts was het volledig opgelost. Hoe kan zo’n storing ontstaan bij zo’n giga bedrijf als Facebook? Facebook zelf heeft hier een antwoord op. De hoofdoorzaak was een foute wijziging in de instellingen van de zogeheten backbone-routers die netwerkverkeer tussen datacenters regelen.
“De verstoring van het netwerkverkeer had een trapsgewijs effect op de manier waarop onze datacenters communiceren”, legt Facebook uit. “Hierdoor kwamen onze diensten tot stilstand.”
Mislukte update
Beveiligingsexpert Brian Krebs legt uit dat de storing door een mislukte update is ontstaan. Een bron binnen Facebook sprak volgens hem van een ‘routinematige BGP-update die fout was gegaan’. BGP staat voor Border Gateway Protocol, wat de routekaart is die aan je computer laat weten waar websites en apps te vinden zijn. Dit is bedoeld om files en vertragingen in het netwerk te voorkomen. Als alle bezoekers via dezelfde route naar hun gegevens gaan, zouden netwerken dus vastlopen.
Een belangrijk onderdeel, dus. Maar de update van gisteren zorgde voor een storing die door de medewerkers van Facebook zelf heel lastig opgelost kon worden. “De update blokkeerde gebruikers op afstand zodat die de wijzigingen niet ongedaan konden maken en tegelijkertijd hadden medewerkers in kantoren geen netwerktoegang”, vertelt Krebs.
Urenlange storing
Dit zorgde er ook voor dat deze storing niet zo makkelijk opgelost kon worden. Het interne netwerk van het bedrijf lag er helemaal uit. De medewerkers konden dus niet bij hun communicatieplatform komen. Sommige medewerkers konden zelfs het kantoor niet meer in komen omdat hun toegangspasjes geweigerd werden. Pas toen een team van het bedrijf de servers handmatig wist te resetten in een datacentrum in Californië, werd de storing verholpen.
Social media
Miljarden mensen ervaarden door deze storing hoe afhankelijk ze van Facebook zijn. Zo waren er bedrijven die óók helemaal plat lagen, omdat zij volledig communiceren via Facebook en WhatsApp. Op Twitter was het gisteravond dan ook druk, waardoor ook dit sociale media-platform met problemen kampte: tweets werden niet altijd goed geladen.
hello literally everyone
— Twitter (@Twitter) October 4, 2021