De BBC liet kunstmatige intelligentie een tv-programma maken

Elger van der Wel
Elger van der Wel

De BBC gaf A.I. de controle over een tv-programma. Een spannend en vooral leerzaam project.

Is kunstmatige intelligentie in staat een televisieprogramma samen te stellen? Die vraag stelden onderzoekers en programmamakers van de BBC zichzelf afgelopen zomer. En dus besloten ze een poging te wagen. Op 4 september zond BBC Four het programma ‘Made By Machine: When AI Met The Archive’ uit, samengesteld en gemonteerd door een computer. Op WebSummit vertelden Cassian Harrison en George Wright van de BBC deze week vol trots op over hun project.

Elger van der WelElger van der WelWekelijks schrijft Elger van der Wel een column over innovatie in de journalistiek en media. Deze week schrijft hij over het gebruik van kunstmatige intelligentie binnen de traditionele media.Aan de basis van het programma staat het archief van de BBC. De makers hebben 270.000 uur aan archiefmateriaal uit non-fictie programma’s gevoed aan een systeem dat bestond uit diverse algoritmes. Daarnaast hebben ze het algoritme laten kijken wat er normaal te zien is op BBC Four, zodat de inhoud van het programma daarbij aan zou sluiten. Alles in de hoop dat het resultaat een uitzendbaar televisieprogramma zou worden.

Uiteraard hebben ze de algoritmes soms moeten afstellen (bijvoorbeeld de onderlinge verhoudingen van de diverse algoritmes), dus helemaal zonder mensenlijk handelen is het proces niet verlopen. Maar uiteindelijk hebben ze de computer het echte werk laten.

Technologieën

In de basis hebben ze drie verschillende technologieën op het archiefmateriaal losgelaten, die keken naar:

  1. De inhoud van gesprekken en interviews. Hierbij hebben ze met tekstherkenning gebruikgemaakt van de ondertitels die al aanwezig waren, maar ze hadden in principe ook spraakherkenning kunnen gebruiken. Op basis van de tekst probeerde het systeem te herkennen waar het over gaat, zodat het een inhoudelijke link kon creëeren tussen fragmenten en zo een logische overgang kon vormen.
  2. De inhoud van het beeld. Door object en omgevingsherkenning los te laten op het videomateriaal kreeg het systeem een beeld van wat er in beeld te zien was. En ook op basis daarvan kon het links maken tussen fragmenten, die – in ieder geval voor het systeem – heel logisch voelden.
  3. De aanwezigheid van visuele energie. Om te zorgen dat er ook wat gebeurt in beeld, is dit onderdeel meegenomen. Verschillen in bijvoorbeeld contrast en beweging zijn uitingen van visuele energie en kunnen automatisch worden geanalyseerd.

De links die de computer legde leken voor het systeem logisch, maar waar inhoudelijk niet sterk De verschillende technologieën bleken allemaal voor hun eigen uitdagingen te zorgen. De links die de computer legde leken voor het systeem heel logisch, doordat bijvoorbeeld in twee fragmenten iemand met een rode jas door beeld liep. Inhoudelijk is dat natuurlijk helemaal geen sterke link. Daarnaast bleek zwartwit beeld door het contrast automatisch meer visuele energie te bevatten; daar hadden de makers vooraf niet over nagedacht.

Resultaat

Uiteindelijk is het in ieder geval gelukt. Inhoudelijk was de uitzending niet erg sterk, maar het was wel een bijzondere reis door het BBC-archief. Het systeem zorgde voor originele overgangen tussen de fragmenten, die hij zelfstandig op basis van de inhoud had losgeknipt. Als kijker werd je daardoor regelmatige verrast en wilde je blijven kijken.

Harrison en Wright moesten echter ook toegeven dat dit een interessant experiment was, maar dat dit geen manier is om programma’s te maken. Ze zijn er echter wel van overtuigd dat deze technologie een heel handig hulpmiddel kan zijn voor redacties en op dat vlak willen ze er zeker mee verder. Het systeem kan helpen archieven te doorzoeken en selecties te maken, zodat het werk van een programmamakers makkelijker wordt.

Commerciële mogelijkheden

De inhoud van video's kan met behulp van computer vision worden vastgesteld om interesses te peilen. Ook op commercieel vlak is dit soort technologie interessant. Uitgever Condé Nast maakt er al gebruik van, vertelde Karthic Bala, Chief Data Officer van deze Amerikaanse uitgever op WebSummit. De inhoud van video’s die de redactie publiceert, kan met behulp van computer vision worden vastgesteld, om zo hun interesses te peilen. Als je bijvoorbeeld op de site van Vogue kijkt naar een fashionshow, dan kan het zomaar zijn dat je daarna advertenties te zien krijgt van dezelfde soort jurkjes als die je net voorbij zag komen in de video. Dit soort inhoudsanalyses vindt al veelvuldig plaats op de tekst van artikelen, maar tegenwoordig dus ook op video.

Interessant, maar je moet het niet zomaar bij iedere website toepassen. Zeker bij nieuws, betekent het bekijken van een video niet dat je ook commerciële interesse hebt in het onderwerp. Bij onderwerpen als fashion en lifestyle is dit echter al een stuk aannemelijker.

Mensen

Al met al liggen er dus kansen voor het gebruik van dit soort technologie. Op commercieel vlak, maar ook voor makers. Het project van de BBC bewijst tegelijkertijd dat je je geen zorgen hoeft te maken dat kunstmatige intelligentie uiteindelijk het echte creatieve werk van mensen overneemt. Het is iets waar veel onderzoek naar wordt gedaan, maar ik geloof dat de technologie op creatief vlak toch het beste tot zijn recht komt als hulpmiddel.

Sam Yam, de oprichter van Patreon, legde het op WebSummit als het volgt uit: het draait bij creativiteit uiteindelijk om de verbinding tussen de maker en zijn publiek. Om gedeelde ervaringen en emoties. Niet zo gek dat hij dat zegt, want Patreon heeft als doel om makers en publiek nader tot elkaar te brengen, en daarmee een verdienmodel voor makers te creeëren. Echter denk ik dat hij gelijk heeft, in ieder geval de komende decennia nog.