De huidige golf van generatieve AI-animaties voelt vaak aan als goocheltrucs die maar één keer werken. Je typt een commando, er verschijnt een video, en als het resultaat je niet bevalt (misschien zijn de benen wankel, wat een veel voorkomend probleem is bij generaties AI) is je enige optie om een ander commando te proberen. Het is deze ‘black box’-aanpak die Cartwheel, een nieuwe startup voor 3D-animatie, probeert te ontmantelen.
Andrew Carr en Jonathan Jarvis, twee veteranen van respectievelijk OpenAI en Google, hebben het bedrijf opgericht, dat een toekomst wil opbouwen waarin AI het saaie technische werk in animatie voor zijn rekening neemt en de creatieve ziel aan de kunstenaar overlaat.
Ik sprak met Carr en Jarvis over de lancering van hun bedrijf, het definiëren van ‘smaak’ met AI, en de technische en creatieve moeilijkheden van animatie in 2026.
Wat onderscheidt Cartwheel
Volgens de oprichters is een van de grootste obstakels op dit gebied dat 3D-bewegingsgegevens zeer schaars zijn vergeleken met de overvloed aan tekst en afbeeldingen die online beschikbaar zijn en die worden gebruikt om AI-modellen te trainen.
“Als je naar alle grote technologiebedrijven kijkt, bouwen ze hun modellen rond geschreven taal, audio, afbeeldingen (en) video, omdat er zo veel zijn, dus het vinden van die patronen is veel gemakkelijker”, zegt Jarvis. “We wisten dat het moeilijk zou zijn, maar het was moeilijker dan we dachten, waarschijnlijk met een factor 10 tot 100 om die gegevens te verkrijgen.”
Lees meer: Generatieve AI in games is er, maar stuit op weerstand van gamers en ontwikkelaars
Terwijl andere technologiegiganten zich concentreren op het produceren van de uiteindelijke pixel, heeft Cartwheel jarenlang in kaart gebracht hoe mensen daadwerkelijk bewegen. Hun modellen zijn gemaakt om de nuances van optredens te begrijpen, zodat een eenvoudige 2D-video van iemand die danst in hun achtertuin kan worden vertaald naar een nauwkeurig en realistisch 3D-framework.
Het is deze verschuiving van platte tekeningen naar 3D-assets die animators de controle geeft die ze in het AI-tijdperk hebben gemist.
Cartwheel heeft jarenlang de moeilijke taak aangepakt om in kaart te brengen hoe mensen zich daadwerkelijk bewegen.
Voorkomt ‘gelijkheid’ van AI.
De leidinggevenden van Cartwheel zeggen dat ze AI ‘gelijkheid’ zien als een bijproduct van een gebrek aan controle. Als iedereen dezelfde generator zou gebruiken om video’s te maken, zouden de resultaten waarschijnlijk erg op elkaar lijken.
“De uitvoer van ons systeem is ontworpen om door mensen te worden bewerkt. Het is ontworpen om door mensen te worden aangeraakt en gemanipuleerd, en we willen niet dat iemand iets typt en het vervolgens door elkaar gooit tot het een voltooide animatie is. Daar gaat het niet om. Het is saai, wie gaat daar naar kijken?” zei Carr.
“Het feit dat het zo gemakkelijk is voor mensen om het te openen en te bewerken, elimineert feitelijk het probleem van de gelijkheid”, zei hij. “Je stopt het in een ander karakter, je plaatst het in een andere omgeving, je verandert het uiterlijk, je pusht de prestatie, je trekt de prestatie, en in dat geval blijken de overeenkomsten een non-issue te zijn.”
Carr en Jarvis zeggen dat de oplossing bestaat uit het bieden van een ‘controlelaag’ waarbij AI-output slechts het startpunt is. Door 3D-gegevens te genereren in plaats van platte video kunnen makers de belichting veranderen, de camera bewegen of de poses van personages aanpassen nadat AI het eerste werk heeft gedaan – waardoor deze technologie een krachtig hulpmiddel is en geen vervanging voor de kunstenaar.
Oprichter Andrew Carr zegt dat een van zijn belangrijkste wetenschappelijke hypothesen is dat beweging en beweging fundamentele gegevenstypen zijn.
De toekomst van animatie met AI
Naast het sneller maken van animaties en het verlagen van de toetredingsdrempels, ontwikkelt het bedrijf ook een concept dat zij ‘open storytelling’ of ‘open wereld bouwen’ noemen. In moderne gaming en sociale media heeft de vraag naar inhoud een omvang bereikt waarop handmatige animatie onmogelijk te evenaren is.
Cartwheel stelt personages voor die niet alleen zijn geprogrammeerd met meerdere bewegingssets, maar ook worden ondersteund door bewegingsmodellen waarmee ze in realtime kunnen reageren en optreden. Het gaat minder om het choreograferen van elk frame en meer om het ‘repeteren’ met digitale acteurs die de bedoeling van de scène begrijpen.
Uiteindelijk is het doel om de kloof tussen 2D-visie en 3D-uitvoering te overbruggen, zeggen de oprichters.
“Een van de kernhypotheses waarvan we hopen dat deze de komende drie jaar waar zal zijn voor Cartwheel, is dat iedereen in 3D zal werken, zelfs als het in 2D is gemaakt, zelfs als het eindresultaat alleen maar 2D-video is,” zei Carr.
Door zich te concentreren op de ‘lagen onder de pixels’ hopen Carr en Jarvis dat animaties naarmate ze geautomatiseerder worden, ook persoonlijker worden. Machines zorgen voor de biomechanica en de bestandsexport, maar mensen bepalen de smaak, timing en inhoud van het verhaal.



