In het derde kwartaal van 2025 realiseerde Bot Auto zijn eerste ‘driver-out’ op de openbare weg: een rit waarbij de vrachtwagen zelf rijdt zonder mens achter het stuur, en in ons geval helemaal geen mens in de cabine. Dit is een prestatie die slechts een handvol AV-truckingprogramma’s heeft bereikt. Vanaf de oprichting van het bedrijf tot aan die mijlpaal hebben we slechts $212.552 uitgegeven aan één functiecategorie die doorgaans de duurste ter wereld is. AI: mensen betalen om trainingsgegevens handmatig te labelen (bijvoorbeeld door kaders rond auto’s en voetgangers te tekenen) zodat neurale netwerken ervan kunnen leren.
Voor veel mensen lijken deze cijfers niet baanbrekend. Het lijkt erop dat er iets ontbreekt: de kosten zijn niet berekend, de regelitems zijn niet openbaar gemaakt of er is een slimme manoeuvre verborgen buiten het kader.
Een dergelijk scepticisme is redelijk, omdat annotaties bij AI doorgaans geen afrondingsfouten zijn; dit is het hoofdregelitem. Om te zien waarom dit belangrijk is, kun je nuScenes eens bekijken, een bekende dataset op het gebied van autonoom rijden. In totaal bevat het slechts ongeveer 5,5 uur aan rijgegevens. Keyframe voor keyframe moeten menselijke annotators elk voertuig, elke voetganger en elk object in de scène identificeren en nauwkeurig labelen. Het werk duurde naar verluidt 7.937 uur en kostte ongeveer $ 100.000.
Het ontbrekende deel bestaat niet in de boekhouding. Het zit in de aannames.
Wat veel mensen missen zijn geen verborgen kosten, maar een nieuw tijdperk: een verschuiving in de manier waarop intelligentie wordt geproduceerd. Wij gaan van a op gegevens gebaseerd regime, waar vooruitgang afhangt van labels die door mensen worden beschreven, wordt een computer gebaseerd regime, waarbij computers zelf het werk op grote schaal doen.
Wanneer een sector geconfronteerd wordt met een fundamentele paradigmaverschuiving, worden de oude opvattingen niet alleen onvolledig. Dit is misleidend.
VAN WERKPLAATS TOT FABRIEK
Het grootste deel van de afgelopen tien jaar heeft de implementatie van AI, en vooral autonomie, als een workshop gelopen. Er wordt een workshop gegeven over menselijke inspanningen. Als u wilt dat uw systeem leert, moet u dienst mensen om gegevens te labelen, randgevallen te signaleren en hele pijpleidingen rond menselijke arbeid te bouwen. De schaarse hulpbron bestaat niet uit ruwe data, omdat ruwe data overal aanwezig zijn. Een schaarse hulpbron is gelabeld signaal. Het is menselijke arbeid die ervoor zorgt dat machines blijven leren.
Fabrieksmodellen veranderen energiebronnen. Tijdens de Industriële Revolutie verving stoom de spieren, waarna elektriciteit de stoom verving. Op dezelfde manier vervangen AI-bedrijven uit het fabriekstijdperk de etikettering van menselijke energie door computers. In plaats van mensen te betalen om alles met de hand te labelen, gebruiken ze modellen om op grote schaal toezicht te houden. Mensen blijven belangrijk, maar hun rol wordt steeds groter: van het handmatig tekenen van kaders tot systeemverificatie en kwaliteitscontrole. Dit is de echte verandering: gelabelde signalen zijn niet langer zeldzaam en de bovengrens van intelligentie begint te stijgen.
Dit gebeurt niet alleen omdat bedrijven meer GPU’s kopen. Dit is een nieuwe en nog steeds zeldzame industriële capaciteit. Pas de laatste paar jaar is het aannemelijk geworden dat computers een deel van het handmatige annotatiewerk kunnen overnemen, en niet alleen maar kunnen helpen. Bekende modellen als Meta’s Segment Anything waren de eersten die op grote schaal lieten zien dat deze verandering reëel was. Zelfs vandaag de dag kan slechts een klein aantal toonaangevende bedrijven dit daadwerkelijk doen – en het doet het ook nog eens behoorlijk goed.
REVOLUTIE IN DE WARE MENING
We hebben deze fabriekswisseling allemaal wel eens meegemaakt, maar de meeste mensen realiseren zich niet wat de echte reden is waarom het werkt.
De wereld spreekt over ChatGPT als een applicatiewonder: het schrijft, codeert en bestuurt uw huisthermostaat. Maar diepere doorbraken zijn verborgen in het volle zicht. ChatGPT wordt niet slim omdat mensen alles wat erop staat een label geven. Hij leerde het zichzelf door teksten op internet te lezen en te leren voorspellen welke woorden daarna zouden verschijnen. Toen het knelpunt eenmaal was afgenomen, explodeerde de schaal. Modellen kunnen evolueren totdat ze een nieuwe grens bereiken: computergebruik. En met die verandering gaat een geleidelijke verandering in vaardigheden gepaard.
Hetzelfde patroon zien we ook op andere domeinen. AlphaGo is datagedreven: het leert van menselijk spel. AlphaZero doorbreekt de grenzen door die afhankelijkheid weg te nemen, alleen te beginnen bij de regels, en zijn eigen ervaring te genereren door middel van onafhankelijk spelen. Wanneer leren niet langer wordt beperkt door een beperkt archief van menselijke voorbeelden, veranderen de grenzen ervan. Het gevolg is dat het nieuwe systeem niet simpelweg een verbetering is ten opzichte van het oude regime. Hierdoor is het verouderd.
DE ENIGE VRAAG DIE BELANGRIJK IS
Richard Feynman schreef: “Om technologie te laten slagen, moet de werkelijkheid voorrang krijgen op maatschappelijke verhoudingen, want de natuur kan niet voor de gek gehouden worden.” Dat is de perfecte test voor dit tijdperk van AI. Elk marketing Het team probeert zijn bedrijf te presenteren als AI-native, futuristisch en gebouwd voor het nieuwe tijdperk. Maar niets daarvan vertelt je wat er werkelijk achter het gordijn zit.
De vraag die de moeite waard is om vandaag de dag aan elk AI-bedrijf te stellen is simpel: waar komen de gelabelde signalen vandaan? Als het antwoord nog steeds bestaat uit het massaal labelen van leveranciersfacturen, draait de winkel, ongeacht wat er in het persbericht staat. Als computergebruik de controle is over de productie op grote schaal, dan is de fabriek al begonnen. De kloof tussen de twee antwoorden is geen detail. Dit is het hele spel.
Xiaodi Hou is de oprichter en CEO van Bot Auto.

