Home Nieuws Rapidata is ontstaan ​​om de ontwikkelingscyclus van het AI-model te verkorten van...

Rapidata is ontstaan ​​om de ontwikkelingscyclus van het AI-model te verkorten van maanden naar dagen met bijna realtime RLHF

3
0
Rapidata is ontstaan ​​om de ontwikkelingscyclus van het AI-model te verkorten van maanden naar dagen met bijna realtime RLHF

Hoewel er steeds meer wordt gesproken over een toekomst waarin het meeste menselijke werk wordt geautomatiseerd door AI, is een van de ironieën van de huidige technologiehausse hoe sterk ze nog steeds afhankelijk zijn van mensen, met name het proces van het trainen van AI-modellen met behulp van versterkend leren van menselijke feedback (RLHF).

Simpel gezegd is RLHF een begeleidingssysteem: nadat de AI is getraind op samengestelde gegevens, maakt deze nog steeds fouten of klinkt als een robot. Menselijke contractanten worden vervolgens massaal ingehuurd door AI-laboratoria om nieuwe modelresultaten te beoordelen en te rangschikken terwijl ze worden getraind, en het model leert van hun ranglijsten en past zijn gedrag aan om hoger gerangschikte resultaten te bieden. Dit proces wordt steeds belangrijker naarmate AI vooruitgang boekt bij het produceren van multimedia-uitvoer zoals video, audio en beelden die mogelijk meer genuanceerde en subjectieve kwaliteitsmaatstaven hebben.

Historisch gezien is dit begeleidingsproces een groot logistiek probleem en een PR-nachtmerrie geweest voor AI-bedrijven, omdat het afhankelijk is van een gefragmenteerd netwerk van buitenlandse aannemers en statische etiketteringsgroepen in bepaalde geografische centra met lage inkomens. door de media afgeschilderd als lage lonen – zelfs uitbuitend. Het is ook inefficiënt: AI-laboratoria moeten weken of maanden wachten voordat ze een enkele set input krijgen, waardoor de voortgang van het model wordt vertraagd.

Nu is er een nieuwe startup ontstaan ​​die het proces veel efficiënter maakt: SnelHet platform ‘gamificeert’ RLHF effectief door dergelijke beoordelingstaken wereldwijd aan te bieden aan bijna 20 miljoen gebruikers van populaire apps, waaronder Duolingo of Candy Crush, in de vorm van korte, opt-in beoordelingstaken die ze kunnen voltooien in plaats van een mobiele advertentie te bekijken, waarbij de gegevens rechtstreeks worden teruggestuurd naar het AI-lab om te worden toegewezen.

Zoals in een persbericht met VentureBeat werd gedeeld, stelt het platform AI-laboratoria in staat “modellen in bijna realtime te herhalen”, waardoor de ontwikkelingstijd aanzienlijk wordt verkort in vergelijking met traditionele methoden.

CEO en oprichter Jason Corkill verklaarde in hetzelfde persbericht dat Rapidata “het menselijk oordeel beschikbaar maakt op mondiale schaal en in bijna realtime, waardoor een toekomst wordt geopend waarin AI-teams constante feedbackloops kunnen uitvoeren en systemen kunnen bouwen die elke dag verbeteren, niet elke releasecyclus.”

Rapidata-oprichter en CEO Jason Corkill. Krediet: Rapidata

Rapidata behandelt RLHF als hogesnelheidsinfrastructuur en niet als een handarbeidsprobleem. Vandaag heeft het bedrijf ons exclusief op VentureBeat zijn opkomst aangekondigd met een startronde van $8,5 miljoen, mede geleid door Canaan Partners en IA Ventures, met deelname van Acequia Capital en BlueYard, om zijn unieke benadering van on-demand menselijke data op te schalen.

Pubgesprekken die menselijke wolken bouwen

De oorsprong van Rapidata ligt niet in een directiekamer, maar aan een tafel die bier drinkt. Het was toen Corkill student was aan de ETH Zürich, waar hij werkte op het gebied van robotica en computervisie, toen hij een obstakel tegenkwam waar elke AI-ingenieur uiteindelijk mee te maken krijgt: het knelpunt bij de data-annotatie.

“In het bijzonder werkte ik al een aantal jaren op het gebied van robotica, AI en computervisie, studeerde aan de ETH in Zürich, en was altijd gefrustreerd geweest door het annoteren van gegevens”, herinnerde Corkill zich in een recent interview. “Als je annotatie van mensen of menselijke gegevens nodig hebt, loopt je project vast, want tot die tijd kun je het vooruit helpen door langere nachten uit te stellen. Maar als je grootschalige menselijke annotatie nodig hebt, moet je naar iemand toe gaan en dan een paar weken wachten.”

Gefrustreerd door deze vertragingen realiseerden Corkill en zijn medeoprichters zich dat het huidige AI-werkgelegenheidsmodel ernstig kapot was in een wereld die zich met de snelheid van de moderne computer beweegt. Terwijl de computertechnologie exponentieel groeit, doet het traditionele personeelsbestand – gebonden aan handmatige onboarding, regionale aanwervingen en langzame looncycli – dit niet. Rapidata is ontstaan ​​uit het idee dat menselijk oordeel kan worden geleverd als een wereldwijd gedistribueerde en vrijwel realtime service.

Technologie: zet digitale voetafdrukken om in trainingsgegevens

De kerninnovatie van Rapidata ligt in de distributiemethode. In plaats van fulltime annotators in een specifieke regio in dienst te nemen, profiteert Rapidata van de aandachtseconomie die bestaat in de wereld van mobiele apps. Door samen te werken met apps van derden, zoals Candy Crush of Duolingo, biedt Rapidata gebruikers de keuze: een traditionele advertentie bekijken of een paar seconden besteden aan het leveren van input aan een AI-model.

“Gebruikers wordt gevraagd: ‘Hé, zou je liever, in plaats van naar een advertentie te kijken en een bedrijf op die manier je aandacht te laten trekken, liever wat gegevens annoteren en feedback geven?'” legt Corkill uit. Volgens Corkill verkiest tussen de 50% en 60% van de gebruikers feedbacktaken boven traditionele videoadvertenties.

Deze ‘crowd intelligence’-benadering stelt AI-teams in staat om op een ongekende schaal gebruik te maken van diverse mondiale demografische gegevens.

  • Wereldwijd netwerk: Rapidata bereikt momenteel tussen de 15 en 20 miljoen mensen.

  • Enorm parallellisme: Het platform kan 1,5 miljoen menselijke annotaties per uur verwerken.

  • Snelheid: Feedbackcycli die voorheen weken of maanden in beslag namen, zijn nu teruggebracht tot uren of zelfs minuten.

  • Kwaliteitscontrole: Het platform bouwt in de loop van de tijd een profiel op van het vertrouwen en de expertise van de respondenten, zodat complexe vragen worden gekoppeld aan de meest relevante juryleden.

  • Anonimiteit: Hoewel gebruikers worden gevolgd via geanonimiseerde ID’s om consistentie en betrouwbaarheid te garanderen, verzamelt Rapidata geen persoonlijke identiteiten, waardoor de privacy behouden blijft en de gegevenskwaliteit wordt geoptimaliseerd.

RLHF Online: overstappen naar GPU

De belangrijkste technologische sprong die mogelijk wordt gemaakt door Rapidata is wat Corkill omschrijft als ‘online RLHF’. Traditioneel wordt AI getraind in niet-verbonden batches: je traint het model, stopt, stuurt de gegevens naar mensen, wacht weken totdat deze zijn gelabeld en gaat dan verder. Hierdoor ontstaat er een ‘informatiekring’ waarin vaak menselijke inbreng ontbreekt.

Rapidata verplaatst deze beoordeling rechtstreeks naar de trainingslus. Omdat het netwerk zo snel is, kunnen ze via API rechtstreeks integreren met de GPU’s waarop het model draait.

“We hebben altijd het idee gehad van versterkend leren voor menselijke feedback… tot nu toe moest je het altijd in batches doen”, zei Corkill. “Als je nu naar beneden kijkt, hebben we een aantal klanten die we, omdat we zo snel zijn, direct, feitelijk in uitvoering, kunnen gebruiken, zoals op de processor rechts van de GPU, en de GPU berekent wat output en kan direct op een gedistribueerde manier bij ons opvragen. ‘Oh, ik heb, ik heb, ik heb een mens nodig om hiernaar te kijken.’ Ik krijg het antwoord en pas dan het verlies toe, wat tot nu toe niet mogelijk is geweest.”

Momenteel ondersteunt het platform ongeveer 5.500 mensen per minuut door live feedback te geven aan modellen die op duizenden GPU’s draaien. Dit voorkomt ‘hacking van beloningsmodellen’, dat wil zeggen dat twee AI-modellen elkaar voor de gek houden in een feedbackloop, door training te baseren op daadwerkelijke menselijke nuances.

Product: Het aanpakken van de mondiale smaak en context

Terwijl AI zich verplaatst van eenvoudige objectherkenning naar generatieve media, zijn de vereisten voor het labelen van gegevens geëvolueerd van objectieve tagging naar subjectieve, op smaak gebaseerde curatie. Het gaat niet langer alleen om “is dit een kat?” maar eerder “is deze geluidssynthese overtuigend?” of “welke van deze twee samenvattingen voelt professioneler aan?”.

Lily Clifford, CEO van voice AI startup Rime, merkt op dat Rapidata transformatief is geweest bij het testen van modellen in de echte wereld. “Vroeger betekende het verzamelen van betekenisvolle feedback het samenvoegen van leveranciers en enquêtes, segment voor segment of land voor land, wat niet schaalbaar was”, aldus Clifford. Met Rapidata kan Rime de juiste doelgroep bereiken – of dat nu in Zweden, Servië of de Verenigde Staten is – en binnen enkele dagen in plaats van maanden de modelprestaties in echte klantworkflows bekijken.

“De meeste modellen zijn feitelijk correct, maar ik weet zeker dat je een e-mail hebt ontvangen die, weet je, niet echt voelde, toch?” merkte Corkill op. “Je kunt een AI-e-mail ruiken, je kunt een AI-afbeelding of -video ruiken, het is meteen duidelijk… deze modellen voelen nog steeds niet aan als mensen, en daarvoor heb je menselijke feedback nodig.”

Economische en operationele verschuivingen

Vanuit operationeel oogpunt positioneert Rapidata zichzelf als een infrastructuurlaag die de noodzaak voor bedrijven elimineert om hun eigen aangepaste annotatiebewerkingen te beheren. Door een schaalbaar netwerk aan te bieden, verlaagt het bedrijf de toegangsdrempel voor AI-teams die voorheen worstelden met de kosten en complexiteit van traditionele feedbackloops.

Jared Newman van Canaan Partners, die de investering leidde, gelooft dat deze infrastructuur van cruciaal belang is voor de volgende generatie AI. “Elke serieuze toepassing van AI is ergens in de levenscyclus afhankelijk van menselijk oordeel”, zegt Newman. “Naarmate het model verschuift van op vaardigheden gebaseerde taken naar op smaak gebaseerde curatie, zal de vraag naar meetbare menselijke feedback dramatisch toenemen.”

Een toekomst die door mensen benut kan worden

Hoewel de huidige focus ligt op modelleringslaboratoria in de Bay Area, ziet Corkill een toekomst waarin AI-modellen zelf de belangrijkste klanten voor menselijk oordeel zullen worden. Hij noemt het ‘menselijk gebruik’.

In deze visie zouden AI-autoontwerpers niet alleen generieke voertuigen produceren; ze zouden Rapidata programmatisch kunnen bellen om 25.000 mensen op de Franse markt om hun mening over een bepaalde esthetiek te vragen, de input te herhalen en het ontwerp binnen enkele uren te verfijnen.

“De samenleving verandert voortdurend”, zei Corkill, terwijl hij de trend besprak om AI te gebruiken om menselijk gedrag te simuleren. “Als ze een simulatie zouden maken van de huidige samenleving, zou de simulatie een paar maanden stabiel zijn en misschien wel vergelijkbaar met onze simulatie, maar dan compleet veranderen, omdat de samenleving op een heel andere manier is veranderd en ontwikkeld.”

Door een programmeerbare en gedistribueerde manier te creëren om wereldwijd toegang te krijgen tot de menselijke hersencapaciteit, positioneert Rapidata zichzelf als een cruciale schakel tussen silicium en de samenleving. Met 8,5 miljoen dollar aan nieuwe financiering is het bedrijf van plan agressief actie te ondernemen om ervoor te zorgen dat naarmate de AI zich verder uitbreidt, het menselijke element niet langer een obstakel is, maar een real-time feature.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in