Home Nieuws Zelfs Google en Replit hebben moeite om AI-agenten betrouwbaar in te zetten...

Zelfs Google en Replit hebben moeite om AI-agenten betrouwbaar in te zetten – en dit is de reden

4
0
Zelfs Google en Replit hebben moeite om AI-agenten betrouwbaar in te zetten – en dit is de reden

2025 zou het jaar van de AI-agent moeten zijn, toch?

Niet helemaal, geef toe dat Google Cloud en Replit twee grote spelers zijn op het gebied van AI-agenten en partners in “trillingscodering‘beweging – tijdens een recent VB Impact Series-evenement.

Zelfs nu ze hun eigen agenttools bouwen, zeggen leiders van beide bedrijven dat hun capaciteiten nog steeds niet voldoende zijn.

Deze beperkte realiteit wordt veroorzaakt door problemen met oude workflows, gefragmenteerde gegevens en onvolwassen bestuursmodellen. Bovendien begrijpen bedrijven fundamenteel verkeerd dat agenten niet zijn zoals andere technologieën: ze vereisen een fundamentele heroverweging en herwerking van workflows en processen.

Wanneer bedrijven agenten bouwen om het werk te automatiseren, “zijn de meeste speelgoedvoorbeelden”, zei Amjad Masad, CEO en oprichter van Replit, tijdens het evenement. “Ze waren enthousiast, maar toen ze het begonnen uit te rollen, waren de resultaten niet erg goed.”

Agenten bouwen op basis van Replit’s eigen fouten

Betrouwbaarheid en integratie, en niet intelligentie zelf, zijn de twee belangrijkste obstakels voor het succes van AI-agenten, zei Masad. Agents falen vaak als ze lange tijd actief zijn, fouten accumuleren of geen toegang hebben tot schone, goed gestructureerde gegevens.

Het probleem met bedrijfsgegevens is dat deze rommelig zijn (gestructureerd, ongestructureerd en overal opgeslagen) en dat het een uitdaging is om er doorheen te kruipen. Bovendien zijn er veel ongeschreven dingen die mensen doen die voor agenten moeilijk te coderen zijn, zei Masad.

“Het idee dat een bedrijf gewoon een agent inhuurt en dat de agent de werknemer vervangt of automatisch de workflow automatiseert, is vandaag de dag niet meer het geval”, zegt hij. “De apparatuur bestaat niet.”

Een stap verder dan agents zijn de tools voor computergebruik, die de werkruimte van een gebruiker kunnen overnemen voor basistaken zoals surfen op het web. Maar het bevindt zich nog in de beginfase en kan ondanks snelle verbeteringen problematisch, onbetrouwbaar en zelfs gevaarlijk zijn.

“Het probleem is dat het huidige computergebruiksmodel erg slecht is”, zegt Masad. “Het is duur, traag en boekt vooruitgang, maar het is pas ongeveer een jaar oud.”

Replit leerde eerder dit jaar van zijn fouten, toen de AI-coder werd verwijderd de volledige codebasis van het bedrijf bij beproevingen. Masad erkende: “De apparatuur is nog niet volwassen genoeg”, en merkte op dat het bedrijf de ontwikkeling van de productie heeft geïsoleerd.

Technieken als ‘in the loop’ testen, verifieerbare uitvoering en ontwikkelingsisolatie zijn van cruciaal belang, zei hij, ook al vergen ze veel middelen. Replit integreert in-the-loop-mogelijkheden in de versie met drie agenten, en Masad zegt dat de agent van de volgende generatie 200 minuten autonoom kan werken; sommigen hebben er 20 uur mee gelopen.

Hij erkende echter dat gebruikers frustratie hebben geuit over de vertragingstijd. Als ze ‘flinke orders’ geven, moeten ze misschien twintig minuten of langer wachten. Idealiter hebben ze aangegeven dat ze zich meer in een creatieve cirkel zouden willen begeven waarin ze meerdere bestellingen kunnen invoeren, aan meerdere taken tegelijk kunnen werken en ontwerpen kunnen aanpassen terwijl het bureau werkt.

“De manier om dit te ondervangen is door parallellisme, door meerdere loop-agents te creëren en deze aan deze onafhankelijke functies te laten werken, terwijl je tegelijkertijd creatief werk kunt doen”, zei hij.

Agentschappen hebben een cultuurverandering nodig

Naast het technische perspectief zijn er ook culturele barrières: agenten opereren probabilistisch, maar traditionele bedrijven zijn gestructureerd rond deterministische processen, zegt Mike Clark, directeur productontwikkeling bij Google Cloud. Dit zorgde voor een culturele en operationele mismatch toen LLM’s geheel nieuwe tools, orkestratiekaders en processen begonnen te gebruiken.

‘We wisten niet hoe we over agenten moesten denken,’ zei Clark. “We weten niet hoe we de problemen moeten oplossen die agenten wel kunnen.”

Bedrijven die het goede doen, worden gedreven door bottom-up-processen, zei hij: het bouwen van no-code en low-code software en tools in kanalen die naar grotere bureaus worden doorgesluisd. Tot nu toe was de succesvolle implementatie beperkt, voorzichtig van opzet en nauwlettend in de gaten gehouden.

“Als ik naar 2025 kijk en naar de belofte dat dit het jaar van het bureau wordt, dan is dat een jaar waarin veel mensen tijd besteden aan het maken van prototypen,” zei Clark. “Nu zitten we midden in deze grootschalige fase.”

Hoe zorg je voor een wereld zonder graslanden?

Een andere strijd is de veiligheid van AI-agenten, waarvoor ook traditionele processen moeten worden heroverwogen, zei Clark.

Er zijn op alles beveiligingsbeperkingen toegepast, maar dat werkt niet als agenten toegang moeten hebben tot veel verschillende bronnen om de beste beslissingen te nemen, zei Clark.

“Dit verandert ons beveiligingsmodel volledig, verandert onze basislijn”, zei hij. “Wat is het minste voorrecht in een wereld zonder weidegronden en hulpeloosheid?”

Uiteindelijk moet er in de hele sector een heroverweging komen van het bestuur, en moeten bedrijven hun dreigingsmodellen op één lijn brengen met agenten.

Clark wijst op het verschil: “Als je naar sommige van je bestuursprocessen kijkt, zou je zeer verbaasd zijn dat de oorsprong ervan was dat iemand op een elektrische typemachine van IBM in drievoud typte en deze aan drie mensen overhandigde. Dat is niet de wereld waarin we vandaag de dag leven.”

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in