Home Nieuws Waarom de meeste AI-coderingsproeven voor bedrijven slecht presteren (Hint: het is niet...

Waarom de meeste AI-coderingsproeven voor bedrijven slecht presteren (Hint: het is niet het model)

7
0
Waarom de meeste AI-coderingsproeven voor bedrijven slecht presteren (Hint: het is niet het model)

Het AI-gen in software-engineering is verder gegaan dan alleen automatisch aanvullen. De rand die verschijnt is codering van agenten: Een AI-systeem dat veranderingen kan plannen, in meerdere stappen kan implementeren en kan herhalen op basis van input. Maar ondanks de hype rond ‘AI-agents die coderen’ presteren de meeste bedrijfsimplementaties ondermaats. De beperkende factor is niet langer het model. Hij context: De structuur, geschiedenis en intentie rondom de code zijn gewijzigd. Met andere woorden, bedrijven worden nu geconfronteerd met een systeemontwerpprobleem: ze hebben de omgeving waarin de agent opereert niet ontworpen.

De transitie van hulp naar agency

Het afgelopen jaar heeft er een snelle evolutie plaatsgevonden van codeertools naar agentische workflows. Onderzoek begint te formaliseren wat het gedrag van agenten in de praktijk betekent: het vermogen om het hele ontwerp, de test, de uitvoering en de validatie in overweging te nemen in plaats van geïsoleerde momentopnamen te maken. Banen zoals dynamische actie resampling laat zien dat het toestaan ​​van agenten om hun eigen beslissingen te vertakken, te heroverwegen en te herzien de doorvoer in grote, onderling afhankelijke codebases aanzienlijk zal verbeteren. Op platformniveau bouwen providers zoals GitHub nu speciale agent-orkestratieomgevingen, zoals Copilootagent en hoofdkwartier van de agentter ondersteuning van samenwerking tussen meerdere agenten binnen echte bedrijfsnetwerken.

Maar de eerste resultaten ter plaatse geven een waarschuwing. Wanneer organisaties agenttools introduceren zonder rekening te houden met de workflow en de omgeving, kan de productiviteit eronder lijden. Uit een gerandomiseerde controlestudie van dit jaar bleek dat ontwikkelaars die AI-ondersteuning gebruikten in een ongewijzigde workflow taken langzamer voltooiden, grotendeels als gevolg van verificatie, herbewerking en verwarring rond de intentie. De les is duidelijk: autonomie zonder orkestratie leidt zelden tot efficiëntie.

Waarom context-engineering de echte oplossing is

Bij elke mislukte implementatie die ik heb waargenomen, kwam de mislukking voort uit de context. Wanneer agenten geen gestructureerd begrip hebben van de codebase, met name relevante modules, afhankelijkheidsgrafieken, testsuites, architecturale conventies en veranderingsgeschiedenis. Ze produceren vaak output die correct lijkt, maar niet overeenkomt met de werkelijkheid. Te veel informatie overweldigt agenten; te weinig dwong hem om te raden. Het doel is niet om het model meer tokens te geven. Het doel is om te bepalen wat zichtbaar moet zijn voor de agent, wanneer en in welke vorm.

Teams die vooruitgang zien, bedoelen dat ze de context als een technisch oppervlak moeten behandelen. Ze maakten apparatuur voor het fotograferen, comprimeren en versiebeheer werkgeheugen van de agent: Wat op zijn beurt wordt bewaard, wat wordt weggegooid, wat wordt gecondenseerd en wat wordt verbonden, niet ingevoegd. Ze ontwerpen deliberatieve stappen, geen aanmoedigingssessies. Ze maken van specificaties een eersteklas artefact, iets dat kan worden beoordeeld, getest en in bezit kan worden genomen, en niet tot een tijdelijke chatgeschiedenis. Deze verschuiving is in lijn met een bredere trend die sommige onderzoekers omschrijven als ‘specificaties die de nieuwe bron van waarheid worden’.

Workflows moeten samen met de tooling veranderen

Maar context alleen is niet genoeg. Bedrijven moeten de workflows rond deze agenten opnieuw ontwerpen. Als McKinsey-rapport 2025 “Eén jaar Agentic AI” Opgemerkt moet worden dat productiviteitsverbeteringen niet voortkomen uit het toepassen van AI op bestaande processen, maar uit het heroverwegen van de processen zelf. Wanneer een team een ​​agent in een onveranderlijke workflow invoegt, leidt dit tot wrijving: ingenieurs besteden meer tijd aan het verifiëren van door AI geschreven code dan aan het zelf schrijven ervan. Agentschappen kunnen alleen maar versterken wat al gestructureerd is: een geteste, modulaire codebasis met duidelijk eigendom en documentatie. Zonder deze basis wordt autonomie chaotisch.

Veiligheid en governance vereisen ook een mentaliteitsverandering. Door AI gegenereerde code introduceert nieuwe vormen van risico: ongecontroleerde afhankelijkheden, subtiele licentieschendingen en ongedocumenteerde modules die aan peer review ontsnappen. Volwassen teams beginnen live agent-activiteiten in hun teams te integreren CI/CD-pijplijnhet behandelen van agenten als autonome bijdragers wier werk dezelfde statische analyse, auditregistratie en goedkeuringspoorten moet doorstaan ​​als elke menselijke ontwikkelaar. De eigen documentatie van GitHub benadrukt dit traject, waarbij Copilot Agents niet worden gepositioneerd als vervanging voor engineers, maar als georkestreerde deelnemers aan veilige, controleerbare workflows. Het doel is niet om de AI ‘alles te laten schrijven’, maar om ervoor te zorgen dat wanneer hij handelt, hij dat binnen bepaalde grenzen doet.

Waar moeten beslissers zich nu op concentreren?

Voor technische leiders begint de weg voorwaarts met paraatheid, niet met hype. Monolieten die niet vaak worden getest, leveren zelden nettowinst op; Agents gedijen goed wanneer testen gezaghebbend is en iteratieve verbeteringen kan aandrijven. Hier is de lus Antropisch bel een codeeragent. Testen in krappe domeinen (het maken van tests, modernisering van bestaande systemen, geïsoleerde refactoring); behandel elke implementatie als een experiment met expliciete statistieken (defectvrijgavepercentage, PR-cyclustijd, foutpercentage van wijzigingen, verwijderde beveiligingsbevindingen). Naarmate uw gebruik groeit, kunt u agenten behandelen als een data-infrastructuur: elk plan, context-snapshot, actielogboek en testrun zijn gegevens die zijn gestructureerd in een doorzoekbaar geheugen van technische doelen en een blijvend concurrentievoordeel.

In wezen is agentcodering geen gereedschapsprobleem, maar een dataprobleem. Elke contextsnapshot, testiteratie en coderevisie wordt een vorm van gestructureerde gegevens die moeten worden opgeslagen, geïndexeerd en hergebruikt. Naarmate deze agenten zich steeds meer verspreiden, zullen bedrijven merken dat ze een geheel nieuwe gegevenslaag moeten beheren: een laag die niet alleen vastlegt wat er is gebouwd, maar ook hoe daarover wordt nagedacht. Deze verschuiving verandert technische logs in kennisgrafieken van intentie, besluitvorming en validatie. Op termijn zullen organisaties die dit contextuele geheugen kunnen zoeken en opnieuw afspelen de organisaties overtreffen die code nog steeds als statische tekst beschouwen.

Het komende jaar zal waarschijnlijk bepalen of agentcodering een hoeksteen van de bedrijfsontwikkeling wordt of een andere belofte. Het verschil zal afhangen van context-engineering: hoe slim het team het informatiesubstraat ontwerpt waarop hun agenten vertrouwen. De winnaars zullen degenen zijn die autonomie niet als iets magisch zien, maar als een verlengstuk van gedisciplineerd systeemontwerp: duidelijke workflows, meetbare feedback en strak bestuur.

Het belangrijkste is

Platforms komen samen op het gebied van orkestratie en vangrails, en onderzoek blijft de contextcontrole op het moment van inferentie verbeteren. De winnaars in de komende 12 tot 24 maanden zullen niet de teams met de meest opvallende modellen zijn; zij zijn degenen die context als een troef ontwikkelen en workflows als producten behandelen. Doe dat, en de autonomie zal toenemen. Sla het gewoon over en de beoordelingswachtrij zal het doen.

Context + agency = hefboomwerking. Als je voorbij de eerste helft komt, valt de rest uiteen.

Dhyey Mavani versnelt generatieve AI op LinkedIn.

Lees meer van ons gastauteur. Of overweeg om uw eigen bericht in te dienen! Bekijk ons richtlijnen hier.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in