Gepresenteerd door AWS
Autonome agenten verkorten de levertijden van software van weken naar dagen. Bedrijven die agents veilig kunnen schalen, zijn bedrijven die bouwen met behulp van spec-driven development.
Er komt bij elke technologische verandering een punt waarop early adopters niet langer uitschieters zijn en groundhogs beginnen te worden. We zitten momenteel midden in de softwareontwikkeling en het grootste deel van het team beseft het nog niet.
Een jaar geleden ging vibratiecodering viraal. Niet-ontwikkelaars en juniorontwikkelaars realiseren zich dat ze met AI hun mogelijkheden kunnen overstijgen. Het verlaagde de vloer. Dit maakt het maken van prototypen veel sneller, maar zorgt ook voor veel vuil water. Wat de industrie destijds nodig had, was iets dat de lat hoger legde: iets dat de kwaliteit van de code verbeterde en werkte zoals de meeste deskundige ontwikkelaars werkten. Specificatiegedreven ontwikkeling kan dit bereiken. Dit legt de basis voor een betrouwbare, autonome codeeragent.
Specificaties zijn een vertrouwensmodel voor autonome ontwikkeling
De meeste discussies over door AI gegenereerde code richten zich op de vraag of AI code kan schrijven. De moeilijkere vraag is of je het kunt geloven. Het antwoord loopt direct via de specificaties.
Op specificaties gebaseerde ontwikkeling begint met een bedrieglijk eenvoudig idee: voordat een AI-agent ook maar één regel code schrijft, werkt deze vanuit een gestructureerde, contextrijke specificatie die definieert wat het systeem moet doen, wat de eigenschappen ervan zijn en wat ‘correct’ eigenlijk betekent. Deze specificaties zijn het artefact waar de agent tijdens het ontwikkelingsproces tegen redeneert – wat fundamenteel verschilt van de pre-agent AI-aanpak van het achteraf schrijven van documentatie.
Het team van het bedrijf bouwt voort op deze basis. Het Kiro IDE-team gebruikte Kiro om Kiro IDE te bouwen – een codeeromgeving voor agenten met native spec-gestuurde ontwikkeling – waardoor het bouwen van functies werd teruggebracht van twee weken naar twee dagen. Het AWS-engineeringteam voltooide een 18 maanden durend re-architectuurproject, waarbij aanvankelijk 30 ontwikkelaars betrokken waren, waarbij zes mensen in 76 dagen Kiro gebruikten. Het technische team van Amazon.com lanceerde “Add to Delivery” – een functie waarmee shoppers na het afrekenen items kunnen toevoegen – twee maanden eerder dan gepland, met behulp van Kiro en spec-gestuurde ontwikkeling. Alexa+, Amazon Finance, Amazon Stores, AWS, Fire TV, Last Mile Delivery, Prime Video en nog veel meer integreren allemaal spec-gedreven ontwikkeling als onderdeel van hun ontwikkelingsaanpak.
Deze verschuiving verandert alles in de downstreamsector.
Verifieerbare tests zorgen ervoor dat autonome agenten veilig kunnen worden uitgevoerd
Specificaties worden geautomatiseerde waarheidsmachines. Wanneer een ontwikkelaar met behulp van AI 150 check-ins per week genereert, is er geen mens meer die dat volume aan code handmatig kan beoordelen. Code die op basis van concrete specificaties is gemaakt, kan daarentegen worden geverifieerd door middel van op eigenschappen gebaseerde tests en neurosymbolische AI-technieken die automatisch honderden testgevallen genereren die rechtstreeks uit die specificaties zijn afgeleid, waarbij wordt gezocht naar randgevallen die een mens nooit met de hand zou schrijven. Deze tests bewijzen dat de code voldoet aan de gespecificeerde eigenschappen van de specificatie en gaan verder dan handgeschreven testsuites om correct gedrag te bewijzen.
Verifieerbaar testen maakt de overstap mogelijk van eenmalige programmering naar continue autonome ontwikkeling. Traditionele, door AI ondersteunde ontwikkeling werkt in één keer: u geeft specificaties aan de agent, de agent produceert een output en het proces eindigt. De agenten van vandaag corrigeren zichzelf voortdurend, introduceren bouw- en testfouten opnieuw in hun eigen redenering, genereren aanvullende tests om hun eigen output te onderzoeken en herhalen totdat ze iets functioneels en verifieerbaars opleveren. De specificatie is een anker dat ervoor zorgt dat de lus niet gaat afdrijven. In plaats van dat ontwikkelaars voortdurend controleren of de agent de juiste beslissingen neemt, kan de agent zichzelf aan de hand van specificaties controleren om er zeker van te zijn dat hij op de goede weg is.
Toekomstige autonome agenten zullen hun eigen specificaties schrijven, waarbij ze de specificaties gebruiken als een zelfcorrigerend mechanisme ter verificatie, om ervoor te zorgen dat wat ze produceren overeenkomt met het gewenste systeemgedrag.
Multi-agent, autonoom en nu actief
De ontwikkelaars die vandaag de dag het tempo bepalen, opereren op een fundamenteel andere manier. Ontwikkelaars besteden veel tijd aan het opstellen van hun specificaties, en aan het schrijven van de stuurbestanden die de specificaties gebruiken om ervoor te zorgen dat agenten weten wat en hoe ze moeten bouwen – meer tijd dan hun agenten besteden aan het bouwen van de daadwerkelijke software. Ze voeren meerdere agenten parallel uit om het probleem vanuit verschillende perspectieven te bekritiseren, en voeren ook meerdere specificaties uit, elk geschreven voor een ander onderdeel van het systeem dat ze bouwen. Ze lieten agenten lange uren werken, soms dagen. Ze gebruiken duizenden Kiro-credits omdat de resultaten passend zijn.
Een jaar geleden verloren agenten hun context en vielen ze na twintig minuten uit elkaar. Nu kunt u het elke week langer uitvoeren dan de week ervoor. De mogelijkheden van agenten zijn de afgelopen zes maanden aanzienlijk verbeterd, zodat werkelijk complexe problemen kunnen worden opgelost. De nieuwere LLM is token-efficiënter dan eerdere generaties, dus voor dezelfde uitgaven krijgt u aanzienlijk meer werk gedaan.
De uitdaging is dat om dit goed te doen diepgaande expertise vereist is. De tools, methodologieën en infrastructuur bestaan, maar het beheer ervan is moeilijk. Het doel van Kiro is om deze mogelijkheden met diepgaande expertise aan elke ontwikkelaar te bieden, en niet alleen aan de top één procent die ze al kent.
Infrastructuur haalt de ambitie in
Agenten zullen binnen een jaar tien keer zo capabel zijn. Dat is het niveau van verbetering dat we week na week zien.
Tegelijkertijd komt de infrastructuur ter ondersteuning van dat vaardigheidsniveau samen. Agenten draaien nu in de cloud, in plaats van lokaal, en draaien parallel op schaal met veilige en betrouwbare communicatie tussen agentsystemen. Organisaties kunnen nu de werklasten van agenten uitvoeren alsof ze gedistribueerde systemen op bedrijfsniveau draaien – met de governance, kostenbeheersing en betrouwbaarheidsgarantie die serieuze software vereist. Op specificaties gebaseerde ontwikkeling is de autonome systeemarchitectuur van de toekomst.
Ontwikkelaars worden niet langer beperkt door de manier waarop ze problemen willen oplossen. De ontwikkelaars die het goed doen in deze wereld zijn degenen die nu op dat fundament voortbouwen: gebruik maken van spec-gestuurde ontwikkeling, vanaf het begin prioriteit geven aan testbaarheid en verificatie, werken met agenten als medewerkers, en denken in systemen, niet in syntaxis.
Deepak Singh is vice-president van Kiro bij AWS.
Gesponsorde artikelen zijn inhoud die is geproduceerd door bedrijven die voor de post hebben betaald of die een zakelijke relatie hebben met VentureBeat, en worden altijd duidelijk als zodanig gemarkeerd. Voor meer informatie kunt u contact opnemen met sales@venturebeat.com.



