De meeste orkestratieframeworks zijn gebouwd voor agenten die seconden of minuten actief zijn. Nu die agent een uurtje gelopens – en binnen enkele dagen – begon het raamwerk te barsten.
Sommige modelaanbieders, zoals Anthropic met Claude Code en OpenAI met Codex, introduceren initiële ondersteuning voor langlopende agenten via taken met meerdere sessies, subagenten en uitvoering op de achtergrond. Deze systemen gaan er echter soms van uit dat agenten nog steeds in tijdsgelimiteerde workflows werken, zelfs als deze gedurende langere perioden actief zijn.
Open source-modelaanbieder Moonshot AI wil verder gaan dan dat met zijn nieuwe model, de Kimi K2.6.
Moonshot zegt dat het model is ontworpen voor continue uitvoering, met interne gebruiksscenario’s, waaronder agenten die urenlang en in één geval vijf opeenvolgende dagen draaien, waarbij de monitoring en incidentrespons autonoom worden afgehandeld.
Maar het toenemende gebruik van dit soort agenten legt een kritieke leemte in de orkestratie bloot: de meeste orkestratieframeworks zijn niet ontworpen voor dit soort continue, stateful uitvoering. Open source-modellen, zoals Kimi K2.6, die afhankelijk zijn van zwermen agenten, laten zien dat hun orkestratiebenadering dicht in de buurt komt van state-of-the-art agentmanagement.
Moeilijkheden bij het beheren van agenten die al een lange tijd actief zijn
Hoewel het waar is dat sommige bedrijven er de voorkeur aan geven hun eigen orkestratieraamwerk in hun agenten-ecosysteem te brengen, erkennen aanbieders van agentmodellen en -platforms dat het aanbieden van agentmanagement een concurrentievoordeel blijft.
Andere modelaanbieders zijn begonnen met het verkennen van langlopende agents, waarvan vele via multi-sessietaken en uitvoering op de achtergrond. Claude Code van Anthropic stelt bijvoorbeeld agenten in de belangrijkste regisseur andere agenten op basis van een reeks door de gebruiker geïnstrueerde definities. OpenAI-codex gaat op dezelfde manier.
Kimi K2.6 benadert orkestratie met een verbeterde versie van Agent Swarms, die in staat is om maximaal 300 subagenten te beheren “die 4.000 gecoördineerde stappen tegelijkertijd uitvoeren”, Moonshot AI schreef in een blogpost. Vergeleken met Claude Code en Codex vertrouwt K2.6 op modellen, in plaats van op vooraf gedefinieerde rollen, om de orkestratie te bepalen.
Kimi K2.6 is nu beschikbaar op Hugging Face, via API, Kimi Code en de Kimi-app.
Beoefenaars die experimenteren met langwerkende middelen zeggen dat de kwetsbaarheid dieper zit dan met hulp kan worden gecorrigeerd.
Zoals een beoefenaar zei, Maxim Saplin een blogpost“Dat betekent niet dat de subagenten nutteloos zijn. Het betekent dat de orkestratie nog steeds kwetsbaar is. Op dit moment voelt dit meer als een product- en trainingsprobleem dan als iets dat je kunt oplossen door een commando te schrijven dat sterk genoeg is.”
Het probleem van langetermijnagenten is dat het moeilijk is hun status te behouden, vooral omdat hun omgeving voortdurend verandert terwijl zij hun taken uitvoeren. Agenten zullen tijdens runtime voortdurend verschillende tools en API’s aanroepen of verschillende databases gebruiken. De meeste agenten van tegenwoordig, die één of twee executies kunnen uitvoeren, roepen verschillende tools aan, maar maximaal één minuut.
Mark Lambert, chief product officer bij ArmorCode, dat autonome beveiligingsplatforms voor ondernemingen bouwt, vertelde VentureBeat in een e-mail dat de governancekloof verder gaat dan de implementatie.
“Deze agentsystemen kunnen nu sneller code- en systeemwijzigingen genereren dan de meeste organisaties deze kunnen beoordelen, repareren of beheren. Dit vereist meer dan alleen extra scannen. Organisaties zullen sterkere AI-governance nodig hebben die de context, prioritering en verantwoordelijkheid biedt die teams nodig hebben om Kimi en andere risico’s van AI te beheren voordat deze risico’s veranderen in geaccumuleerde blootstellingen”, aldus Lambert.
Langlopende bureaus kunnen ook het risico lopen om te falen zonder duidelijke tegenslag. Het belangrijkste is dat dit soort agenten vaak geen goed gedefinieerde reeks taken hebben en hun plannen dynamisch aanpassen terwijl ze worden uitgevoerd.
Kunal Anand, chief product officer bij F5, vertelde VentureBeat via e-mail dat langetermijnagenten een veel grotere architecturale verschuiving vertegenwoordigen dan waar de meeste bedrijven op voorbereid zijn.
“We zijn overgestapt van scripts naar services, containers naar functies en nu naar agents als persistente infrastructuur. Hierdoor zijn categorieën ontstaan die we nog niet goed hebben benoemd: agent runtime, agent gateway, agent identiteitsprovider, agent mesh. Het API-gatewaypatroon verandert naar een patroon dat doelen en workflows moet begrijpen, niet alleen eindpunten en werkwoorden”, zegt Anand.
13 uur of zelfs vijf dagen hardlopen
Het begrijpen van hoe agenten moeten worden georganiseerd is belangrijk geworden nu modelmogelijkheden de orkestratie-innovatie beginnen te overstijgen, zelfs nu bedrijven langetermijnagenten beginnen te overwegen.
Moonshot AI zegt dat het model is gebouwd voor taken die ‘uitdagingen uit de echte wereld weerspiegelen die doorgaans weken of maanden van collectieve menselijke inspanning vergen’. In een afzonderlijk technisch document dat aan VentureBeat is verstrekt, beweert Moonshot dat K2.6 in 10 uur een complete SysY-compiler van de grond af heeft gebouwd – werk dat wordt beschouwd als twee maanden duren voor een team van vier ingenieurs – en alle 140 functionele tests heeft doorstaan zonder menselijke tussenkomst.
Het team paste K2.6 toe voor complexe technische taken, waaronder het reviseren van een acht jaar oude open source engine voor financiële matching. De ingenieurs van Moonshot beschreven een 13 uur durende uitvoering waarbij “iteratief 12 optimalisatiestrategieën werden doorlopen, waarbij meer dan 1.000 tool-oproepen werden geïnitieerd om meer dan 4.000 regels code nauwkeurig aan te passen.”
Moonshot zegt dat een van zijn teams K2.6 gebruikte om een agent te bouwen die vijf dagen lang autonoom kon werken. De agent beheert de monitoring, incidentrespons en systeembewerkingen.



