Home Nieuws OpenAI verbetert zijn Responses API om de vaardigheden van agenten en een...

OpenAI verbetert zijn Responses API om de vaardigheden van agenten en een complete terminalshell te ondersteunen

1
0
OpenAI verbetert zijn Responses API om de vaardigheden van agenten en een complete terminalshell te ondersteunen

Tot voor kort leek de praktijk van het bouwen van AI-agenten op het trainen van langeafstandslopers met een geheugen van dertig seconden.

Ja, je kunt je AI-model tools en instructies geven, maar na enkele tientallen interacties – een paar ronden op de baan, om uit te breiden op onze hardloopanalogie – zal het onvermijdelijk de context verliezen en gaan hallucineren.

Met De nieuwste updates van OpenAI daarom Reactie-API – een applicatieprogrammeringsinterface waarmee ontwikkelaars op het OpenAI-platform met één enkele oproep toegang kunnen krijgen tot een verscheidenheid aan agenttools, zoals zoeken op internet en bestanden zoeken – het bedrijf geeft aan dat het tijdperk van beperkte agenten aan het vervagen is.

De vandaag aangekondigde updates omvatten Server Side Compaction, Hosted Shell Containers en “Vaardigheden“normen voor agenten.

Met deze drie belangrijke updates biedt OpenAI agenten effectief permanente bureaus, terminals en geheugen dat niet vervaagt en agenten helpt zich verder te ontwikkelen tot betrouwbare digitale werkers voor de lange termijn.

Technologie: ‘contextgeheugenverlies’ overwinnen

Het belangrijkste technische obstakel voor autonome agenten is de ‘rommeligheid’ van langetermijntaken. Elke keer dat een agent een tool aanroept of een script uitvoert, groeit de gespreksgeschiedenis.

Uiteindelijk bereikt het model zijn tokenlimiet en worden ontwikkelaars gedwongen de geschiedenis ervan in te korten, waarbij vaak de ‘reden’ wordt verwijderd die de agent nodig heeft om de klus te klaren.

Het antwoord van OpenAI is Server Side Compaction. In tegenstelling tot eenvoudig snijden, zorgt verdichting ervoor dat agenten uren of zelfs dagen kunnen werken.

Voorlopige gegevens van e-commerceplatforms Drievoudige walvis voorgesteld dit was een doorbraak op het gebied van stabiliteit: hun agent, Moby, navigeerde met succes door een sessie met 5 miljoen tokens en 150 tooloproepen zonder dat de nauwkeurigheid daalde.

In praktische termen betekent dit dat het model zijn acties uit het verleden kan ‘samenvatten’ in een gecomprimeerde staat, waardoor de belangrijke context levend blijft en ruis wordt geëlimineerd. Hierdoor verandert het model van een vergeetachtige assistent naar een volhardend systeemproces.

Beheerde cloud-sandbox

De introductie van Shell Tools verplaatst OpenAI naar het domein van managed computing. Ontwikkelaars kunnen nu kiezen container_auto, die een door OpenAI gehoste Debian 12-omgeving biedt.

Het is niet zomaar een codevertaler: het biedt elke agent een complete terminalomgeving, vooraf geladen met:

  • Native uitvoeringsomgeving inclusief Python 3.11, Node.js 22, Java 17, Go 1.23 en Ruby 3.1.

  • Aanhoudende opslag door /mnt/datastelt agenten in staat artefacten te maken, op te slaan en te downloaden.

  • Netwerkmogelijkheden waarmee agenten het internet kunnen bereiken om bibliotheken te installeren of te communiceren met API’s van derden.

Hosted Shell en zijn volharding /mnt/data storage biedt een beheerde omgeving waarin agenten complexe datatransformaties kunnen uitvoeren met behulp van Python of Java zonder dat teams voor elk AI-project aangepaste ETL-middleware (Extract, Transform, Load) hoeven te bouwen en te onderhouden.

Door gebruik te maken van deze gehoste containers kunnen data-ingenieurs hoogwaardige gegevensverwerkingstaken implementeren en tegelijkertijd de “aansprakelijkheid” minimaliseren die gepaard gaat met het beheren van op maat gemaakte infrastructuur, het elimineren van extra ontwikkelingskosten en het beveiligen van hun eigen sandbox. OpenAI zegt feitelijk: ‘Geef ons de instructies; wij zorgen voor de computer.’

OpenAI-vaardigheden versus antropische vaardigheden

Hoewel OpenAI hard op weg is naar een uniforme agent-orkestratiestack, wordt het geconfronteerd met aanzienlijke filosofische uitdagingen op het gebied van Anthropic Agent Skills.

Beide bedrijven zijn geconvergeerd op een zeer vergelijkbare bestandsstructuur – met behulp van a SKILL.md (markdown) manifesteert zich met een YAML-frontmaterie, maar de onderliggende strategie onthult een andere visie op de toekomst van werk.

De aanpak van OpenAI geeft prioriteit aan een “programmeerbaar substraat” dat is geoptimaliseerd voor de snelheid van ontwikkelaars. Door shell, geheugen en vaardigheden te combineren in de Responses API, bieden ze een kant-en-klare ervaring voor het snel bouwen van complexe agenten.

Al een onderneming op het gebied van AI-zoekopdrachten Ophalen rapporteerde een toename in de gereedschapsnauwkeurigheid van 73% naar 85% met behulp van het OpenAI Skills-framework.

In plaats daarvan heeft Anthropic Agent Skills gelanceerd als een onafhankelijke open standaard (agentskills.io).

Hoewel het OpenAI-systeem nauw geïntegreerd is in de cloudinfrastructuur, zijn de vaardigheden van Anthropic ontworpen voor draagbaarheid. Vaardigheden die voor Claude zijn gebouwd, kunnen theoretisch worden geporteerd naar VS Code, Cursor of elk ander platform dat de specificatie overneemt.

Het is waar, een succesvolle nieuwe open source AI-agent Open klauwen dit op de juiste manier overnemen SKILL.md manifest- en mapgebaseerde verpakkingen, waardoor het een schat aan gespecialiseerde procedurele kennis kan erven die oorspronkelijk voor Claude was ontworpen.

Deze architecturale compatibiliteit heeft geleid tot een op de gemeenschap gebaseerde ‘vaardigheidsgroei’ op platforms als ClawHub, die nu meer dan 3.000 door de gemeenschap gebouwde uitbreidingen host, variërend van slimme thuisintegratie tot complexe bedrijfsworkflowautomatisering.

Deze kruisbestuiving laat zien dat ‘vaardigheden’ draagbare en versiebeheerde middelen zijn geworden, en geen door de leverancier vergrendelde functies. Omdat OpenClaw meerdere modellen ondersteunt, waaronder de GPT-5-serie van OpenAI en lokale Llama-instanties, kunnen ontwikkelaars nu een vaardigheid één keer schrijven en deze in heterogene agentlandschappen inzetten.

Voor technische besluitvormers zijn deze open standaarden uitgegroeid tot de voorkeursmanier van de industrie om ‘agentkennis’ te externaliseren en te delen, waarbij de propriëtaire eisen worden overstegen naar een gedeelde, controleerbare en interoperabele infrastructuur.

Maar er zijn nog meer belangrijke verschillen tussen OpenAI en Anthropic “Skills”.

OpenAI maakt gebruik van Server-side Compaction om de actieve status van langlopende sessies te beheren. Anthropic maakt gebruik van Progressive Disclosure, een systeem met drie niveaus waarbij het model in eerste instantie alleen de naam en beschrijving van de vaardigheid kent.

Volledige details en aanvullende scripts worden alleen geladen als de taak dit specifiek vereist. Hierdoor kan een enorme bibliotheek aan vaardigheden – merkrichtlijnen, juridische checklists en codesjablonen – bestaan ​​zonder het werkgeheugen van het model te belasten.

Implicaties voor technische besluitvormers van bedrijven

Voor ingenieurs die zich richten op “snelle implementatie en verfijning” biedt de combinatie van Compaction en Server Side Skills een grote productiviteitsverbetering

In plaats van aangepast statusbeheer te bouwen voor elke uitgevoerde agent, kunnen technici gebruikmaken van ingebouwde compactie om taken uit te voeren die uren in beslag nemen.

Vaardigheden maken ‘verpakte IP’ mogelijk, waarbij specifieke aanpassingen of gespecialiseerde procedurele kennis kunnen worden gemodulariseerd en hergebruikt in meerdere interne projecten.

Voor degenen die belast zijn met het verplaatsen van AI van ‘babbelboxen’ naar workflows op productieniveau: de aankondiging van OpenAI markeert het einde van het tijdperk van ‘op maat gemaakte infrastructuur’.

Historisch gezien vereiste het beheren van agenten aanzienlijke handmatige ondersteuning: ontwikkelaars moesten aangepaste statusbeheerlogica bouwen om lange gesprekken af ​​te kunnen handelen en tijdelijke sandboxes te beveiligen voor het uitvoeren van code.

De uitdaging is niet langer: “Hoe krijg ik de terminal bij deze agent?” maar “Welke vaardigheden zijn geautoriseerd voor welke gebruikers?” en “Hoe controleren we artefacten die zijn gegenereerd op gehoste bestandssystemen?” OpenAI heeft de motor en het chassis geleverd; de taak van de orkestrator is nu om verkeersregels vast te stellen.

Voor managers van beveiligingsoperaties (SecOps) is het bieden van shell- en netwerktoegang tot AI-modellen een evolutie met hoog risico. OpenAI’s gebruik van domeingeheimen en organisatorische machtigingslijsten biedt een diepgaande verdedigingsstrategie, die ervoor zorgt dat agenten API’s kunnen aanroepen zonder ruwe inloggegevens bloot te stellen aan de modelcontext.

Maar nu agenten gemakkelijker kunnen worden ingezet via ‘Skills’, moet SecOps op zijn hoede zijn voor ‘gevaarlijke vaardigheden’ die snelle injectiekwetsbaarheden of ongeoorloofde gegevenssmokkelroutes kunnen introduceren.

Hoe moeten bedrijven beslissingen nemen?

OpenAI verkoopt niet langer alleen ‘hersenen’ (modellen); het verkoopt ‘kantoren’ (containers), ‘herinneringen’ (verdichting) en ‘trainingsgidsen’ (vaardigheden). Voor bedrijfsleiders wordt de keuze duidelijk:

  • Kies OpenAI als u een geïntegreerde, snelle omgeving nodig heeft voor langdurig autonoom werk.

  • Kies Anthropic als uw organisatie model-agnostische portabiliteit en open ecosysteemstandaarden vereist.

Uiteindelijk geeft de aankondiging aan dat AI zich uit de chatbox begint te verplaatsen naar de systeemarchitectuur, waardoor ‘snelle spaghetti’ wordt omgezet in onderhoudbare, versiebare en schaalbare zakelijke workflows.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in