Met de recente GPT 5.2-releaseOpenAI werkt andere gerelateerde modellen bij, waaronder het populaire codeermodel Codex, waardoor er meer gebruiksscenario’s voor agenten ontstaan.
GPT-5.2-Codex, genaamd OpenAI in een blogpost “het meest geavanceerde agentcoderingsmodel voor complexe software-ingenieurs in de echte wereld”, is geoptimaliseerd voor langdurig werk met agenten en zal sterkere cyberbeveiligingsmogelijkheden hebben.
Dit model is een vork van GPT-5.2, die is geoptimaliseerd voor het bouwen van agenten.
“GPT-5.2-Codex vertegenwoordigt een stap voorwaarts in de manier waarop geavanceerde AI software-engineering in de echte wereld en gespecialiseerde domeinen zoals cybersecurity kan ondersteunen, waardoor ontwikkelaars en verdedigers complexe langetermijnwerkzaamheden kunnen aanpakken en de tools kunnen versterken die beschikbaar zijn voor verantwoord beveiligingsonderzoek”, aldus het bedrijf in een blogpost.
Het bedrijf heeft toegang tot het nieuwe Codex-model “op alle Codex-platforms voor betaalde ChatGPT-gebruikers, en werkt eraan om de komende weken veilige toegang tot GPT-5.2-Codex voor API-gebruikers mogelijk te maken.” Het bedrijf test ook een programma met vertrouwde gebruikers die alleen worden uitgenodigd om toegang te krijgen tot een “meer tolerant model voor geverifieerde professionals en organisaties” voor defensief cyberbeveiligingswerk om de balans tussen toegankelijkheid en veiligheid te bepalen.
Vooruitgang op het gebied van cyberbeveiliging met modellen
OpenAI noemt GPT-5.2-Codex het sterkste cybersecuritymodel ooit. Naarmate de capaciteiten echter toenemen, zegt het bedrijf dat het een implementatieaanpak moet ontwerpen die rekening houdt met toekomstige groei en defensieve cyberbeveiliging ondersteunt.
“Naarmate onze modellen vooruitgang boeken op het gebied van intelligentie, zien we dat deze verbeteringen ook resulteren in sprongen in capaciteiten op specifieke gebieden zoals cyberbeveiliging”, aldus het bedrijf.
zei Open AI in de systeemkaart dat ze het model op drie benchmarks hebben getest: Capture-the-Flag (CTF) evaluatie, CVE-Bench en Cyber Range.
GPT-5.2-Codex was het best presterende model van het bedrijf in de CTF-evaluatie, wat ze toeschreven aan compactie, of “het vermogen van het model om coherent te presteren in meerdere contextvensters.”
Dit model scoorde 87% op CVE-Bench en presteerde daarmee beter dan de andere modellen, waarbij GPT-5.1-Codex-Max op de tweede plaats kwam. Deze verbeteringen zullen nuttig zijn voor taken waarbij opdrachten worden uitgevoerd rond het ontdekken van kwetsbaarheden en het uitproberen van tools “met een bijna brute force-aanpak.”
Bij langdurige Cyber Range-tests had het model een gecombineerd slagingspercentage van 72,7%. GPT-5.1-Codex-Max scoorde 81,8%.
Implementatieproject cybersecurity
OpenAI zegt dat sommige GPT-5.1-Codex-Max-gebruikers, die in november van start gingontdekte kwetsbaarheden in de broncode in React en rapporteerde deze vervolgens. Volgens OpenAI heeft Andrew MacPherson, beveiligingsonderzoeker bij Privy, GPT-5.1-Codex-Max gebruikt om te beoordelen hoe goed het model kwetsbaarheidsonderzoek in de echte wereld kan ondersteunen. Het model zorgde feitelijk voor onverwacht gedrag.
Met de toenemende cyberbeveiligingsmogelijkheden voor GPT-5.2-Codex en mogelijk toekomstige modellen, zegt OpenAI dat het een evenwicht moet vinden tussen de implementatie van het grensmodel en de tools die nodig zijn voor defensieve cyberbeveiliging. Hoewel GPT-5.2-Codex “geen hoge niveaus van cybercapaciteiten bereikt onder ons Preparedness Framework”, is het bedrijf van plan om geselecteerde gebruikers aan boord te halen om de beveiligingsmogelijkheden te testen. (Open AI Kader voor paraatheid om de potentiële schade van AI aan mensen te meten en te volgen)
“Beveiligingsteams kunnen tegen beperkingen aanlopen als ze proberen zich voor te doen als bedreigingsactoren, malware te analyseren om herstel te ondersteunen of kritieke infrastructuur te testen. We ontwikkelen tests voor vertrouwde toegang om deze barrières voor gekwalificeerde gebruikers en organisaties weg te nemen, en betrouwbare verdedigers in staat te stellen geavanceerde AI-cybermogelijkheden te gebruiken om de cyberverdediging te versnellen.” zei OpenAI.
Grensagent
GPT-5.2 al kreeg lof van gebruikers voor gebruik in zakelijke taken en workflows. Met de Codex-versie kunnen sommige van deze mogelijkheden worden overgedragen, vooral omdat het bedrijf van plan is het model te gebruiken om hun agenten te coderen.
Het bedrijf zegt dat dit model het werk op de lange termijn verbetert door middel van compactie, en sterke prestaties levert bij uitgebreide codewijzigingen. Het biedt ook prestatieverbeteringen op Windows.
Bij benchmarktests heeft GPT-5.2-Codex de beste nauwkeurigheidsprestaties vergeleken met de vorige versie.


“Dankzij deze verbeteringen is Codex beter in staat om in grote repository’s te werken gedurende langere sessies, waarbij de volledige context intact blijft. Codex kan complexe taken zoals grote refactorings, codemigraties en feature-builds betrouwbaarder uitvoeren – voortdurend itererend zonder het overzicht te verliezen, zelfs als plannen veranderen of inspanningen mislukken”, aldus OpenAI.
Sinds de lancering in voorproefje in meiCodex heeft geholpen bij het inluiden van de acceptatie van agentcodering en levendigheid op het gebied van zakelijke AI-makers. Samen met Windsurf, Cursor, Claude Code en vele codeerbureaus van Google brengt dit platform LLM over van het eenvoudig voltooien van code naar het genereren en initiëren van asynchrone codeerprojecten voor gebruikers.



