Home Nieuws GPT-5.3-Codex OpenAI denkt dieper en breder na over codeerwerk

GPT-5.3-Codex OpenAI denkt dieper en breder na over codeerwerk

3
0
GPT-5.3-Codex OpenAI denkt dieper en breder na over codeerwerk

Donderdag werd OpenAI uitgebracht GPT-5.3-Codexeen nieuw model dat het codeerbureau Codex uitbreidt van alleen het schrijven en beoordelen van code naar het uitvoeren van een breder scala aan taken. Deze lancering vond plaats toen de concurrentie tussen hen steeds heviger werd kunstmatige intelligentie Bedrijven concurreren om marktaandeel op het gebied van AI-aangedreven codeertools.

OpenAI zegt dat GPT-5.3 de codeerprestaties van GPT-5.2-Codex combineert met de professionele redeneer- en kennismogelijkheden van GPT-5.2, terwijl het 25% sneller werkt. Hierdoor kan GPT-5.3-Codex langetermijntaken uitvoeren die onderzoek, gebruik van tools zoals surfen op het web of databaseoproepen omvatten, evenals complexe uitvoering en planning van zowel algemene werkopdrachten als softwareontwikkeling.

Codex heeft meer dan 1 miljoen ontwikkelaars bereikt, beweert OpenAI. Hoewel de Claude Code van Anthropic ook snel is overgenomen, zijn gegevens die de twee tools vergelijken schaars. Semi-analyse rapport dat 4% van de publieke commits van GitHub, of nieuwe code die naar de repository wordt geüpload, momenteel wordt gemaakt door Claude Code, en er wordt geschat dat dit cijfer eind 2026 20% of meer zou kunnen bereiken.

Benchmarks van uitmuntendheid

OpenAI zegt dat GPT-5.3-Codex nu de beste score heeft van elk model in SWE-Bench Pro, een benchmark die software-engineering in de echte wereld in vier programmeertalen evalueert. Hetzelfde geldt voor Terminal-Bench 2.0, dat meet welke terminalvaardigheden codeeragenten nodig hebben.

Anthropic zegt dat dit nieuw is Claude Opus-model 4.6dat ook donderdag werd aangekondigd, behaalde topscores op verschillende branchebenchmarks, waaronder Humanities Final Test (complex multidisciplinair redeneren), GDPval-AA (economisch waardevol kenniswerk) en BrowserComp (moeilijk te vinden informatie zoeken).

OpenAI zegt dat zijn nieuwe model in staat is om bij het werken aan een taak rekening te houden met grotere hoeveelheden informatie, en om langere tijd over die taken na te denken zonder menselijke tussenkomst. Tijdens het testen zei OpenAI dat het GPT-5.3-Codex autonoom de game-ontwikkeling over miljoenen tokens zag herhalen met behulp van algemene opdrachten zoals ‘fix bug’ of ‘game verbeteren’.

Op dezelfde manier zegt Anthropic dat het nieuwe Opus 4.6-model grotere codebases kan begrijpen en verstandigere beslissingen kan nemen over het toevoegen van nieuwe code.

OpenAI zegt dat GPT-5.3-Codex is gemaakt om de volledige levenscyclus van software te ondersteunen, inclusief het debuggen, implementeren en monitoren van code, evenals het schrijven van productvereistendocumenten en het uitvoeren van onderzoek.

Van coderen naar kenniswerk

Dezelfde agentmogelijkheden die de codeervaardigheden van Codex uitbreiden, kunnen worden toegepast op taken buiten het domein van softwareontwikkeling, aldus OpenAI, en breiden zich uit tot functies zoals het maken van diapresentaties en het analyseren van gegevens in spreadsheets.

In GDPval, een OpenAI-evaluatie die de prestaties meet op goed gedefinieerde kenniswerktaken voor 44 banen, komt GPT-5.3-Codex overeen met GPT-5.2 en worden krachtigere codeermogelijkheden toegevoegd. Op OSWorld-Verified, dat computergebruik in een visuele desktopomgeving test, behaalde GPT-5.3-Codex een nauwkeurigheid van 64,7%, vergeleken met 38,2% voor zijn voorganger.

Anthropic heeft zijn Claude Code-tool in dezelfde richting gestuurd: om meer informatiewerkers te helpen met een veel bredere reeks zakelijke taken.

GPT-5.3-Codex is het eerste model dat OpenAI classificeert als “zeer capabel” voor cybersecurity-gerelateerde taken op basis van het Preparedness Framework, en het eerste model dat rechtstreeks door het bedrijf is getraind om softwarekwetsbaarheden te identificeren. OpenAI verstrekt $10 miljoen aan API-credits (Application Programming Interface) om de cyberverdediging te versnellen, met name voor open source-software en kritieke infrastructuursystemen.

GPT-5.3-Codex is nu beschikbaar voor betalende ChatGPT-klanten in de Codex-app, in de opdrachtregelinterface, als IDE-extensie en op internet. OpenAI zei dat het eraan werkt om snel API-toegang (gebruikt door bedrijven en onafhankelijke ontwikkelaars) tot het model mogelijk te maken.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in