OpenAI heeft donderdag zijn antwoord vrijgegeven op het indrukwekkende Gemini 3 Pro-model van Google–GPT-5.2– en op basis van de onderlinge benchmarktestresultaten lijkt het erop dat het een winnaar is. Het nieuwe model behaalde topscores op een aantal benchmarktests op het gebied van coderen, wiskunde, wetenschap, gereedschapsgebruik en visie. (Benchmarks moeten uiteraard worden gecombineerd met gebruik in de echte wereld om het hele verhaal te vertellen. Maar toch…)
OpenAI zegt dat GPT-5.2, een redeneermodel, prestatiescores op expertniveau behaalde op zijn eigen GDPval-benchmark, die de prestaties evalueert op 44 echte professionele taken, waaronder zaken als het maken van spreadsheets, het opstellen van documenten, het maken van presentaties en meer.
GPT-5.2 presteerde beter dan de Gemini 3 Pro op de SWE-Bench Pro benchmark (software-engineeringtaken) met een score van 55,6% (versus de Gemini 3 Pro’s 43,3%). Het behaalde 86,2% op de ARC-AGI-1 benchmark voor abstract redeneren, vergeleken met de 75% score van de Gemini 3 Pro. Het scoorde 92,4% op de GPQA Diamond-benchmark (wetenschappelijke vragen), vergeleken met de Gemini 3 Pro-score van 91,9%.
Dit nieuwe model is verkrijgbaar in drie varianten. Instant GPT-5.2 is geschikt voor het zoeken naar informatie en begeleiding, het ontwikkelen en leren van vaardigheden en loopbaanbegeleiding. GPT-5.2 Think is geschikt voor moeilijkere professionele taken, zoals het opmaken van spreadsheets en het maken van diavoorstellingen. GPT-5.2 Pro duurt volgens het bedrijf langer om antwoorden te genereren, maar is het “slimste en meest vertrouwde” model voor het genereren van nauwkeurige antwoorden in complexe domeinen zoals programmeren.
Voor de vele ontwikkelaars die nu agents ontwikkelen, zegt OpenAI dat GPT-5.2 met redenering het sterkste aanbod is, dat “significante verbeteringen oplevert op het gebied van algemene intelligentie, begrip van lange contexten, het aanroepen van agenttools en visie.”
OpenAI dringt naar verluidt aan op de release van GPT-5.2 vóór het einde van het jaar om de release van Google’s Gemini 3 te evenaren. Het bedrijf bracht GPT-5 in augustus uit, wat het de volgende grote sprong in zijn technologie maakt. AI onderzoek. GPT-5 is een model-‘systeem’ dat gebruik maakt van ‘routers’ om passende vragen naar specifieke modellen te sturen. GPT-5.2 verwijst naar “een geïntegreerd systeem dat automatisch kiest hoe te reageren op basis van de complexiteit van de taak.”
De grotere capaciteit van het GPT-5.2-model bij het verwerken en overwegen van multimodale invoer (audio, video, afbeeldingen, tekst, enz.) is aanzienlijk, aangezien Google Gemini 3 dit heel goed doet.
Het nieuwe model is bijvoorbeeld nodig om de kenmerken van een printplaatafbeelding te analyseren en vervolgens alle kleine componenten te identificeren en te labelen. OpenAI zegt dat GPT-5.2 dit met meer details en nauwkeurigheid doet dan eerdere GPT-5.1-modellen. Wanneer redeneren wordt geïntroduceerd, kunnen modellen mogelijk problemen in mechanische systemen diagnosticeren door visuele signalen te herkennen.
Alle drie de varianten van GPT-5.2 zijn momenteel beschikbaar op ChatGPT, te beginnen met betaalde klanten en beschikbaar voor ontwikkelaars via API. Microsoft, een grote investeerder in OpenAI, zei dat het nu GPT-5.2 naar Microsoft 365 Copilot- en Copilot Studio-gebruikers over de hele wereld brengt.



