Home Nieuws Instant GPT-5.3 vermindert hallucinaties met 26,8% omdat OpenAI de focus verschuift van...

Instant GPT-5.3 vermindert hallucinaties met 26,8% omdat OpenAI de focus verschuift van snelheid naar nauwkeurigheid

2
0
Instant GPT-5.3 vermindert hallucinaties met 26,8% omdat OpenAI de focus verschuift van snelheid naar nauwkeurigheid

OpenAI’s Instant GPT-5.3 – het meest gebruikte model van het bedrijf – vermindert hallucinaties met 26,8% vergeleken met zijn voorganger, door prioriteit te geven aan gespreksnauwkeurigheid en betrouwbaarheid boven ruwe prestatieverbeteringen, aldus OpenAI.

Instant GPT-5.3, wat in wezen het standaardmodel is en het model dat het meest wordt gebruikt door ChatGPT-gebruikers, verbetert ook de toon, relevantie en conversatie met minder weerstand. Het is beschikbaar in ChatGPT en API.

Momenteel wordt alleen het Instant-model geüpgraded naar 5.3, maar het bedrijf zegt dat het eraan werkt om andere modellen onder ChatGPT, Thinking en Pro “binnenkort” te updaten naar 5.3.

GPT-5.3 Vermindert hallucinaties onmiddellijk met 26,8%

OpenAI voerde twee interne evaluaties uit: één voor domeinen met een hoog risico, waaronder geneeskunde, financiën en recht; andere zijn gebaseerd op feedback van gebruikers.

Gebaseerd op een high-stakes evaluatie uitgevoerd door het bedrijf, vermindert Instant GPT-5.3 hallucinaties met 26,8% bij gebruik van internet. Het verhoogt de betrouwbaarheid met 19,7% als het vertrouwt op de interne kennis. Uit gebruikersfeedback blijkt dat het aantal hallucinaties met 22,5% afneemt bij het beantwoorden van vragen via internetzoekopdrachten.

Het bedrijf zegt dat Instant GPT-5.3 betrouwbaarder is omdat het de manier verbetert waarop het informatie van internet in evenwicht brengt met zijn eigen interne training en redenering.

“In bredere zin is het minder waarschijnlijk dat GPT-5.3 Instant webresultaten overindexeert, wat voorheen kon leiden tot lange lijsten met links of losjes verbonden informatie. GPT-5.3 Instant is beter in staat om de subtekst van vragen te herkennen en de belangrijkste informatie naar boven te halen, vooral in het begin, wat resulteert in antwoorden die relevanter en direct bruikbaar zijn, zonder dat dit ten koste gaat van snelheid of toon”, aldus het bedrijf.

Een voorbeeld dat OpenAI gaf was toen een gebruiker vroeg naar de grootste aanwinsten in de Major League Baseball en hun impact. Het vorige model, GPT-5.2, vatte de zoekresultaten vaak standaard samen.

Nauwkeurigheid overtreft prestaties als het verkoopargument van OpenAI

Met deze nieuwe release, het eerste veelgebruikte model, wil OpenAI zakelijke klanten en andere ChatGPT-gebruikers laten begrijpen dat het strijdtoneel niet alleen gaat over hoe goed een model presteert, maar ook over hoe goed het zich kan houden aan feitelijke informatie. In plaats van zich te concentreren op prestatiestatistieken zoals snelheid en tokenbesparingen, vertrouwt het bedrijf meer op de betrouwbaarheid van Instant GPT-5.3.

Concurrenten als Google en Anthropic prijzen ook de hogere nauwkeurigheid van hun nieuwe modellen aan. Anthropic zegt dat het nieuw is Claude Sonnetten 4.6 had minder hallucinaties, terwijl Google daartoe gedwongen werd trek het Gemma 3-model eruit na het hallucineren van valse informatie over een parlementslid.

GPT-5.3 Terugbellen onmiddellijke afwijzing en “ineenkrimpen” toon.

“Deze update richt zich op de onderdelen van de ChatGPT-ervaring die mensen elke dag ervaren: toon, relevantie en gespreksstroom. Dit zijn problemen die niet altijd in benchmarks voorkomen, maar bepalen of ChatGPT nuttig of frustrerend aanvoelt. GPT-5.3 Instant weerspiegelt gebruikersfeedback op deze gebieden direct”, OpenAI zei in een blogpost.

GPT-5.3 Instant heeft een meer natuurlijke gespreksstijl, blijf weg van wat OpenAI beweert is een “cringy” toon die arrogant overkomt en aannames doet over de bedoelingen van de gebruiker. Het bedrijf merkt op dat het ervoor zal zorgen dat de persoonlijkheid van het chatplatform consistenter is in alle updates, zodat gebruikers geen verandering in toon zullen ervaren wanneer ze met modellen praten.

Dit nieuwe model vermindert de afstoting aanzienlijk. OpenAI zei dat eerdere modellen vaak weigerden vragen te beantwoorden, zelfs als de vragen geen beperkingen schendten. Soms antwoordde het voormalige model ‘op een manier die overdreven voorzichtig of prekerig aanvoelde, vooral als het om gevoelige onderwerpen ging’.

Het bedrijf belooft dat GPT-5.3 niet hetzelfde zal doen en “overdreven defensieve of moralistische preambules” zal verminderen. Dit betekent dat het model direct antwoordt, zonder waarschuwing, zodat gebruikers het gesprek niet beëindigen zonder antwoord op hun vraag.

Desondanks kampt Instant GPT-5.3 nog steeds met enkele beperkingen, vooral in sommige talen zoals Koreaans en Japans, waar de antwoorden nog steeds onhandig klinken.

De veiligheidskaart liet een achteruitgang zien in de categorieën seksuele inhoud en zelfbeschadiging

Het nieuwe model ontbeert ondersteuning voor inhoud voor volwassenen, zei een woordvoerder van OpenAI in een e-mail aan VentureBeat, omdat het bedrijf nog steeds aan het uitzoeken is “hoe de gebruikersvrijheid kan worden gemaximaliseerd met behoud van onze hoge beveiligingsnormen.” OpenAI heeft geen tijdlijn voor wanneer de functionaliteit zal worden vrijgegeven.

OpenAI voerde beveiligingsbenchmarks uit op het nieuwe model en hield hiermee rekening veiligheidskaart dat hoewel het goed presteert tegen verboden inhoud, de prestaties nog steeds niet op het niveau van Instant GPT-5.2 liggen. OpenAI merkt echter op dat deze resultaten na de lancering kunnen veranderen.

“Instant GPT-5.3 vertoonde regressie ten opzichte van Instant GPT-5.2 en Instant GPT-5.1 voor niet-toegestane seksuele inhoud, en ten opzichte van Instant GPT-5.2 voor zelfbeschadiging op zowel standaard als dynamische evaluaties”, aldus het bedrijf.

In andere categorieën zei OpenAI dat het model vergelijkbaar of beter presteerde dan eerdere releases, en merkte op dat regressies voor expliciet geweld en illegaal gewelddadig gedrag een lage statistische significantie hadden.

Binnenkort een nieuw model verwachten?

Na de aankondiging van Instant GPT-5.3 en het opmerken dat er binnenkort updates voor Thinking en Pro zouden komen, plaagde OpenAI dat de nieuwe modellen mogelijk niet meer leverbaar zouden zijn.

In een bericht op XOpenAI zegt dat GPT-5.4 ‘eerder komt dan je denkt’.

OpenAI heeft niet gedetailleerd welke veranderingen we eventueel kunnen verwachten met GPT-5.4 en welke modi deze als eerste zullen krijgen.

Instant GPT-5.2, zijn voorganger, blijft beschikbaar in de ChatGPT-modelkiezer tot 3 juni, waarna het wordt stopgezet.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in