Home Nieuws Anthropic Claude Opus 4.7 release: hoe het te proberen, benchmarks, beveiliging

Anthropic Claude Opus 4.7 release: hoe het te proberen, benchmarks, beveiliging

3
0
Anthropic Claude Opus 4.7 release: hoe het te proberen, benchmarks, beveiliging

Antropisch heeft in 2026 producten verzonden en nieuws gemaakt in 2026, en donderdag kondigde het AI-bedrijf de lancering aan van Claude Opus 4.7.

De Claude Opus 4.7 is het slimste antropische model dat beschikbaar is voor het grote publiek. Speciaal, Dat zegt Antropik in haar persbericht Opus 4.7 is het Nee zo sterk als Claude Mythos, namelijk Antropisch werd als te gevaarlijk beschouwd voor publieke vrijgave.

Claude Opus is een familie van hybride redeneermodellen die in staat zijn tot redeneren in meerdere stappen en geavanceerde codering. Tot Claude Mythos-aankondiging op 7 april werd Claude Opus beschouwd als Anthropic’s meest geavanceerde set AI-modellen.

Mis onze nieuwste verhalen niet: Voeg Mashable toe als vertrouwde nieuwsbron op Google.

Hoe Claude Opus 4.7 proberen?

Claude Opus 4.7 is nu verkrijgbaar via Claude A.IClaude API en Anthropic-partners zoals Microsoft Foundry. Het nieuwe model is de prijs is hetzelfde zoals Claude Opus 4.6.

Anthropic merkt echter op dat, omdat “Opus 4.7 meer nadenkt bij hogere inspanningsniveaus”, het meer outputtokens gebruikt dan zijn voorganger. Gebruikers kunnen meer lezen over het optimaliseren van het tokengebruik op Migratiegids voor Opus 4.7.

Hoe Claude Opus 4.7 verbetert ten opzichte van 4.6

Zoals verwacht biedt Claude Opus 4.7 over de hele linie verbeterde mogelijkheden.

Concreet zegt Anthropic dat Claude Opus 4.7 beter is in geavanceerde codeertaken, visuele intelligentie en documentanalyse. Anthropic zegt ook dat Opus 4.7 “boeiender en creatiever is bij het voltooien van professionele taken en het produceren van interfaces, dia’s en documenten van hogere kwaliteit.”

“Gebruikers geven aan dat ze hun moeilijkste codeertaken – taken waarvoor voorheen nauw toezicht nodig was – met vertrouwen kunnen indienen bij Opus 4.7. Opus 4.7 verwerkt complexe, langlopende taken met precisie en consistentie, waarbij veel aandacht wordt besteed aan instructies en manieren worden bedacht om de eigen output te verifiëren voordat er verslag wordt uitgebracht”, luidt een van de berichten. Antropische blogpost.

Claude Opus 4.7: Benchmarkprestaties

Anthropic heeft de details vrijgegeven modelkaart schetst hoe Claude Opus 4.7 zich verhoudt tot andere antropische modellen en grensmodellen van OpenAI, Google en xAI.

Opus 4.7 blijft achter bij het nog niet uitgebrachte Claude Mythos, waarvan Anthropic rapporteert dat het veel hoger scoort op gangbare benchmarks zoals De laatste test van de mensheid. “De Claude Opus 4.7 is op elke relevante as die we hebben gemeten minder capabel dan de Claude Mythos Preview en verlegt onze grenzen niet”, aldus de modelkaart. “Dat wil zeggen, Claude Opus 4.7 is geen bewijs dat de AI-ontwikkeling voorbij de bestaande trendlijn is gevorderd.

Op De laatste test van de mensheid (zonder gereedschap) meldt Anthropic dat de Claude Opus 4.7 beter presteert dan alle andere frontiermodellen behalve de Claude Mythos.

  • Claude Mythos scoorde 56,8 procent in HLE

  • Claude Opus 4.7 scoorde 46,9 procent

  • De Gemini 3.1 Pro scoorde 44,4 procent

  • GPT-5-4 Pro scoorde 42,7 procent

  • Claude Opus 4.6 scoorde 40,0 procent

Per tool scoorde GPT-5-4-Pro 58,7 procent vergeleken met Opus 4.7, dat 54,7 procent scoorde. Mythos versloeg beide met 64,7 procent.

Mashable heeft deze benchmarkresultaten niet onafhankelijk geverifieerd. Volledige resultaten zijn beschikbaar op Opus 4.7-modelkaart.


Krediet: antropisch

Over het geheel genomen behaalde de Anthropic een Opus-score van 4,7 boven andere toonaangevende modellen in verschillende benchmarks, hoewel de Gemini 3.1 Pro en GPT-5-4 op sommige gebieden hoger scoorden.

Claude Opus 4.7: Veiligheid en hallucinaties

Anthropic meldde dit ook Werk 4.7 duidt op een laag risico op afwijkend gedrag, met een vergelijkbaar risicoprofiel als Opus 4.6.

Anthropic zegt bijvoorbeeld dat Opus 4.7 minder snel hallucineert en een lager beloningshackpercentage laat zien.

“Claude Opus 4.7 is eerlijker dan Opus 4.6 of Sonnet 4.6, met een grote vermindering van het aantal belangrijke weglatingen, en een gematigde toename van de feitelijkheid en het niveau van hallucinerende input”, aldus de modelkaart.

Wilt u meer weten over hoe u het maximale uit uw technologie kunt halen? Meld je aan voor Mashable Nieuwsbrief met topverhalen en aanbiedingen Vandaag.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in