Home Nieuws Claude 4.5 van Anthropic verslaat elke man in een techniektest van 2...

Claude 4.5 van Anthropic verslaat elke man in een techniektest van 2 uur

8
0
Claude 4.5 van Anthropic verslaat elke man in een techniektest van 2 uur

Het nieuwe AI-model van Anthropic presteert beter dan mensen bij het coderen, aldus het bedrijf in zijn laatste release.

Dat maakte het bedrijf maandag bekend Taak sluiten 4.5 en beschreef het als het meest geavanceerde AI-model tot nu toe, en zei dat het nieuwe model “hoger scoorde dan welke menselijke kandidaat dan ook” op het “extreem moeilijke take-home-examen” dat het bedrijf aan aspirant-ingenieurs aflegt.

In een blogpost op maandag zei Anthropic dat de twee uur durende take-home-test is ontworpen om technische bekwaamheid en beoordelingsvermogen onder tijdsdruk te beoordelen, en hoewel de test niet alle vaardigheden weerspiegelt die een ingenieur zou moeten hebben, roept het feit dat het AI-model “sterke kandidaten overtrof op het gebied van belangrijke technische vaardigheden” vragen op over “hoe AI de techniek als beroep zal veranderen.”

In zijn methodologie zegt het bedrijf dat deze resultaten worden verkregen door het model meerdere kansen te geven om elk probleem op te lossen en vervolgens het beste antwoord te selecteren.

Er is bij het publiek niet veel informatie bekend over wat de technische test inhoudt. In een interviewrecensie uit 2024, gepubliceerd op Glassdoor, stond dat de test vier niveaus had en werd potentiële kandidaten gevraagd bepaalde systemen te implementeren en er functionaliteit aan toe te voegen. Het is onduidelijk of de tests die aan Claude 4.5 werden gegeven vergelijkbaar waren. Anthropic heeft geen verdere details verstrekt op haar blog en heeft niet gereageerd op een verzoek om commentaar.

Laatste uitgave van Claude 4.5 komt slechts drie maanden na de lancering van de vorige editie. Naast coderen heeft het nieuwe model ook verbeteringen in het produceren van professionele documenten, waaronder Excel-spreadsheets en PowerPoint-presentaties.

Deze nieuwe release blijft Anthropic versterken dominantie in AI-codering. Zelfs Mark Zuckerberg’s Meta gebruikt Claude om het te ondersteunen Devmate interne codeerassistent ondanks dat hij een rivaal is in de AI-race.

Het bedrijf houdt zijn trainingsmethoden geheim. Erik SimonsDe CEO van Stackblitz, de startup achter de vibratiecoderingsservice Bolt.new, vertelde Business Insider eerder dat hij gelooft dat Anthropic een AI-model heeft dat zijn eigen code schrijft en vrijgeeft, waarna het bedrijf de resultaten beoordeelt met behulp van mensen en AI-tools. Dianne Penn, hoofd Product Management, Research and Frontiers bij Anthropic, zei dat dit beeld “over het algemeen waar” is.

In oktober, Antropis-CEO Dario Amodei zei op de Dreamforce-conferentie dat Claude AI al 90% van de code schrijft voor de meeste teams van het bedrijf, hoewel hij geen enkele software-ingenieur zou vervangen door bots.

‘Als Claude schrijft 90% van de codewat betekent dat je doorgaans net zoveel software-ingenieurs nodig hebt. Misschien heb je meer nodig, omdat ze meer invloed kunnen uitoefenen”, zegt Amodei. “Ze kunnen zich concentreren op de 10% die code bewerkt of de moeilijkste 10% schrijft, of toezicht houdt op een aantal AI-modellen.”



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in