Home Nieuws Ai2 brengt open model Olmo 3 uit, dat qua prestaties en efficiëntie...

Ai2 brengt open model Olmo 3 uit, dat qua prestaties en efficiëntie concurreert met Meta, DeepSeek en anderen

27
0
Ai2 brengt open model Olmo 3 uit, dat qua prestaties en efficiëntie concurreert met Meta, DeepSeek en anderen

GeekWire-foto / Todd Bishop

Allen Instituut voor AI (Ai2) heeft een nieuwe generatie van zijn vlaggenschipmodellen voor grote talen uitgebracht, ontworpen om heviger te concurreren met de zwaargewichten uit de industrie en de academische wereld.

In Seattle gevestigde non-profitorganisatie lanceerde Olmo 3een verzameling open-taalmodellen waarvan wordt gezegd dat ze beter presteren dan volledig open modellen zoals Stanford’s Marin en commerciële open-weight-modellen zoals Meta’s Llama 3.1.

Eerdere versies van Olmo waren voornamelijk bedoeld als wetenschappelijke hulpmiddelen om te begrijpen hoe AI-modellen worden gebouwd. Met Olmo 3 verbreedt Ai2 zijn focus en positioneert het model als een krachtig, efficiënt en transparant systeem dat geschikt is voor gebruik in de echte wereld, inclusief commerciële toepassingen.

“Olmo 3 bewijst dat openheid en prestaties samen vooruit kunnen gaan”, zegt Ali Farhadi, CEO van Ai2, donderdagochtend in een persbericht waarin hij de nieuwe modellen aankondigde.

Dit maakt deel uit van een bredere evolutie in de wereld van AI. Het afgelopen jaar zijn steeds krachtigere open modellen van bedrijven en universiteiten – waaronder Meta, DeepSeek, Qwen en Stanford – gaan wedijveren met de prestaties van propriëtaire systemen van grote technologiebedrijven.

Veel recente open modellen die zijn ontworpen om stapsgewijs redeneren te demonstreren – gewoonlijk ‘denkmodellen’ genoemd – zijn belangrijke benchmarks in het veld geworden.

Ai2 heeft de Olmo 3 in verschillende versies uitgebracht: Olmo 3 Base (kernfunderingsmodel); Olmo 3 Instrueer (ingesteld om gebruikersinstructies te volgen); Olmo 3 Think (ontworpen om meer expliciete redenen te tonen); en Olmo 3 RL Zero (experimenteel model getraind met versterkend leren).

Open modellen hebben terrein gewonnen onder startups en bedrijven die meer controle willen over kosten en gegevens, en een duidelijker inzicht willen in hoe technologie werkt.

Ai2 ging nog een stap verder door de volledige “modelflow” achter Olmo 3 vrij te geven: een reeks snapshots die de voortgang van het model tijdens elke trainingsfase laten zien. Bovendien zal de bijgewerkte OlmoTrace-tool onderzoekers in staat stellen de redeneerstappen van een model terug te koppelen aan specifieke gegevens en trainingsbeslissingen die deze stappen beïnvloeden.

In termen van energie-efficiëntie en kosten zegt Ai2 dat het nieuwe Olmo-basismodel 2,5 keer efficiënter is om te trainen dan Meta’s Llama 3.1 (gebaseerd op GPU-uren per token, waarbij Olmo 3 Base wordt vergeleken met het Meta 8B post-trainingsmodel). Een groot deel van dit voordeel komt voort uit het trainen van de Olmo 3 met veel minder tokens dan vergelijkbare systemen, in sommige gevallen zes keer minder dan concurrerende modellen.

Naast andere verbeteringen zegt Ai2 dat de Olmo 3 langere documenten in één keer kan lezen of analyseren, met ondersteuning voor invoer van maximaal 65.000 tokens, ongeveer dezelfde lengte als een kort boekhoofdstuk.

Ai2, opgericht in 2014 door wijlen Microsoft-medeoprichter Paul Allen, heeft lange tijd gefunctioneerd als een op onderzoek gerichte non-profitorganisatie, die open source-tools en -modellen ontwikkelde, terwijl grotere commerciële laboratoria de schijnwerpers domineerden. Het instituut heeft dit jaar een reeks stappen gezet om zijn profiel te vergroten en tegelijkertijd zijn missie te behouden: het ontwikkelen van AI om de grootste problemen ter wereld op te lossen.

In augustus vond Ai2 plaats gekozen door de National Science Foundation en Nvidia voor een baanbrekend initiatief van $152 miljoen om multimodale AI-modellen te bouwen die volledig openstaan ​​voor wetenschappelijk onderzoek, waardoor het instituut wordt gepositioneerd als een belangrijke bijdrager aan de AI-ruggengraat van het land.

Het fungeert ook als een belangrijke technische partner voor Kanker AI Alliantiehelpt Fred Hutch en andere toonaangevende Amerikaanse kankercentra bij het trainen van AI-modellen op basis van klinische gegevens zonder patiëntendossiers openbaar te maken.

Olmo 3 is nu beschikbaar in Hugging Face en Speeltuin model Ai2.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in