Home Nieuws Nvidia zal 26 miljard dollar uitgeven om een ​​open-weight AI-model te bouwen,...

Nvidia zal 26 miljard dollar uitgeven om een ​​open-weight AI-model te bouwen, zo blijkt uit de archieven

1
0
Nvidia zal 26 miljard dollar uitgeven om een ​​open-weight AI-model te bouwen, zo blijkt uit de archieven

Nvidia zal uitgeven 26 miljard dollar in de komende vijf jaar om open source te bouwen kunstmatige intelligentie model, volgens a Financiële aangifte 2025. Leidinggevenden bevestigden het nieuws, dat nog niet eerder was gemeld, in een interview met WIRED.

Er zijn aanzienlijke investeringen zichtbaar Nvidia evolueerde van een chipmaker met een indrukwekkende softwarestack naar een bonafide grenslaboratorium mee kunnen concurreren Open AI En Diep zoeken. Dit is een strategische zet die de positie van Nvidia als ’s werelds toonaangevende fabrikant van AI-chips zou kunnen versterken, aangezien de modellen zijn afgestemd op de hardware van het bedrijf.

Een open source-model is een model waarvan de gewichten of parameters die het gedrag van het model bepalen, openbaar worden gemaakt, soms met details over de architectuur en training ervan. Hierdoor kan iedereen het downloaden en uitvoeren op zijn eigen computer of in de cloud. In het geval van Nvidia maakt het bedrijf ook de technische innovatie bekend die betrokken is bij het creëren en trainen van zijn modellen, waardoor het voor startups en onderzoekers gemakkelijker wordt om de innovaties van het bedrijf aan te passen en te ontwikkelen.

Woensdag bracht Nvidia ook de Nemotron 3 Super uit, het meest capabele AI-model met open gewicht tot nu toe. Het nieuwe model heeft 128 miljard parameters (een maatstaf voor de grootte en complexiteit van het model), waardoor het ongeveer op één lijn ligt met OpenAI’s grootste versie van GPT-OSS, hoewel het bedrijf beweert dat het in sommige benchmarks beter presteert dan GPT-OSS en andere modellen.

Concreet beweert Nvidia dat de Nemotron 3 Super een score van 37 heeft gekregen op de Artificial Intelligence Index, die het model scoort op 10 verschillende benchmarks. GPT-OSS scoorde 33, maar sommige Chinese modellen scoorden hoger. Nvidia zegt dat de Nemotron 3 Super stilletjes is getest in PinchBench, een nieuwe benchmark die het vermogen van een model beoordeelt om OpenClaw te besturen, en op nummer één staat in de test.

Nvidia introduceerde ook een aantal technische trucjes waarmee het de Nemotron 3 traint. Dit inclusief bouwtechniek en training wat het redeneervermogen van het model, de omgang met lange contexten en het reactievermogen op versterkend leren verbetert.

“Nvidia neemt de ontwikkeling van open modellen serieuzer”, zegt Bryan Catanzaro, VP van toegepast deep learning-onderzoek bij Nvidia. “En we hebben veel vooruitgang geboekt.”

Open grenzen

Meta is het eerste grote AI-bedrijf dat dit doet bracht een open model uitLama, in 2023. CEO Mark Zuckerberg heeft echter onlangs de AI-inspanningen van het bedrijf opnieuw opgestart, en daarop wijzend dit maakt het toekomstige model mogelijk niet volledig open. OpenAI biedt een open gewichtsmodel, genaamd GPT-ossmaar inferieur aan het beste aanbod van het bedrijf, ongeschikt voor aanpassing.

Het beste Amerikaanse model, van OpenAI, AntropischEn Googlenis alleen toegankelijk via de cloud of via een chatinterface. Daarentegen worden de gewichten voor veel van de Chinese topmodellen, van DeepSeek, Alibaba, Moonshot AI, Z.ai en MiniMax, openlijk en gratis vrijgegeven. Als gevolg hiervan maken veel startups en onderzoekers over de hele wereld nu gebruik van het Chinese model.

“We hebben er alle belang bij om het ecosysteem te laten bloeien”, zegt Catanzaro, die in 2011 bij Nvidia kwam werken en mee aan de leiding stond van de verschuiving van het bedrijf van het maken van grafische kaarten voor gaming naar het maken van silicium voor AI. Nvidia bracht het eerste Nemotron-model uit in november 2023. Het voegde eraan toe dat Nvidia onlangs de pre-training van het model met 550 miljard parameters had voltooid. (De vroege training omvatte het invoeren van grote hoeveelheden gegevens in modellen verspreid over een groot aantal gespecialiseerde chips die parallel liepen.) Nvidia heeft een reeks modellen uitgebracht die speciaal zijn bedoeld voor gebruik op gebieden als robotica, klimaatmodellering en het vouwen van eiwitten.

Kari Briski, VP van generatieve AI-software voor het bedrijf, zei dat de toekomstige AI-modellen van Nvidia het bedrijf zullen helpen niet alleen zijn chips te verbeteren, maar ook de datacenters op supercomputerschaal die het bouwt. “We hebben het gebouwd om ons systeem uit te breiden en niet alleen rekenkracht, maar ook opslag en netwerken te testen, en om onze roadmap voor hardware-architectuur op te bouwen”, zei hij.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in