Home Nieuws Nvidia wordt grote modelmaker met Nemotron 3

Nvidia wordt grote modelmaker met Nemotron 3

11
0
Nvidia wordt grote modelmaker met Nemotron 3

Nvidia heeft gemaakt een fortuin dat chips levert aan werkende bedrijven kunstmatige intelligentiemaar nu onderneemt de chipmaker stappen om een ​​serieuzere modelbouwer te worden door een reeks geavanceerde open modellen uit te brengen, samen met gegevens en hulpmiddelen om ingenieurs te helpen deze te gebruiken.

Deze stap, die komt op een moment dat AI-bedrijven als OpenAI, Google en Anthropic hun eigen steeds capabeler wordende chips ontwikkelen, zou kunnen dienen als een bescherming tegen bedrijven die in de loop van de tijd afstappen van de technologie van Nvidia.

Open modellen zijn een belangrijk onderdeel geworden van het AI-ecosysteem en veel onderzoekers en startups gebruiken ze om te experimenteren, prototypen te maken en te bouwen. Hoewel OpenAI en Google kleine open modellen aanbieden, updaten ze deze niet zo vaak als hun Chinese concurrenten. Om deze en andere redenen zijn open modellen van Chinese bedrijven momenteel veel populairder gegevens van Knuffelgezichthostingplatform voor open source-projecten.

Nvidia’s nieuwe Nemotron 3-modellen behoren tot de beste die kunnen worden gedownload, aangepast en uitgevoerd op eigen hardware, volgens benchmarkscores die het bedrijf vóór de release heeft gedeeld.

“Open innovatie is de basis van de vooruitgang op het gebied van AI”, zei CEO Jensen Huang voorafgaand aan het nieuws in een verklaring. “Met Nemotron veranderen we geavanceerde AI in een open platform dat de transparantie en efficiëntie biedt die ontwikkelaars nodig hebben om agentsystemen op schaal te bouwen.”

Nvidia hanteert een transparantere aanpak dan veel van zijn Amerikaanse concurrenten door de gegevens vrij te geven die worden gebruikt om Nemotron te trainen – een feit dat ingenieurs zal helpen het model gemakkelijker aan te passen. Het bedrijf heeft ook tools uitgebracht om te helpen bij maatwerk en maatwerk. Dit omvat een nieuwe hybride latente expert-mixmodelarchitectuur, die volgens Nvidia uitstekend is voor het bouwen van AI-agents die acties kunnen ondernemen op een computer of op internet. Het bedrijf lanceerde ook een bibliotheek waarmee gebruikers agenten kunnen trainen om verschillende dingen te doen met behulp van versterkend lerenwaarbij een simulatiemodel van beloningen en straffen wordt aangeboden.

Het Nemotron 3-model is verkrijgbaar in drie maten: Nano, met 30 miljard parameters; Super die 100 miljard heeft; en Ultra met 500 miljard. De parameters van een model hebben meestal betrekking op hoe capabel het model is en hoe moeilijk het model kan worden uitgevoerd. De grootste modellen zijn zo complex dat ze op dure hardwarerekken moeten worden geïnstalleerd.

Model Stichting

Kari Ann Briski, vice-president van generatieve AI-software voor ondernemingen bij Nvidia, zei dat open modellen om drie redenen belangrijk zijn voor AI-makers: makers moeten modellen steeds meer afstemmen op specifieke taken; het helpt vaak om vragen aan een ander model toe te wijzen; en het is gemakkelijker om na training slimmere reacties uit deze modellen te krijgen door ze een soort redeneersimulatie te laten uitvoeren. “Wij geloven dat open source de basis vormt voor AI-innovatie, die de wereldeconomie blijft versnellen”, aldus Briski.

Socialmediagigant Meta heeft zijn eerste geavanceerde open model met de naam uitgebracht Lama in februari 2023. Nu de concurrentie echter toeneemt, heeft Meta laten doorschemeren dat de aankomende releases mogelijk niet open source zijn.

De stap maakt deel uit van een grotere trend in de AI-industrie. Het afgelopen jaar zijn Amerikaanse bedrijven overgegaan van openheid naar geheimzinniger over hun onderzoek en terughoudender om hun concurrenten over hun nieuwste technische trucs te vertellen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in