Home Nieuws Ai2’s Molmo 2 laat zien dat open source-modellen kunnen wedijveren met propriëtaire...

Ai2’s Molmo 2 laat zien dat open source-modellen kunnen wedijveren met propriëtaire giganten op het gebied van video-begrip

14
0
Ai2’s Molmo 2 laat zien dat open source-modellen kunnen wedijveren met propriëtaire giganten op het gebied van video-begrip

Vers van de release van een bijgewerkte versie van het basismodel van Olmo, lanceerde het Allen Institute for AI (Ai2) dinsdag een open source videomodel, Molmo 2, met als doel aan te tonen dat kleinere, open modellen een haalbare optie kunnen zijn voor bedrijven die zich richten op het begrijpen en analyseren van video.

In een persberichtHet bedrijf zegt dat de Molmo 2 “de kracht van Molmo op het gebied van gegronde visie overneemt en deze uitbreidt naar het begrijpen van video en meerdere beelden”, een mogelijkheid die grotendeels wordt gedomineerd door grotere eigen modellen.

Ai2 heeft drie varianten van de Molmo 2 uitgebracht:

  • Mond 2 8Been op Qwen-3 gebaseerd model dat Ai2 beschrijft als “het beste algemene model voor video-aarding en QA”

  • Mond 2 4Bontworpen voor een efficiëntere implementatie

  • Mond 2-O 7Bgebouwd op basis van het Olmo-model

Molmo 2 ondersteunt invoer van enkele en meerdere afbeeldingen, evenals videoclips van verschillende lengtes, waardoor taken mogelijk zijn zoals video-aarding, tracking en het beantwoorden van vragen.

“Een van onze belangrijkste ontwerpdoelen was het dichten van een groot gat in het open model: aarding”, aldus Ai2 in een persbericht.

Bedrijf eerst introductie van de familie Molmo Vorig jaar zijn multimodale modellen geopend, te beginnen met afbeeldingen. Ai2 zegt dat de Molmo 2 beter presteert dan eerdere versies op het gebied van nauwkeurigheid, temporeel begrip en aarding op pixelniveau, en in sommige gevallen concurrerend presteert met grotere modellen zoals de Google Gemini 3.

Hoe vergelijkt de Molmo 2

Ondanks zijn kleinere formaat is het Molmo 2-model superieur Tweeling 3 Pro en andere concurrenten uit de open klasse op het gebied van benchmarks voor het volgen van video’s.

Wat betreft beeldverwerking en overwegingen met meerdere beelden zegt Ai2 dat de Molmo 2 8B “alle open-gewicht modellen leidt, met de 4B-variant op de hielen.” De 8B- en 4B-modellen lieten ook sterke prestaties zien in open-gewogen Elo-evaluaties van menselijke voorkeuren, hoewel Ai2 opmerkte dat de grotere eigen modellen in het algemeen voorop bleven lopen in deze benchmarks.

Maar het grootste voordeel van de Molmo 2 ligt in de video-aarding en het tellen van video’s, waar hij beter presteert dan vergelijkbare open-weight-modellen.

“Deze resultaten benadrukken de vooruitgang en de resterende ruimte – het aarden van video is nog steeds moeilijk en geen enkel model heeft tot nu toe een nauwkeurigheid van 40% bereikt”, zei Ai2, verwijzend naar de huidige benchmarks.

Veel videomodellen, zoals Google Ik zie 3.1 en OpenAI’s Sora, meestal erg groot. Molmo 2 richt zich op een andere afweging: een kleiner, meer open model dat is geoptimaliseerd voor aarding en analyse, niet voor het maken van video’s.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in