De agent- en zoeksystemen van het bedrijf zijn afhankelijk van robuuste gegevensverzameling die efficiënt en nauwkeurig werkt. De MongoDB-databaseprovider beschouwt het als actueel inbeddingsmodel helpt de daling van de opnamekwaliteit aan te pakken naarmate er meer AI-systemen in productie komen.
Naarmate agent- en RAG-systemen in productie gaan, komt de kwaliteit van het ophalen naar voren als een faalpunt – een faalpunt dat de nauwkeurigheid, de kosten en het gebruikersvertrouwen kan ondermijnen, zelfs als het model zelf goed presteert.
Het bedrijf lanceerde vier nieuwe versies modelinbedding en herrangschikking. Voyage 4 zal beschikbaar zijn in vier modi: Voyage-4 Embedding, Voyage-4-Large, Voyage-4-Lite en Voyage-4-Nano.
MongoDB zegt dat de reis-4-inbedding dient als een model voor algemene doeleinden; MongoDB beschouwt de Voyage-4-large als zijn vlaggenschipmodel. Voyage-4-lite richt zich op taken die minder latentie en lagere kosten vereisen, en Voyage-4-nano is gericht op meer lokale ontwikkel- en testomgevingen of voor het vastleggen van gegevens op het apparaat.
Voyage-4-nano is ook het eerste open gewichtsmodel van MongoDB. Alle modellen zijn beschikbaar via MongoDB’s API en Atlas-platform.
Het bedrijf zei dat het model beter presteerde dan vergelijkbare modellen van Google en Cohere op de RTEB-benchmark. Knuffelend gezicht RTEB-benchmark rangschikt de Voyage 4 als het beste ingebedde model.
“Het inbedden van een model is een van die onzichtbare keuzes die een AI-ervaring echt kunnen maken of breken”, zegt Frank Liu, productmanager bij MongoDB, in een briefing. “Als u het verkeerd doet, zullen uw zoekresultaten willekeurig en oppervlakkig aanvoelen, maar als u het goed doet, voelt het plotseling alsof uw app uw gebruikers en uw gegevens begrijpt.”
Hij voegde eraan toe dat het doel van het Voyage 4-model is om de gegevensverzameling in de echte wereld te verbeteren, wat vaak tekortschiet zodra agent- en RAG-pijpleidingen in productie gaan.
MongoDB heeft ook een nieuw multimodaal inbeddingsmodel uitgebracht, Voyage-multimodal-3.5, dat documenten kan verwerken, waaronder tekst, afbeeldingen en video. Dit model vectoriseert gegevens en extraheert de semantische betekenis uit tabellen, grafieken, afbeeldingen en dia’s die doorgaans in bedrijfsdocumenten voorkomen.
Problemen met de inbedding van ondernemingen
Voor bedrijven is een agentensysteem nuttig als het op het juiste moment de juiste en passende informatie kan ophalen. Deze vereiste wordt moeilijker naarmate de workloads groter worden en de contextvensters fragmenteren.
Sommige modelaanbieders richten zich op de AI-laag van de agent. eigendom van Google Het Gemini Embedding-model staat bovenaan leaderboard-inbedding, en Cohere lanceerde het Integreer 4 multimodale modellendie documenten van meer dan 200 pagina’s verwerkt. Mistral zegt over zijn code-inbeddingsmodel: Kodestral-inbeddingbeter presteren dan Cohere, Google en zelfs MongoDB’s Voyage Code 3. MongoDB betoogt dat benchmarkprestaties alleen niet de operationele complexiteit aanpakken waarmee bedrijven in de productie worden geconfronteerd.
MongoDB zegt dat veel klanten merken dat hun datastacks de context-ophaalintensieve werklasten in de productie niet aankunnen. Bedrijven zeggen dat ze meer fragmentatie zien omdat bedrijven verschillende oplossingen moeten combineren om databases te verbinden met ophaal- of herrangschikkingsmodellen. Om klanten te helpen die geen gefragmenteerde oplossingen willen, biedt het bedrijf zijn modellen aan via één enkel dataplatform, Atlas.
MongoDB’s weddenschap is dat fetch niet langer kan worden behandeld als een verzameling van de beste componenten in zijn soort. Om bedrijfsagenten betrouwbaar op schaal te laten werken, moeten de insluiting, herschikking en gegevenslagen functioneren als nauw geïntegreerde systemen, niet als een gecombineerde stapel.


