Bijna een jaar na de release Herbeoordeling 3,5Cohere heeft de nieuwste versie van zijn zoekmodel gelanceerd, nu met een groter contextvenster om agenten te helpen de informatie te vinden die ze nodig hebben om hun taken te voltooien.
zei Cohier een blogpost dat Rerank 4 een contextvenster van 32K heeft, wat een viervoudige toename betekent vergeleken met 3,5.
“Hierdoor kan het model langere documenten verwerken, meerdere secties tegelijkertijd evalueren en relaties tussen secties vastleggen die in een korter venster mogelijk over het hoofd worden gezien”, aldus de blogpost. “Daarom verbetert deze uitgebreide capaciteit de rangschikkingsnauwkeurigheid voor realistische documenttypen en vergroot het het vertrouwen in de relevantie van de opgehaalde resultaten.”
Rerank 4 is verkrijgbaar in twee smaken: Fast en Pro. Als kleiner model is Fast het meest geschikt voor gebruiksscenario’s die snelheid en nauwkeurigheid vereisen, zoals e-commerce, programmeren en klantenservice. Pro is geoptimaliseerd voor taken die een diepere redenering, precisie en analyse vereisen, zoals het genereren van risicomodellen en het uitvoeren van data-analyses.
Bedrijf zoeken belangrijker worden dit jaar, vooral omdat AI-agenten toegang moeten krijgen tot meer informatie en context over de organisaties waarmee ze werken. Cohere zei dat het herschikken “de nauwkeurigheid van de AI-zoekopdracht van het bedrijf aanzienlijk verbetert door de initiële ophaalresultaten te verbeteren.” Reranking 4 pakt de nuancekloof aan die wordt gecreëerd door meerdere bi-encoder-inbeddings – een model dat helpt bij het eenvoudiger maken van taken met toegevoegde generatie (RAG) – door gebruik te maken van een cross-encoder-architectuur “die queries en kandidaten samen verwerkt, subtiele semantische relaties vastlegt en de resultaten herschikt om de meest relevante items naar boven te halen”, aldus Cohere.
Prestaties en benchmarks
Cohere vergeleek het model met andere rangschikkingsmodellen, zoals Qwen Reranker 8B, Elasticsearch’s Jina Rerank v3 en MongoDB’s Voyage Rerank 2.5, voor taken in de financiële, gezondheidszorg- en productiedomeinen. Rerank 4 presteert sterk, zo niet beter dan zijn concurrenten.
Rerank 3.5 viel op door zijn vermogen om meerdere talen te ondersteunen, en Cohere zegt dat Rerank 4 deze trend voortzet. Het begrijpt meer dan 100 talen, inclusief geavanceerd ophalen in 10 grote zakelijke talen.
Agenten en modellen opnieuw rangschikken
Reranking 4 heeft tot doel de taak van de agent te laten begrijpen welke gegevens het beste bij zijn taak passen en om meer context te bieden.
Cohere merkt op dat het model een belangrijk onderdeel van zijn bureau is AI-platform, Noordomdat het “naadloos integreert in bestaande AI-zoekoplossingen, inclusief hybride, vector- en trefwoordgebaseerde systemen, met minimale codewijzigingen.”
Naarmate steeds meer bedrijven middelen gebruiken voor onderzoek en inzicht, zoals blijkt uit de toename Diepgaande onderzoeksfunctiemodellen die helpen bij het uitfilteren van irrelevante inhoud, zoals het opnieuw rangschikken, worden steeds belangrijker.
“Dit heeft vooral impact op agent AI, waar complexe meerstapsinteracties snel modelaanroepen kunnen escaleren en contextvensters kunnen vullen”, aldus Cohere.
Het bedrijf beweert dat Rerank 4 helpt het tokengebruik te verminderen en het aantal nieuwe pogingen dat agenten nodig hebben om dingen op te lossen door te voorkomen dat informatie van lage kwaliteit LLM bereikt.
Leer onafhankelijk te zijn
Cohere zei dat Rerank 4 niet alleen opvalt vanwege zijn sterke herrangschikkingsmogelijkheden, maar ook omdat het het eerste zelflerende herrangschikkingsmodel is.
Gebruikers kunnen Rerank 4 aanpassen aan de gebruiksscenario’s die ze vaker tegenkomen, zonder aanvullende gegevens. Vergelijkbaar met het funderingsmodel GPT-5.2waar mensen voorkeuren kunnen uiten en het model deze onthoudt, kunnen Rerank 4-gebruikers het model hun favoriete inhoudstypen en documentcorpora vertellen.
Wanneer het model bijvoorbeeld wordt gebruikt met Rerank 4 Fast, wordt het concurrerender met grotere modellen, omdat het nauwkeuriger is en gebruikmaakt van de specifieke gegevens die de gebruiker wil.
“Als we verder keken, hebben we ook onderzocht hoe de zelflerende mogelijkheden van Rerank 4 presteren op volledig nieuwe zoekdomeinen”, aldus Cohere. “Met behulp van een op de gezondheidszorg gerichte dataset die de behoefte van een arts nabootst om patiëntspecifieke informatie op te halen – en niet alleen maar expertise uit een bepaalde medische discipline – ontdekten we dat het inschakelen van zelfleren consistente en substantiële voordelen opleverde. Het resultaat: een duidelijke en significante verbetering in de ophaalkwaliteit voor Rerank 4 Fast, over de hele linie.”



