Home Nieuws Hoe Kimi K2.5 van Moonshot AI-makers helpt gemakkelijker dan ooit zwermen agenten...

Hoe Kimi K2.5 van Moonshot AI-makers helpt gemakkelijker dan ooit zwermen agenten te ontwikkelen

7
0
Hoe Kimi K2.5 van Moonshot AI-makers helpt gemakkelijker dan ooit zwermen agenten te ontwikkelen

Het Chinese bedrijf Moonshot AI tilt het naar een hoger niveau open source Kimi K2-modeldoor er een coderings- en visiemodel van te maken met een architectuur die de orkestratie van agentenzwermen ondersteunt.

Het nieuwe model, Moonshot Kimi K2.5, is een goede keuze voor bedrijven die agenten willen die automatisch acties kunnen uitvoeren in plaats van een raamwerk te hebben dat de belangrijkste beslisser is.

Het bedrijf karakteriseert Kimi K2.5 als een “compleet model” dat zowel visuele als tekstinvoer ondersteunt, waardoor gebruikers het model kunnen gebruiken voor meer visuele codeerprojecten.

Moonshot maakt het aantal K2.5-parameters niet publiekelijk bekend, maar het Kimi K2-model waarop het is gebaseerd, heeft in totaal 1 biljoen parameters en 32 miljard ingeschakelde parameters dankzij de gecombineerde architectuur van experts.

Het is het nieuwste open source-model dat een alternatief biedt voor de meer gesloten opties van Google, OpenAI en Anthropic, en het presteert beter dan deze op het gebied van belangrijke statistieken, waaronder de workflow van agenten, codering en visie.

In Eindexamen mensheid (HLE) benchmark scoorde Kimi K2.5 50,2% (met tools), overtreft OpenAI’s GPT-5.2 (xhigh) en Claude Opus 4.5. Dat werd ook bereikt 76,8% op Geverifieerde SWE-bankHiermee wordt zijn status als codeermodel van het hoogste niveau bevestigd, hoewel GPT-5.2 en Opus 4.5 het hier inhalen met respectievelijke scores van 80 en 80,9.

Kimi K2.5 Thinking benchmark-vergelijkingstabel. Krediet: AI Moonshot

Moonshot zei in een persbericht dat het tussen september en november een toename van 170% in het aantal gebruikers zag voor Kimi K2 en Kimi K2 Denktdie begin november werd uitgebracht.

Zwermen ingebouwde agenten en orkestratie

Moonshot heeft tot doel gebruik te maken van de standalone agent- en agentzwermparadigma’s die in Kimi K2.5 zijn ingebouwd. Bendeagenten worden ook wel bendeagenten genoemd de volgende grens in de ontwikkeling van zakelijke AI en agent-gebaseerde systemen. Dit heeft de afgelopen maanden veel aandacht gekregen.

Voor bedrijven betekent dit dat als ze een agent-ecosysteem bouwen met Kimi K2.5, ze efficiënter kunnen opschalen. Maar in plaats van de omvang van het model te vergroten of te vergroten om grotere agenten te creëren, wedden ze in plaats daarvan op het creëren van meer agenten die in wezen zichzelf zouden kunnen beheren.

Kimi K2.5 “creëert en coördineert een verzameling speciale agenten die parallel werken.” Het bedrijf vergelijkt het met een bijenkorf waarbij elke agent een taak uitvoert en tegelijkertijd bijdraagt ​​aan een gemeenschappelijk doel. Het model leert maximaal 100 subagenten zelf aan te sturen en kan parallelle workflows van maximaal 1.500 tooloproepen uitvoeren.

“Benchmarks vertellen slechts de helft van het verhaal. Moonshot AI is van mening dat AGI uiteindelijk moet worden geëvalueerd op basis van zijn vermogen om taken uit de echte wereld efficiënt uit te voeren binnen reële tijdsbeperkingen. De echte maatstaf waar ze om geven is: hoeveel tijd geeft AI je eigenlijk op een dag? Parallel draaien vermindert aanzienlijk de tijd die nodig is voor complexe taken – taken die dagen werk zouden hebben gekost, kunnen nu in minuten worden voltooid”, aldus het bedrijf.

Bedrijven die hun orkestratiestrategie overwegen, beginnen te kijken naar agentplatforms waar agenten communiceren en taken indienen, in plaats van een rigide orkestratieframework te volgen dat bepaalt wanneer een actie is voltooid.

Hoewel Kimi K2.5 een aantrekkelijke optie kan bieden voor organisaties die deze vorm van orkestratie willen gebruiken, voelen sommige organisaties zich wellicht meer op hun gemak als ze deze vorm vermijden. op agenten gebaseerde orkestratie in het model ingevoerd en in plaats daarvan een ander platform gebruiken om modeltraining te onderscheiden van agenttaken.

Dit komt omdat bedrijven vaak meer flexibiliteit willen in de modellen waarin hun agenten zijn ingebouwd, zodat ze agent-ecosystemen kunnen bouwen die gebruik maken van de LLM’s die het meest geschikt zijn voor specifieke acties.

Sommige agentplatforms, zoals Salesforce, AWS Bedrock en IBM, bieden afzonderlijke observatie-, beheer- en monitoringtools waarmee gebruikers AI-agents kunnen organiseren die met verschillende modellen zijn gebouwd, en hen in staat stellen samen te werken.

Multimodale codering en visuele foutopsporing

Met dit model kunnen gebruikers visuele lay-outs coderen, inclusief gebruikersinterfaces en interacties. Het houdt rekening met afbeeldingen en video’s om de taak te begrijpen die in de visuele invoer is gecodeerd. K2.5 kan bijvoorbeeld de code van een website reconstrueren door eenvoudig videobeelden van de site in actie te analyseren en visuele aanwijzingen te vertalen naar interactieve lay-outs en animaties.

“Interfaces, lay-outs en interacties die moeilijk precies in taal te beschrijven zijn, kunnen worden gecommuniceerd via screenshots of schermopnames, die door modellen kunnen worden geïnterpreteerd en omgezet in volledig functionele websites. Dit maakt een nieuwe klasse van vibratiecoderingservaringen mogelijk”, aldus Moonshot.

Deze mogelijkheden zijn geïntegreerd in Kimi Code, een nieuwe terminalgebaseerde tool die werkt met IDE’s zoals VSCode en Cursor.

Het ondersteunt ‘autonome visuele foutopsporing’, waarbij het model visueel zijn eigen uitvoer controleert – zoals een gerenderde webpagina – referentiedocumentatie, en code herhaalt om lay-outwijzigingen of esthetische fouten op te lossen zonder menselijke tussenkomst.

In tegenstelling tot andere multimodale modellen die afbeeldingen kunnen creëren en begrijpen, kan Kimi K2.5 frontend-interacties voor websites bouwen met beeldmateriaal, en niet alleen met de code erachter.

API-prijzen

Moonshot AI prijst zijn K2.5 API agressief om te concurreren met grote Amerikaanse laboratoria, en biedt aanzienlijke kortingen ten opzichte van eerdere K2 Turbo-modellen.

  • Invoer: 60 cent per miljoen tokens (a 47,8% verminderen).

  • Gecachte invoer: 10 cent per miljoen tokens (a 33,3% verminderen).

  • Uitgang: $3 per miljoen tokens (a 62,5% verminderen).

De lage kosten van cache-invoer ($0,10/miljoen tokens) zijn vooral relevant voor de “Agent Swarm”-functie, die vaak het onderhouden van grote contextvensters over meerdere subagenten en uitgebreid gebruik van tools vereist.

Gewijzigde MIT-licentie

Hoewel Kimi K2.5 open-source is, wordt het vrijgegeven onder een gewijzigde MIT-licentie die een speciale clausule bevat die gericht is op “hyper-scale” commerciële gebruikers.

De licentie biedt standaardtoestemming voor het gebruiken, kopiëren, wijzigen en verkopen van de software.

Deze bepalingen bepalen echter dat als de software of afgeleide werken daarvan worden gebruikt voor een commercieel product of dienst met meer dan 100 miljoen maandelijkse actieve gebruikers (MAU) of meer dan $20 miljoen USD aan maandelijkse inkomsten, de entiteit “Kimi K2.5” prominent in de gebruikersinterface moet weergeven.

Deze clausule zorgt ervoor dat, hoewel het model gratis en open blijft voor het grootste deel van de ontwikkelaars- en startup-gemeenschap, grote technologiegiganten de Moonshot-technologie niet kunnen whitelabelen zonder zichtbare attributie te bieden.

Het is niet volledig “open source”, maar het is beter dan de vergelijkbare Meta Licentievereisten voor lama’s voor een reeks ‘open source’-modellen, waarbij bedrijven met 700 miljoen of meer maandelijkse gebruikers een speciale bedrijfslicentie van dat bedrijf moeten verkrijgen.

Wat dit betekent voor moderne AI-makers voor ondernemingen

Voor beoefenaars die de moderne AI-stack definiëren – van LLM-beslissers die implementatiecycli optimaliseren tot AI-orkestratieleiders die agenten en door AI aangedreven geautomatiseerde bedrijfsprocessen opzetten – vertegenwoordigt Kimi K2.5 een fundamentele verschuiving in de hefboomwerking.

Door zwermorkestratie rechtstreeks in het model in te bedden, biedt Moonshot AI effectief synthetische arbeid aan bouwers met beperkte middelen, waardoor een ingenieur honderd autonome sub-agenten net zo gemakkelijk kan aansturen als een enkele opdracht.

Deze ‘scale-up’-architectuur pakt direct het dilemma van databeslissers aan om complexe pijpleidingen in evenwicht te brengen met een beperkt personeelsbestand, terwijl de gestroomlijnde prijsstructuur dataverwerking met hoge context transformeert van een budgetbrekende luxe in een routineproduct.

Uiteindelijk vertegenwoordigt K2.5 een toekomst waarin de belangrijkste beperking voor een technisch team niet langer het aantal werknemers is dat toetsenborden gebruikt, maar het vermogen van de leiders om een ​​menigte te choreograferen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in