Home Nieuws Het nieuwe codeermodel van Cursor, Composer 2, is er: verslaat Claude Opus...

Het nieuwe codeermodel van Cursor, Composer 2, is er: verslaat Claude Opus 4.6, maar blijft nog steeds achter op GPT-5.4

4
0
Het nieuwe codeermodel van Cursor, Composer 2, is er: verslaat Claude Opus 4.6, maar blijft nog steeds achter op GPT-5.4

Cursor, een AI-coderingsplatform uit San Francisco van startup Anysphere ter waarde van $ 29,3 miljardis gelanceerd Componist 2Er is nu een nieuw intern coderingsmodel beschikbaar in de agent AI-coderingsomgeving en biedt drastisch verbeterde benchmarks ten opzichte van eerdere interne modellen.

Het werd ook gelanceerd en gemaakt Snelle componist 2een duurdere maar snellere variant, de standaardervaring voor gebruikers.

Hier zijn de kostendetails:

Dit is een grote stap terug vergeleken met het vorige interne model van Cursor, Componist 1.5, vanaf februariwat $3,50 per miljoen inputtokens en $17,50 per miljoen outputtokens kost; Componist 2 is ongeveer 86% goedkoper in beide gevallen.

Componist 2 Snel ook ca 57% goedkoper dan Componist 1.5.

Er is ook een korting op de “cache-leesprijs”, d.w.z. het snel opnieuw verzenden van een aantal van dezelfde tokens naar het model, voor $ 0,20 per miljoen tokens voor Composer 2 en $ 0,35 per miljoen voor Composer 2 Fast, versus $ 0,35 per miljoen voor Composer 1.5.

Het is ook belangrijk dat dit een originele release van Cursor lijkt te zijn, en niet een wijdverspreid, op zichzelf staand model. In de aankondiging en modeldocumentatie van het bedrijf wordt Composer 2 beschreven als beschikbaar in Cursor, afgestemd op de workflows van Cursor-agenten en geïntegreerd met de toolstack van het product.

Het geleverde materiaal vertegenwoordigt geen afzonderlijke beschikbaarheid via externe modelleringsplatforms of als een API voor algemene doeleinden buiten de Cursor-omgeving.

Cursors bieden codering op lange termijn, niet alleen een betere resolutie

De diepere technische claim in deze release is niet alleen dat Composer 2 hoger scoort dan Composer 1.5. Cursor zegt dat het model beter geschikt is voor het coderen van agenten op de lange termijn.

In zijn blog zei Cursor dat de kwaliteitsverbeteringen voortkwamen uit de eerste geavanceerde pre-training, die hem een ​​sterkere basis gaf voor grootschalig versterkend leren. Van daaruit zegt het bedrijf dat het Composer 2 heeft getraind in codeertaken op de lange termijn en dat het model problemen kan oplossen die honderden acties vereisen.

Deze framing is belangrijk omdat het een van de grootste onopgeloste problemen bij AI-codering aanpakt. Veel modellen zijn goed in het genereren van geïsoleerde code. Veel minder blijven betrouwbaar in langere workflows, waaronder het lezen van opslagplaatsen, beslissen wat er moet worden gewijzigd, het bewerken van meerdere bestanden, het uitvoeren van opdrachten, het interpreteren van fouten en het blijven bereiken van het doel.

De cursordocumentatie versterkt dat dit de use case is waar het om gaat. Het beschrijft Composer 2 als een agentmodel met een contextvenster van 200.000 tokens, afgestemd op toolgebruik, bestandsbewerking en terminalbewerkingen binnen Cursor.

Het registreert ook trainingstechnieken zoals zelfsamenvattingen voor langetermijntaken. Voor ontwikkelaars die Cursor al als hun primaire omgeving gebruiken, kan een strakkere aanpassing belangrijker zijn dan algemene claims op het klassement.

De benchmarkwinsten zijn substantieel, hoewel GPT-5.4 nog steeds de leiding heeft op één belangrijke chart

Vergelijking van Cursor Composer 2 met andere toonaangevende modellen op benchmarks van derden. Krediet: Cursor

De gepubliceerde resultaten van Cursor laten duidelijke verbeteringen zien ten opzichte van eerdere Composer-modellen. Het bedrijf vermeldt Composer 2 op 61,3 op CursorBench, 61,7 op Terminal-Bench 2.0 en 73,7 op SWE-bench Multilingual.

Vergelijk dat met Componist 1.5 op 44.2, 47.9 en 65.9, en Composer 1 op 38.0, 40.0 en 56.9.

Deze lancering is meer afgemeten dan de lancering van sommige modellen, omdat Cursor geen universeel leiderschap claimt.

In Terminal-Bench 2.0, dat meet hoe goed AI-agenten taken uitvoeren in een opdrachtregelterminal-achtige interface, GPT-5.4 leidt nog steeds met 75,1, terwijl Composer 2 61,7 scoorde, vóór Opus 4.6 met 58,0, Opus 4.5 met 52,1 en Composer 1,5 met 47,9.

Cursor Composer 2 scoort op Terminal-Bench 2.0 vergeleken met andere toonaangevende modellen.

Cursor Composer 2 scoort op Terminal-Bench 2.0 vergeleken met andere toonaangevende modellen. Krediet: Cursor

Dit maakt Cursor-promoties pragmatischer en aantoonbaar nuttiger voor kopers. Het bedrijf zegt niet dat de Composer 2 in alle opzichten het beste model is. Er wordt gezegd dat het model is verschoven naar een meer concurrerend kwaliteitsniveau, terwijl het tegelijkertijd aantrekkelijkere economische aspecten en een sterkere integratie biedt met het bestaande gebruik van productontwikkelaars.

Cursor bevat ook een prestatie- versus kostengrafiek in zijn CursorBench-benchmarksuite die ontworpen lijkt te zijn om een ​​Pareto-achtig argument te geven voor Composer 2.

Prestatie- versus prestatievergelijkingsgrafiek Cursor Composer 2-kostenmodel

Prestatie- versus prestatievergelijkingstabel Cursor Composer-kostenmodel 2. Credit: Cursor

In de grafiek heeft Composer 2 een sterkere kosten-prestatieverhouding dan Composer 1.5 en steekt gunstig af bij de duurdere GPT-5.4- en Opus 4.6-opstellingen die Cursor laat zien. De boodschap van het bedrijf is niet alleen dat Composer 2 hoger scoort dan zijn voorganger, maar dat het ook een efficiëntere verhouding tussen kosten en intelligentie biedt voor het dagelijkse codeerwerk binnen Cursor.

Waarom het ‘vergrendelde cursor’-punt belangrijk is voor kopers

Voor lezers die beslissen of ze Composer 2 willen gebruiken, is de belangrijkste vraag wellicht niet alleen de benchmarkprestaties. Het is mogelijk dat ze een model willen dat is geoptimaliseerd voor de eigen productervaring van Cursor.

Dat kan een kracht zijn. Volgens de documentatie heeft Composer 2 toegang tot de Cursor-agenttoolstack, inclusief het zoeken naar semantische code, het zoeken naar bestanden en mappen, het lezen van bestanden, het bewerken van bestanden, shell-opdrachten, browserbeheer en webtoegang.

Een dergelijke integratie kan waardevoller zijn dan de kwaliteit van het ruwe model als het doel is om echte softwaretaken op te lossen in plaats van indrukwekkende, eenvoudige antwoorden te produceren.

Maar dit verkleint ook de doelgroep. Teams die op zoek zijn naar een model dat breed kan worden toegepast op externe tools en platforms moeten zich ervan bewust zijn dat Cursor Composer 2 presenteert als een model voor Cursor-gebruikers, en niet als een op zichzelf staand, algemeen beschikbaar basismodel.

Het grotere plaatje: Cursors creëren operationele argumenten

Het belang van Composer 2 is niet dat Cursor plotseling de eerste plaats innam in elke codeerbenchmark. Nog niet. Wat belangrijker is, is dat Cursor een operationeel argument aanvoert: het model wordt steeds beter, de prijs is laag genoeg om breder gebruik aan te moedigen, en het snellere niveau is zo responsief dat bedrijven zich er op hun gemak bij voelen om het ondanks de hogere kosten tot de standaard te maken.

De combinatie is acceptabel voor technische teams die zich steeds minder zorgen maken over het prestige van abstracte modellen en zich meer zorgen maken over de vraag of de assistent nuttig kan blijven tijdens lange codeersessies zonder te duur te worden.

Bredere cursor prijsstructuur helpt de concurrentiedruk rond deze lancering in kaart te brengen. Op de huidige prijspagina biedt Cursor een gratis Hobby-niveau, a Het Pro-abonnement kost $ 20 per maand, Pro+ kost $ 60 per maandEn Ultra kost $ 200 per maand voor individuele gebruikers, waarbij hogere niveaus meer gebruik bieden in modellen van OpenAI, Anthropic en Google.

Aan de zakelijke kant, Het team kost $ 40 per gebruiker per maandterwijl Enterprise een op maat gemaakte prijs heeft en geaggregeerd gebruik, gecentraliseerde facturering, gebruiksanalyse, privacycontroles, SSO, auditlogboeken en gedetailleerde beheerderscontroles toevoegt. Met andere woorden: Cursor brengt niet alleen kosten in rekening voor toegang tot codeermodellen. Er worden kosten in rekening gebracht voor een beheerde applicatielaag die bovenop meerdere modelproviders ligt, terwijl teamfuncties, governance en workflowtools worden toegevoegd.

Dit model komt steeds meer onder druk te staan ​​nu first-party AI-bedrijven dieper in hun eigen codering duiken. OpenAI en Anthropic verkopen niet langer alleen modellen via producten van derden; ze leveren ook hun eigen coderingsinterfaces, agenten en evaluatiekaders – zoals Codex en Claude Code – wat de vraag oproept hoeveel ruimte er nog overblijft voor intermediaire platforms.

Commentatoren aan

Sommige berichten beschrijven de frustratie over de prijsstelling van Cursor, het verlies aan context of de op de redactie gerichte ervaring, terwijl Claude Code wordt geprezen als een directere, volledig agentische manier van werken. Hoewel met voorzichtigheid behandeld, wijst dergelijk sociaal gepraat op het strategische probleem waarmee Cursor wordt geconfronteerd: het moet bewijzen dat zijn geïntegreerde platform, teamcontroles en nu zijn eigen interne modellen voldoende toegevoegde waarde bieden om te rechtvaardigen dat het tussen de steeds capabeler wordende codeerproducten van ontwikkelaars en modelleurs zit.

Dit maakt Composer 2 van strategisch belang voor Cursor.

Door een veel goedkoper intern model aan te bieden dan Composer 1.5, dit aan te passen aan de toolstack van Cursor en de snellere versie tot standaard te maken, probeert het bedrijf te laten zien dat het meer biedt dan alleen een externe systeemverpakking.

De uitdaging is dat naarmate de codeerproducten van de eerste partij verbeteren, ontwikkelaars en zakelijke kopers zich steeds meer kunnen afvragen of ze een afzonderlijk AI-coderingsplatform willen, of dat de eigen tools van de modelbouwer alleen voldoende zijn.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in