Home Nieuws Intercom’s nieuwe post-training Fin Apex 1.0 verslaat GPT-5.4 en Claude Sonnet 4.6...

Intercom’s nieuwe post-training Fin Apex 1.0 verslaat GPT-5.4 en Claude Sonnet 4.6 op het gebied van klantenserviceresolutie

2
0
Intercom’s nieuwe post-training Fin Apex 1.0 verslaat GPT-5.4 en Claude Sonnet 4.6 op het gebied van klantenserviceresolutie

Intercom nam een ​​ongebruikelijke gok voor een bestaand softwarebedrijf: een eigen AI-model bouwen.

Een groot klantenserviceplatform dat 15 jaar oud is heeft Fin Apex 1.0 aangekondigd Donderdag presteerde een klein, op maat gemaakt AI-model dat volgens het bedrijf beter presteerde dan toonaangevende modellen van OpenAI en Anthropic in de statistieken die het belangrijkst zijn voor klantenondersteuning.

Modelsterkte Bestaande Fin AI Intercom-agentendie wekelijks meer dan twee miljoen klantgesprekken afhandelt.

Op basis van benchmarks gedeeld met VentureBeat behaalde Fin Apex 1.0 een oplossingspercentage van 73,1% (het percentage klantproblemen dat volledig zonder menselijke tussenkomst werd opgelost), vergeleken met 71,1% voor GPT-5.4 en Claude Opus 4.5, en 69,6% voor Claude Sonnet 4.6. Die marge van ongeveer 2 procentpunten klinkt misschien bescheiden, maar is groter dan de typische kloof tussen opeenvolgende generaties Frontier-modellen.

Fin Apex 1.0 selecteer een benchmarkvergelijkingstabel. Krediet: intercom

“Als je een groot servicebedrijf op grote schaal runt en 10 miljoen klanten of een miljard dollar aan omzet hebt, is een delta van 2% of 3% een enorm aantal klanten, interacties en omzet”, vertelde Intercom CEO Eoghan McCabe eerder deze week aan VentureBeat in een videogesprek.

Het model laat ook aanzienlijke verbeteringen zien in snelheid en nauwkeurigheid. De Fin Apex reageerde in 3,7 seconden (0,6 seconden sneller dan de volgende snelste concurrent) en vertoonde een vermindering van 65% in hallucinaties vergeleken met de Claude Sonnet 4.6.

Misschien wel het meest opvallend voor zakelijke kopers: het kost ongeveer een vijfde van de kosten van het gebruik van het frontier-model, en valt binnen de op “per resultaat” gebaseerde prijsstructuur van Intercom voor bestaande klantabonnementen.

Wat is het basismodel? Is het belangrijk?

Maar er zijn grenzen. Toen hem werd gevraagd om het basismodel te specificeren waarop Apex was gebouwd – en de parametermetingen ervan – aarzelde Intercom.

“We delen het basismodel dat we voor Apex 1.0 gebruiken niet – om concurrentieredenen en ook omdat we van plan zijn het basismodel in de loop van de tijd te vervangen”, vertelde een woordvoerder van het bedrijf aan VentureBeat. Het bedrijf wil alleen bevestigen dat het model “honderd miljard parameters groot” is.

FTer vergelijking: Llama 3.1 Meta varieert van 8 miljard tot 405 miljard parameters, en grotere grensmodellen zoals GPT-5.4 zouden in de biljoenen lopen.

Of de prestatieclaims van Apex in die context passen – of dat de benchmarks optimalisaties weerspiegelen die alleen mogelijk zijn in beperkte domeinspecifieke applicaties – blijft een open vraag.

Intercom zei dat het onderzocht was terugslag waarmee AI-coderingsstartup Cursor te maken krijgt toen critici de codeerassistent ervan beschuldigden het feit te begraven dat zijn Composer 2-model gebaseerd was op een nauwkeurig afgesteld open gewichtsmodel, en niet op eigen technologie. Maar de les van Intercom zal de sceptici misschien niet bevredigen: het bedrijf is transparant omdat het een open-gewogen basis hanteert, maar dat doet het niet. Welke Een.

“We zijn heel transparant geweest dat we” een open gewichtsmodel hebben gebruikt, zei de woordvoerder. Maar weigeren het model een naam te geven en tegelijkertijd transparantie te claimen, is een tegenstrijdigheid die de aandacht zou kunnen trekken – vooral omdat steeds meer bedrijven ‘eigen’ AI-equivalenten van vooraf opgeleide open source-stichtingen aanprijzen.

Post de training als de nieuwe voorhoede

Het argument van Intercom is dat het basismodel er niet meer toe doet.

“Pre-training is nu een soort commodity geworden”, zegt McCabe. “De grens ligt, als je wilt, eigenlijk na de training. Na de training is het moeilijkste deel. Je hebt bedrijfseigen gegevens nodig. Je hebt bedrijfseigen bronnen van waarheid nodig.”

Het bedrijf geeft post-trainingstrainingen op de geselecteerde basis, waarbij gebruik wordt gemaakt van jarenlange eigen klantenservicegegevens die zijn verzameld via Fin, dat nu 2 miljoen klantvragen per week beantwoordt. Het proces omvat meer dan alleen het invoeren van transcripties in het model. Intercom heeft een versterkend leersysteem ontwikkeld dat gebaseerd is op echte oplossingsresultaten en modellen leert hoe succesvolle klantenservice er werkelijk uitziet: de juiste toon, oordeelsvorming, gespreksstructuur en vooral: hoe je kunt herkennen wanneer een probleem echt is opgelost en wanneer de klant nog steeds gefrustreerd is.

“Generieke modellen worden getraind op algemene gegevens op internet. Specifieke modellen worden getraind op zeer specifieke domeingegevens”, legt McCabe uit. “Daarom is het logisch dat generieke modelintelligentie generiek is, en modelspecifieke intelligentie domeinspecifiek is en daarom op een veel superieure manier werkt voor die gebruiksscenario’s.”

Als McCabe gelijk heeft dat de magie volledig plaatsvindt na de training, wordt de onwil om zijn basis te benoemen moeilijker te rechtvaardigen. Als de grondslagen werkelijk uitwisselbaar zijn, welk concurrentievoordeel beschermt geheimhouding dan?

De inzet van $ 100 miljoen werd beloond

Deze aankondiging komt terwijl de eerste spil van AI Intercom lijkt te werken. De jaarlijkse terugkerende omzet van Fin nadert $100 miljoen en groeit met 3,5x, waardoor het het snelst groeiende segment is in de ARR-activiteiten van $400 miljoen van het bedrijf. Fin zal naar verwachting begin volgend jaar de helft van de totale omzet van Intercom vertegenwoordigen.

Dit traject betekent een opmerkelijke ommekeer. Toen Fin werd gelanceerd, bedroeg het oplossingspercentage slechts 23%. Momenteel bedraagt ​​de acceptatie gemiddeld 67% bij alle klanten, waarbij sommige implementaties bij grote bedrijven zelfs 75% bereiken.

Om dit mogelijk te maken, heeft Intercom zijn AI-team de afgelopen drie jaar uitgebreid van ongeveer zes onderzoekers naar zestig onderzoekers – een aanzienlijke investering voor een bedrijf dat volgens McCabe er ‘in behoorlijk slechte staat’ voor stond voordat het zich op AI richtte. Het gemiddelde groeipercentage van publieke softwarebedrijven ligt rond de 11%; Intercom verwacht dit jaar een groei van 37% te realiseren.

“Wij zijn veruit de eersten in de categorie die ons eigen model trainen”, aldus McCabe. “Niemand anders zal dit een jaar of langer meemaken.”

AI-speciatie en specialisatie

De stelling van McCabe sluit aan bij een bredere trend die Andrej Karpathy, voormalig AI-leider bij Tesla en OpenAI, onlangs omschreef als de ‘speciatie’ van AI-modellen – de proliferatie van gespecialiseerde systemen die zijn geoptimaliseerd voor specifieke taken in plaats van voor algemene intelligentie.

Klantenservice past volgens McCabe perfect bij deze aanpak. Dit is een van de slechts twee of drie gebruiksscenario’s voor zakelijke AI die tot nu toe echte economische grip hebben gekregen, samen met codeerassistenten en mogelijk legale AI. Dit trok meer dan een miljard dollar aan durfkapitaal naar concurrenten als Decagon en Sierra – en maakte de ruimte, in de woorden van McCabe, ‘zeer competitief’.

De vraag is of domeinspecifieke modellen een blijvend voordeel vertegenwoordigen of een tijdelijke arbitrage die uiteindelijk door toonaangevende laboratoria zal worden uitgesloten. McCabe gelooft dat het laboratorium met structurele beperkingen kampt.

“Misschien zal Anthropic in de toekomst veel verschillende speciale modellen aanbieden. Misschien gaat het er zo uitzien”, zei hij. “Maar de realiteit is dat ik niet denk dat generieke modellen kunnen concurreren met de huidige domeinspecifieke modellen.”

Ga verder dan efficiëntie en ervaar

De vroege adoptie van AI in bedrijven was sterk gericht op het verlagen van de kosten: het vervangen van dure menselijke agenten door goedkopere geautomatiseerde agenten. Maar McCabe ziet dat het gesprek zich richt op de kwaliteit van de ervaring.

“In eerste instantie dacht ik: ‘Oh mijn god, we zouden dit eigenlijk voor veel minder geld kunnen doen.’ En nu denken ze: ‘Wacht, nee, we kunnen klanten een veel betere ervaring bieden’, zei hij.

Deze visie gaat verder dan het eenvoudig oplossen van zoekopdrachten. McCabe stelt zich AI-agenten voor die als adviseurs dienen: bots van schoenenwinkels die niet alleen verzendvragen beantwoorden, maar ook stijlsuggesties bieden en klanten laten zien hoe de verschillende opties er uit zouden kunnen zien.

“De klantenservice is altijd verschrikkelijk geweest”, zei McCabe botweg. “Zelfs bij de beste merken wacht je gewoon op een telefoontje en blader je door verschillende afdelingen. Nu is er de mogelijkheid om een ​​werkelijk naadloze klantervaring te bieden.”

Prijs en beschikbaarheid

Voor bestaande Fin-klanten brengt het upgraden naar Apex geen extra kosten met zich mee. Intercom bevestigde dat de klantprijzen ongewijzigd blijven: gebruikers blijven net als voorheen per resultaat betalen, tegen $ 0,99 per voltooide interactie, en profiteren automatisch van het nieuwe model.

Apex is niet beschikbaar als standalone model of via een externe API. Deze modellen zijn alleen toegankelijk via Fin, wat betekent dat bedrijven ze niet zelfstandig kunnen licentiëren of in hun eigen producten kunnen integreren. Die beperking kan het vermogen van Intercom beperken om geld te verdienen met het model buiten het bestaande klantenbestand, maar het behoudt ook het eigendom van de technologie in praktische zin, ongeacht wat het onderliggende model is.

Wat is het volgende

Intercom is van plan Fin buiten de klantenservice uit te breiden naar verkoop en marketing en het te positioneren als een directe concurrent van de Agentforce-visie van Salesforce, die tot doel heeft AI-agenten te bieden gedurende de hele levenscyclus van de klant.

Voor de bredere SaaS-industrie roept de stap van Intercom ongemakkelijke vragen op. Als een 15-jarig klantenservicebedrijf een model kan bouwen dat beter presteert dan OpenAI en Anthropic in zijn domein, wat betekent dat dan voor leveranciers die nog steeds afhankelijk zijn van gewone API-aanroepen? En als ‘post-training de nieuwe doorbraak is’, zoals McCabe beweert, zullen bedrijven die een doorbraak claimen dan onder druk komen te staan ​​om de resultaten van hun werk te laten zien – of zich blijven verschuilen achter concurrentiegeheim terwijl ze transparantie aanprijzen?

McCabe’s antwoord op de eerste vraag: uiteengezet in een recent LinkedIn-berichtheel duidelijk: “Als u geen agentbedrijf kunt worden, zal de toekomst van uw CRUD-applicatiebedrijf nog somberder zijn.”

Het antwoord op de tweede vraag valt nog te bezien.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in