Slechts enkele uren nadat OpenAI zijn vlaggenschipfunderingsmodel had bijgewerkt GPT-5 tot GPT-5.1belooft een verminderd algemeen tokengebruik en een leukere persoonlijkheid met meer vooraf gedefinieerde opties, aldus de Chinese zoekgigant Baidu lanceert een funderingsmodel van de volgende generatie, ERNIE 5.0, naast een reeks AI-productverbeteringen en strategische internationale expansie.
Het doel: een mondiale concurrent worden op de steeds competitiever wordende zakelijke AI-markt.
Aangekondigd tijdens het Baidu World 2025-evenement van het bedrijf, is ERNIE 5.0 een native omnimodaal model dat is ontworpen om gezamenlijk inhoud in tekst, afbeeldingen, audio en video te verwerken en te genereren.
Anders dan de nieuw uitgebrachte Baidu ERNIE-4.5-VL-28B-A3B-Denkendat open source is onder de ondernemingsvriendelijke en tolerante Apache 2.0-licentie, ERNIE 5.0 is een eigen model en is alleen beschikbaar via ERNIE Baidu Bot website (ik moet het handmatig selecteren in de vervolgkeuzelijst Modelkiezer) en Qianfan cloudplatform application programming interface (API) voor zakelijke klanten.
Samen met de lancering van het model introduceerde Baidu ook belangrijke updates voor zijn digitale menselijke platform, tools zonder code en AI-agenten voor algemene doeleinden – allemaal gericht op het uitbreiden van zijn AI-voetafdruk buiten China.
Het bedrijf introduceerde ook ERNIE 5.0 Preview 1022, een variant die is geoptimaliseerd voor tekstintensieve taken, naast een algemeen preview-model dat over de verschillende modaliteiten heen balanceert.
Baidu benadrukte dat ERNIE 5.0 een verandering vertegenwoordigt in de manier waarop intelligentie op grote schaal wordt toegepast, en CEO Robin Li verklaarde: “Wanneer je AI internaliseert, zal het een native mogelijkheid worden en intelligentie transformeren van slechts een kostenpost naar een bron van productiviteit.”
Waar ERNIE 5.0 beter presteert dan GPT-5 en Gemini 2.5 Pro
De benchmarkresultaten van ERNIE 5.0 laten zien dat Baidu pariteit (of bijna pariteit) heeft bereikt met toonaangevende westerse funderingsmodellen over een breed spectrum van taken.
In openbare benchmarkdia’s die tijdens het Baidu World 2025-evenement werden gedeeld, presteerde ERNIE 5.0 Preview beter dan of evenaarde het OpenAI’s GPT-5-High en Google’s Gemini 2.5 Pro in multimodaal redeneren, documentbegrip en op afbeeldingen gebaseerde QAtijdelijk ook demonstreren van sterke taalmodellering en code-uitvoeringsmogelijkheden.
Het bedrijf benadrukt zijn vermogen om gecombineerde input en output over verschillende modaliteiten heen te verwerken, in plaats van te vertrouwen op post-hoc modaliteitsfusie, wat wordt beschouwd als een technische differentiator.
Op visuele taken behaalde ERNIE 5.0 topscores op OCRBench, DocVQA en ChartQA, drie benchmarks die documentherkenning, -begrip en gestructureerde data-redenering testen.
Baidu beweert dat het model de GPT-5-High en Gemini 2.5 Pro verslaat in document- en grafische benchmarks, gebieden die het beschrijft als kern van de toepassingen van het bedrijf, zoals geautomatiseerde documentverwerking en financiële analyse.
Bij het genereren van afbeeldingen evenaarde of overtrof ERNIE 5.0 Google’s Veo3 in categorieën, waaronder semantische uitlijning en beeldkwaliteit, volgens de op GenEval gebaseerde interne evaluatie van Baidu. Baidu beweert dat de multimodale integratie van het model het mogelijk maakt om visuele inhoud te genereren en te interpreteren met een groter contextueel bewustzijn dan modellen die afhankelijk zijn van modaliteitsspecifieke encoders.
Voor audio- en spraaktaken demonstreerde ERNIE 5.0 concurrerende resultaten op de MM-AU- en TUT2017-benchmarks voor audiobegrip, en beantwoordde het vragen over gesproken taalinvoer. De audioprestaties, hoewel niet zo benadrukt als visie of tekst, vertonen sporen van brede mogelijkheden die bedoeld zijn om multimodale toepassingen met een volledig spectrum te ondersteunen.
Bij taaltaken laat het model sterke resultaten zien bij het volgen van instructies, het beantwoorden van feitelijke vragen en wiskundig redeneren – kerngebieden die het nut van grote taalmodellen voor ondernemingen bepalen.
Previewvariant 1022 van ERNIE 5.0, afgestemd op tekstuele prestaties, toont sterkere taalspecifieke resultaten bij vroege toegang voor ontwikkelaars. Hoewel Baidu geen brede superioriteit claimt op het gebied van algemene taalredeneringen, blijkt uit de interne evaluatie dat ERNIE 5.0 Preview 1022 de kloof met Engelse topmodellen overbrugt en beter presteert op het gebied van Chinese taalprestaties.
Hoewel Baidu geen volledige benchmarkdetails of ruwe scores publiekelijk heeft vrijgegeven, toont de positionering van de prestaties een doelbewuste poging om ERNIE 5.0 niet als een specifiek multimodaal systeem te framen, maar als een vlaggenschipmodel dat concurreert met de grootste gesloten modellen op het gebied van redeneren voor algemene doeleinden.
Baidu beweert dat de voordelen ervan liggen in het gestructureerd begrijpen van documenten, het visueel redeneren van grafieken en de integratie van meerdere modaliteiten in één native modelleringsarchitectuur.. Onafhankelijke verificatie van deze resultaten is in behandeling, maar de breedte van de geclaimde capaciteiten positioneert ERNIE 5.0 als een serieus alternatief in het multimodale landingsbaanmodellandschap.
Prijsstrategie van het bedrijf
ERNIE 5.0 bevindt zich op einde premie Prijsstructuur van het Baidu-model. Het bedrijf heeft speciale prijzen vrijgegeven voor API-gebruik op het Qianfan-platform, waardoor de kosten in lijn worden gebracht met andere topaanbiedingen van Chinese rivalen zoals Alibaba.
|
Model |
Invoerkosten (per 1K-tokens) |
Uitvoerkosten (per 1K-tokens) |
Bron |
|
ERNIE 5.0 |
$ 0,00085 (¥ 0,006) |
$ 0,0034 (¥ 0,024) |
|
|
ERNIE 4.5 Turbo (bijv.) |
$ 0,00011 (¥ 0,0008) |
$ 0,00045 (¥ 0,0032) |
|
|
Qwen3 (voorbeeldcode) |
$ 0,00085 (¥ 0,006) |
$ 0,0034 (¥ 0,024) |
Het kostenverschil tussen ERNIE 5.0 en eerdere modellen zoals ERNIE 4.5 Turbo onderstreept de strategie van Baidu om onderscheid te maken tussen modellen met een hoog volume en lage kosten en modellen met hoge prestaties die zijn ontworpen voor complexe taken en multimodale overwegingen.
Vergeleken met andere Amerikaanse alternatieven blijven de prijzen in het middensegment:
|
Model |
Invoer (/1 miljoen tokens) |
Uitvoer (/1 miljoen tokens) |
Bron |
|
GPT-5.1 |
$ 1,25 |
$ 10,00 |
|
|
ERNIE 5.0 |
$ 0,85 |
$ 3,40 |
|
|
ERNIE 4.5 Turbo (bijv.) |
$ 0,11 |
$ 0,45 |
|
|
Taak sluiten 4.1 |
$ 15,00 |
$ 75,00 |
|
|
Tweeling 2.5 Pro |
$1,25 (≤200k) / $2,50 (>200k) |
$10,00 (≤200k) / $15,00 (>200k) |
|
|
Grok 4 (grok-4-0709) |
$ 3,00 |
$ 15,00 |
Mondiale expansie: producten en platforms
Gelijktijdig met de lancering van het model breidt Baidu internationaal uit:
-
GenFlow 3.0die nu meer dan 20 miljoen gebruikers heeft, is de grootste AI-agent voor algemene doeleinden van het bedrijf en beschikt over verbeterd geheugen en multimodale taakafhandeling.
-
Bekendeen zichzelf ontwikkelend middel dat complexe problemen dynamisch kan oplossen, is nu op uitnodiging commercieel verkrijgbaar.
-
BangDe internationale versie van Baidu’s codeloze maker Miaoda is wereldwijd beschikbaar via medo.dev.
-
Ertsproductiviteitswerkruimte met ondersteuning voor documenten, dia’s, afbeeldingen, video’s en podcasts, heeft wereldwijd meer dan 1,2 miljoen gebruikers bereikt.
Het digitale menselijke platform van Baidu, dat in Brazilië is gelanceerd, maakt ook deel uit van de mondiale inspanningen. Volgens bedrijfsgegevens maakte 83% van de livestreamers op het “Double 11” winkelevenement van dit jaar in China gebruik van de digitale menselijke technologie van Baidu, wat bijdroeg aan een stijging van 91% in GMV.
Ondertussen heeft Baidu’s autonome voertuigboekingsservice Apollo Go de grens van 17 miljoen ritten overschreden, exploiteert een vloot zonder bestuurder in 22 steden en claimt de titel van ’s werelds grootste robotaxinetwerk.
Open Source Vision-taalmodellen trekken de aandacht van de industrie
Twee dagen vóór het vlaggenschipevenement ERNIE 5.0 bracht Baidu ook een open source multimodaal model uit onder de Apache 2.0-licentie: ERNIE-4.5-VL-28B-A3B-Denken.
Als gerapporteerd door mijn collega Michael Nuñez bij VentureBeatdit model maakt slechts 3 miljard parameters mogelijk, terwijl een totaal van 28 miljard parameters behouden blijft, waarbij gebruik wordt gemaakt van een Mixture-of-Experts (MoE)-architectuur voor efficiënte gevolgtrekking.
Belangrijke technische innovaties zijn onder meer:
-
“Thinking with Pictures”, dat dynamische, op zoom gebaseerde visuele analyse mogelijk maakt
-
Ondersteuning voor kaartinterpretatie, documentbegrip, visuele basis en temporeel bewustzijn in video
-
Runtime op één enkele GPU van 80 GB, waardoor deze toegankelijk is voor middelgrote organisaties
-
Volledige compatibiliteit met Baidu’s Transformers, vLLM en FastDeploy toolkits
Deze release verhoogt de druk op closed source-concurrenten. Met een Apache 2.0-licentie wordt de ERNIE-4.5-VL-28B-A3B-Thinking een levensvatbaar basismodel voor commerciële toepassingen zonder licentiebeperkingen – iets wat slechts enkele krachtige modellen in deze klasse bieden.
Inbreng van de gemeenschap en Baidu-reactie
Na de lancering van ERNIE 5.0 heeft AI-ontwikkelaar en evaluator Lisan al Gaib (@scaling01) plaatste gemengde recensies op X. Hoewel ze aanvankelijk onder de indruk waren van de benchmarkprestaties van het model, rapporteerden ze aanhoudende problemen toen ERNIE 5.0 de tool herhaaldelijk aanriep (zelfs als er expliciet werd opgedragen dat niet te doen) tijdens het maken van SVG-taken.
“De ERNIE 5.0-benchmarks leken gek totdat ik ze testte… helaas heeft RL hersenbeschadiging of hebben ze ernstige problemen met hun chatplatform/prompting-systeem”, schreef Lisan.
Binnen enkele uren, Baidu’s op ontwikkelaars gerichte ondersteuningsaccount, @ErnieforDevs, reageert:
“Bedankt voor de input! Dit is een bekende bug; bepaalde syntaxis kan deze consistent activeren. We werken aan een oplossing. Je kunt proberen de opdracht opnieuw te formuleren of aan te passen om deze op dit moment te vermijden.”
De snelle ommekeer weerspiegelt de toegenomen nadruk van Baidu op communicatie met ontwikkelaars, vooral omdat Baidu internationale gebruikers aantrekt via exclusieve aanbiedingen en open source.
Vooruitzichten voor Baidu en de ERNIE basis LLM-familie
Baidu’s ERNIE 5.0 markeert een strategische upgrade in de wereldwijde race naar funderingsmodellen. Met prestatieclaims die het op één lijn stellen met de modernste systemen van OpenAI en Google, evenals een combinatie van premiumprijzen en open access-alternatieven, demonstreert Baidu zijn ambitie om niet alleen een binnenlandse AI-leider te worden, maar ook een geloofwaardige mondiale infrastructuuraanbieder.
In een tijd waarin zakelijke AI-gebruikers steeds meer multimodale prestaties, flexibele licenties en implementatie-efficiëntie eisen, zou Baidu’s tweesporenaanpak – premium gehoste API’s en open source releases – de aantrekkingskracht ervan in zowel de bedrijfs- als de ontwikkelaarsgemeenschap kunnen vergroten.
Of de prestatieclaims van het bedrijf bestand zijn tegen tests door derden, valt nog te bezien. Maar in een landschap dat wordt beïnvloed door stijgende kosten, complexiteit van modellen en rekenbeperkingen, geven ERNIE 5.0 en het ondersteunende ecosysteem Baidu een concurrentiepositie in de volgende golf van AI-adoptie.

