Home Nieuws Verder dan het meer: ​​NEXUS Fundamental omzeilt handmatige ETL met een eigen...

Verder dan het meer: ​​NEXUS Fundamental omzeilt handmatige ETL met een eigen basismodel voor tabelgegevens

4
0
Verder dan het meer: ​​NEXUS Fundamental omzeilt handmatige ETL met een eigen basismodel voor tabelgegevens

De deep learning-revolutie heeft een vreemde blinde vlek: spreadsheets. Terwijl het Large Language Model (LLM) de nuances van menselijk proza ​​beheerst en beeldmakers het digitale canvas beheersen, worden de relationele en gestructureerde gegevens die ten grondslag liggen aan de wereldeconomie – de rijen en kolommen van ERP-systemen, CRM’s en financiële grootboeken – tot nu toe beschouwd als gewoon een ander bestandsformaat dat lijkt op tekst of pdf.

Hierdoor kunnen bedrijven bedrijfsresultaten voorspellen met behulp van op maat gemaakte, arbeidsintensieve datawetenschapsprocessen, namelijk handmatige feature-engineering en klassieke machine learning-algoritmen die dateren van vóór het moderne deep learning.

Maar nu Fundamenteeleen in San Francisco gevestigd AI-bedrijf dat mede is opgericht door DeepMind-alumni vandaag gelanceerd met een totale financiering van 255 miljoen dollar om deze kloof te overbruggen.

Het bedrijf verscheen in het geheim en lanceerde NEXUS, een Large Tabular Model (LTM) dat is ontworpen om bedrijfsgegevens niet als een eenvoudige reeks woorden te behandelen, maar als een complex netwerk van niet-lineaire relaties.

Medeoprichters Jeremy Fraenkel, Annie Lamont en Gabriel Suissa. Krediet: fundamenteel

De technologie: verder gaan dan sequentiële logica

De meeste AI-modellen van vandaag zijn gebaseerd op sequentiële logica: het voorspellen van het volgende woord in een zin of de volgende pixel in een frame.

Bedrijfsgegevens zijn echter in wezen niet-sequentieel. Het risico van klantverloop is niet slechts een kwestie van tijd; het is een multidimensionaal kruispunt van transactiefrequentie, steunsentiment en regionale economische verschuivingen. Bestaande LLM’s hebben hier moeite mee omdat ze niet passen binnen de beperkingen en dimensies van bedrijfsschaaltabellen.

“De meest waardevolle gegevens ter wereld bevinden zich in tabellen en tot nu toe is er geen goed fundamenteel model gebouwd om deze specifiek te begrijpen”, zegt Jeremy Fraenkel, CEO en medeoprichter van Fundamental.

In een recent interview met VentureBeat benadrukte Fraenkel dat, ook al is de AI-wereld geobsedeerd door tekst, audio en video, tabellen de grootste modaliteit voor bedrijven blijven. “LLM kan dit soort gegevens echt niet goed verwerken,” legt hij uit, “en bedrijven vertrouwen momenteel op zeer verouderde machine learning-algoritmen om voorspellingen te doen.”

NEXUS is getraind op miljarden real-world tabellarische datasets met behulp van Amazon SageMaker HyperPod. In tegenstelling tot traditionele XGBoost- of Random Forest-modellen, waarbij datawetenschappers handmatig functies moeten definiëren (specifieke variabelen waar het model naar moet kijken), is NEXUS ontworpen om onbewerkte tabellen rechtstreeks op te nemen.

Het identificeert latente patronen in kolommen en rijen die menselijke analisten mogelijk over het hoofd zien, en leest effectief de verborgen taal van het raster om niet-lineaire interacties te begrijpen.

Valkuilen bij tokenisatie

De belangrijkste reden waarom traditionele LLM’s falen in tabelgegevens is de manier waarop ze getallen verwerken. Fraenkel legt uit dat de LLM getallen op dezelfde manier tokeniseert als woorden, en ze opsplitst in kleinere delen. “Het probleem is dat ze hetzelfde toepassen op getallen. Tabellen zijn over het algemeen numeriek”, zei Fraenkel. “Als je getallen als 2,3, ‘2’, ‘.’ en ‘3’ als drie verschillende tokens ziet, betekent dat dat je het begrip van de getalverdeling verliest. Het is niet zoals een rekenmachine; je krijgt niet altijd het juiste antwoord omdat het model het concept van getallen niet van nature begrijpt.”

Bovendien zijn tabelgegevens order-invariant, terwijl taal dat niet is. Fraenkel gebruikt een voorbeeld uit de gezondheidszorg om dit te illustreren: “Als ik u een tabel met honderdduizenden patiënten zou geven en u zou vragen te schatten wie van hen diabetes had, zou het niet uitmaken of de eerste kolom lengte en de tweede kolom gewicht was, of omgekeerd.”

Hoewel LLM erg gevoelig is voor de woordvolgorde in de prompt, is NEXUS ontworpen om te begrijpen dat een verschuiving in de kolompositie de onderliggende voorspelling niet zal beïnvloeden.

Werkt op de voorspellende laag

Recente spraakmakende integraties, zoals Claude Anthropic verschijnt rechtstreeks in Microsoft Excelhebben laten weten dat de LLM de tabel al heeft ingevuld.

Fraenkel onderscheidt fundamenteel werk echter als opererend op een fundamenteel andere laag: de voorspellende laag. “Wat ze doen is eigenlijk op de formulelaag: formules zijn tekst, net als code”, zei hij. “We proberen u geen financiële modellen in Excel te laten bouwen. Wij helpen u met het maken van prognoses.”

NEXUS is ontworpen om binnen enkele seconden beslissingen te nemen zonder dat er een mens bij betrokken is, zoals een creditcardaanbieder die bepaalt of een transactie frauduleus is wanneer u veegt.

Terwijl tools zoals Claude spreadsheets kunnen samenvatten, is NEXUS gebouwd om de volgende regel te voorspellen, of het nu gaat om apparatuurstoringen in een fabriek of de waarschijnlijkheid dat een patiënt opnieuw in het ziekenhuis wordt opgenomen.

Architectuur en beschikbaarheid

De kernwaardepropositie van Fundamental is het radicaal verkorten van de tijd tot inzicht. Traditioneel kan het bouwen van een voorspellend model maanden handmatig werk vergen.

“Je moet een leger datawetenschappers inhuren om alle datapijplijnen te bouwen om de data te verwerken en op te schonen”, legt Fraenkel uit. “Als er ontbrekende waarden of inconsistente data zijn, werkt je model niet. Die pipeline moet je voor elke use case bouwen.”

De fundamentele claim van NEXUS is om dit hele handmatige proces te vervangen door slechts één regel code. Omdat het model vooraf is getraind op een miljard tabellen, vereist het niet hetzelfde niveau van taakspecifieke training of feature-engineering als traditionele algoritmen.

Terwijl Fundamental zich van de geïsoleerde fase naar de bredere markt verplaatst, doet het dit met een commerciële structuur die is ontworpen om traditionele barrières voor de adoptie van bedrijfssoftware te overwinnen.

Het bedrijf heeft verschillende zevencijferige contracten binnengehaald met Fortune 100-organisaties, een prestatie die mogelijk wordt gemaakt door een strategische go-to-market-architectuur waarin Amazon Web Services (AWS) fungeert als de recordverkoper op AWS Marketplace.

Hierdoor kunnen bedrijfsleiders NEXUS aanschaffen en implementeren met behulp van bestaande AWS-credits, waardoor voorspellende intelligentie effectief wordt behandeld als een standaardhulpprogramma naast rekenkracht en opslag. Voor de ingenieurs die met de implementatie waren belast, was deze ervaring indrukwekkend, maar veroorzaakte ze niet veel wrijving; NEXUS werkt via een op Python gebaseerde interface op de pure voorspellende laag, niet op de conversatielaag.

Ontwikkelaars verbinden onbewerkte tabellen rechtstreeks met het model en labelen specifieke doelkolommen (zoals de kans op kredietverzuim of de onderhoudsrisicoscore) om prognoses te activeren. Het model voert regressies of classificaties vervolgens rechtstreeks in de datastack van het bedrijf in en functioneert als een snelle, inactieve machine voor geautomatiseerde besluitvorming, in plaats van als een op chat gebaseerde assistent.

De inzet voor de samenleving: verder gaan dan het eindresultaat

Hoewel de commerciële implicaties van vraagvoorspelling en prijsvoorspelling duidelijk zijn, benadrukt Fundamentals de sociale voordelen van voorspellende intelligentie.

Het bedrijf benadrukt belangrijke gebieden waarop NEXUS negatieve gevolgen kan voorkomen door signalen te identificeren die verborgen zijn in gestructureerde gegevens.

Door sensorgegevens en onderhoudsgegevens te analyseren, kan NEXUS storingen zoals leidingcorrosie voorspellen. Het bedrijf wees op de Flint-watercrisis – die meer dan 1 miljard dollar kostte om te repareren – als een voorbeeld waarbij voorspellende monitoring levensbedreigende besmetting zou kunnen voorkomen.

Op dezelfde manier zorgden de tekorten aan persoonlijke beschermingsmiddelen er tijdens de COVID-19-crisis voor dat ziekenhuizen in één jaar tijd 323 miljard dollar aan verliezen leden. Fundamentalisten beweren dat NEXUS, door productie- en epidemiologische gegevens te gebruiken, aanbodtekorten 4 tot 6 weken vóór de piekvraag kan voorspellen, waardoor de noodproductie op tijd kan worden geactiveerd om levens te redden.

Op het gebied van het klimaat streeft NEXUS ernaar voorspellingen te doen over 30 tot 60 dagen van overstromingen en droogtes, zoals de overstromingen in Pakistan in 2022, die verliezen van 30 miljard dollar veroorzaakten.

Ten slotte werd het model gebruikt om het risico op heropname in het ziekenhuis te voorspellen door de demografische gegevens van patiënten en sociale determinanten te analyseren. Zoals het bedrijf het verwoordde: “Een alleenstaande moeder met twee banen mag niet terugkeren naar de Eerste Hulp omdat we niet hadden kunnen voorspellen dat ze vervolgzorg nodig had.”

Prestaties versus prestatielatentie

In de zakenwereld verschilt de definitie van beter per bedrijfstak. Voor sommigen is het snelheid; voor anderen is het ruwe nauwkeurigheid.

“Wat de latentie betreft, hangt het af van de use case”, legt Fraenkel uit. “Als je een onderzoeker bent die probeert te begrijpen welke medicijnen je aan patiënten in Afrika moet geven, doet de latentie er niet zoveel toe. Je probeert nauwkeurigere beslissingen te nemen die uiteindelijk zoveel mogelijk levens kunnen redden.”

Voor een bank of hedgefonds daarentegen zal zelfs een kleine toename in nauwkeurigheid enorme waarde opleveren.

“Het verbeteren van de nauwkeurigheid van de voorspellingen met een half procent is voor de banken miljarden dollars waard”, aldus Fraenkel. “Voor verschillende gebruiksscenario’s zal de omvang van de procentuele verbetering veranderen, maar we kunnen u betere prestaties leveren dan wat u nu heeft.”

De ambitieuze visie kreeg veel steun

De $225 miljoen kostende Series A, geleid door Oak HC/FT met deelname van Salesforce Ventures, Valor Equity Partners en Battery Ventures, geeft aan dat er veel vertrouwen bestaat dat tabelgegevens de volgende grote doorbraak zullen zijn.

Prominente engelinvesteerders, waaronder leiders van Perplexity, Wiz, Brex en Datadog, bevestigen de stamboom van het bedrijf verder.

Annie Lamont, medeoprichter en managing partner bij Oak HC/FT, herhaalde dat sentiment: “Het belang van fundamentele modellen kan moeilijk worden overschat: relationele en gestructureerde gegevens moeten de voordelen van de deep learning-revolutie nog zien.”

Fundamenteel positioneert zichzelf niet alleen als een zoveelste AI-tool, maar als een nieuwe categorie van zakelijke AI. Met een team van ongeveer 35 mensen gevestigd in San Francisco beweegt het bedrijf zich van het tijdperk van op maat gemaakte modellen naar het tijdperk van basismodellen voor tafels.

“Het traditionele algoritme is de afgelopen tien jaar hetzelfde gebleven, maar er is geen vooruitgang in geboekt”, zegt Fraenkel. “Ons model blijft verbeteren. We doen hetzelfde voor tabellen als ChatGPT voor tekst.”

Partner van AWS

Via een strategisch partnerschap met Amazon Web Services (AWS) kan NEXUS rechtstreeks in het AWS-dashboard worden geïntegreerd. AWS-klanten kunnen dit model implementeren met behulp van bestaande credits en infrastructuur. Fraenkel omschreef dit als een “zeer unieke overeenkomst”, aangezien Fundamental een van de slechts twee AI-bedrijven is die zo’n diep en gelaagd partnerschap met Amazon hebben opgebouwd.

Een van de grootste uitdagingen voor zakelijke AI is gegevensprivacy. Bedrijven zijn vaak niet bereid gevoelige gegevens naar de infrastructuur van derden te verplaatsen.

Om dit aan te pakken hebben Fundamental en Amazon een enorme technische prestatie geleverd: de mogelijkheid om een ​​volledig gecodeerd model – zowel de architectuur als het gewicht – rechtstreeks in de eigen omgeving van de klant te implementeren. “Klanten kunnen erop vertrouwen dat hun gegevens bij hen zijn”, aldus Fraenkel. “Wij zijn vandaag de dag het eerste en enige bedrijf dat met succes een dergelijke oplossing heeft gecreëerd.”

De opkomst van Fundamental was een poging om OS voor zakelijke beslissingen opnieuw te definiëren. Als NEXUS werkt zoals geadverteerd – door financiële fraude, energieprijzen en verstoringen van de toeleveringsketen aan te pakken met één gemeenschappelijk model – zal dit het moment markeren waarop AI eindelijk leert de spreadsheets te lezen die feitelijk de wereld besturen. The Power to Predict gaat niet langer over zien wat er gisteren is gebeurd; het gaat over het blootleggen van de verborgen taal van tabellen om te bepalen wat er morgen gebeurt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in