Home Nieuws Palona gaat verticaal, lanceert Vision-functie, Workflow: 4 belangrijke lessen voor AI-makers

Palona gaat verticaal, lanceert Vision-functie, Workflow: 4 belangrijke lessen voor AI-makers

5
0
Palona gaat verticaal, lanceert Vision-functie, Workflow: 4 belangrijke lessen voor AI-makers

Het bouwen van een AI-bedrijf op een ‘fundering van drijfzand’ is vandaag de dag een belangrijke uitdaging voor oprichters, aldus leiders van Palonaan.

Vandaag maakt de in Palo Alto gevestigde startup – geleid door een voormalige technische expert van Google en Meta – een beslissende verticale sprong in de restaurant- en horecaruimte met de lancering van vandaag van Palona Vision en Palona Workflow.

Het nieuwe aanbod verandert de multimodale agentsuite van het bedrijf in een realtime besturingssysteem voor restaurantactiviteiten, inclusief camera’s, oproepen, gesprekken en gecoördineerde taakuitvoering.

Dit nieuws markeert een strategische spil voor het bedrijf debuut begin 2025toen het voor het eerst opkwam $ 10 miljoen aan startfinanciering om emotioneel intelligente verkoopagenten te bouwen voor een breed scala aan direct-to-consumer bedrijven.

Door zijn focus nu te beperken tot een ‘echte multimodale’ benadering voor restaurants, biedt Palona AI-makers een blauwdruk voor hoe ze verder kunnen gaan dan de ‘dunne schaal’ om diepgaande systemen te bouwen die grote problemen in de fysieke wereld oplossen.

“Je bouwt een bedrijf op een fundament van zand – geen drijfzand, maar stuifzand”, zegt medeoprichter en CTO Tim Howes, verwijzend naar de instabiliteit van het huidige LLM-ecosysteem. “Dus hebben we een orkestratielaag gebouwd waarmee we modellen kunnen uitruilen op het gebied van prestaties, soepelheid en kosten.”

VentureBeat sprak onlangs rechtstreeks met Howes en mede-oprichter en CEO Maria Zhang op – waar anders? – een restaurant in NYC over de technische uitdagingen en harde lessen van de lancering, groei en spil ervan.

Nieuw aanbod: visie en workflow als ‘digitale GM’

Voor de eindgebruiker (de restauranteigenaar of exploitant) is Palona’s nieuwste release ontworpen om te dienen als een geautomatiseerde ‘ultieme operations manager’ die nooit slaapt.

Palona Vision maakt gebruik van beveiligingscamera’s in de winkel om operationele signalen te analyseren, zoals de lengte van de wachtrij, het aantal tafels, knelpunten bij de opstelling en netheid, zonder dat daarvoor nieuwe hardware nodig is.

Spelen en helpen. Krediet: gelukkig

Het bewaakt front-of-house-gegevens zoals wachtrijlengte, tafelomzet en netheid, terwijl back-of-house-problemen worden geïdentificeerd, zoals trage installatie of fouten bij het instellen van stations.

Palona Workflow maakt dit compleet door operationele processen in meerdere stappen te automatiseren. Dit omvat het beheren van cateringbestellingen, checklists voor het openen en sluiten en de uitvoering van de voedselbereiding. Door videosignalen van Vision te correleren met Point-of-Sale (POS)-gegevens en personeelsbezetting, zorgt Workflow voor een consistente uitvoering op alle locaties.

“Palona Vision is alsof je elke locatie een digitale GM geeft”, zegt Shaz Khan, oprichter van Tono Pizzeria + Cheesesteaks, in een persbericht aan VentureBeat. “Dit signaleert problemen voordat ze groter worden en bespaart mij elke week tijd.”

Verticaal gaan: lessen in domeinexpertise

Palona’s reis begon met een met sterren bezaaide selectie. CEO Zhang was eerder VP Engineering bij Google en CTO van Tinder, terwijl medeoprichter Howes de mede-uitvinder is van LDAP en voormalig CTO van Netscape.

Ondanks deze achtergrond was het eerste jaar van het team een ​​les in de noodzaak van focus.

Aanvankelijk richtte Palona zich op mode- en elektronicamerken en creëerde ’tovenaars’- en ‘surfer’-persoonlijkheden om de verkoop af te handelen. Het team realiseerde zich echter al snel dat de restaurantindustrie een unieke kans van biljoenen dollars bood die “verrassend recessiebestendig” was, maar “verwoestend” door operationele inefficiënties.

“Advies voor oprichters van startups: ga niet multi-industrieel”, waarschuwt Zhang.

Door te verticaliseren gaat Palona van een ‘dunne’ chatlaag naar een ‘multi-sensorische informatiepijplijn’ die beeld, geluid en tekst tegelijkertijd verwerkt.

Deze duidelijkheid van de focus opent de toegang tot eigen trainingsgegevens (zoals voorbereidingshandleidingen en gesprekstranscripties) terwijl algemene gegevensverzameling wordt vermeden.

1. Het bouwen van ‘verstuivingszand’

Om tegemoet te komen aan de realiteit van zakelijke AI-implementaties in 2025 – waarbij bijna elke week nieuwe, verbeterde modellen worden uitgebracht – ontwikkelde Palona een orkestratielaag waarvoor patent is aangevraagd.

In plaats van te “bundelen” met een enkele provider zoals OpenAI of Google, stelt Palona’s architectuur hen in staat modellen voor een dubbeltje uit te wisselen op basis van prestaties en kosten.

Ze gebruiken een mix van eigen en open source-modellen, waaronder Gemini voor benchmarks voor computervisie en aangepaste taalmodellen voor de vloeiendheid van Spaans of Mandarijn.

Voor fabrikanten is de boodschap duidelijk: laat de kernwaarde van uw product niet afhankelijk zijn van één enkele leverancier.

2. Van woorden naar ‘wereldmodellen’

De lancering van Palona Vision vertegenwoordigt een verschuiving van het begrijpen van woorden naar het begrijpen van de fysieke realiteit van een keuken.

Terwijl veel ontwikkelaars moeite hebben om afzonderlijke API’s te verenigen, verandert Palona’s nieuwe visiemodel camera’s in de winkel in operationele assistenten.

Het systeem identificeert in realtime ‘oorzaak en gevolg’: herkent of een pizza niet gaar is vanwege de ‘lichtbeige’ kleur of waarschuwt managers als een vitrine leeg is.

“Met andere woorden: de natuurkunde doet er niet toe”, legt Zhang uit. “Maar de waarheid is dat ik de telefoon liet vallen, hij lag altijd uit… we wilden echt weten wat er aan de hand was in de restaurantwereld.”

3. De ‘Muffin’-oplossing: aangepaste geheugenarchitectuur

Een van de belangrijkste technische uitdagingen waarmee Palona werd geconfronteerd, was geheugenbeheer. In de restaurantcontext is herinnering het verschil tussen een frustrerende interactie en een ‘magische’ interactie waarbij de agent de ‘gebruikelijke’ bestelling van het diner onthoudt.

Het team gebruikte aanvankelijk een niet-gespecificeerde open source-tool, maar deze bleek maar liefst 30% fouten op te leveren. “Ik denk dat adviseur-ontwikkelaars het geheugen altijd uitschakelen (op AI-producten voor consumenten), omdat dat de boel verpest”, waarschuwde Zhang.

Om dit aan te pakken heeft Palona Muffin gebouwd, een eigen geheugenbeheersysteem genoemd naar de webcookie. In tegenstelling tot standaard vectorgebaseerde benaderingen die worstelen met gestructureerde gegevens, is Muffin ontworpen om met vier verschillende lagen om te gaan:

  • Gestructureerde gegevens: Stabiele feiten zoals verzendadressen of allergie-informatie.

  • Langzaam veranderende afmetingen: loyaliteitsvoorkeuren en favoriete items.

  • Tijdelijke en seizoensherinneringen: aanpassing aan veranderingen, zoals het verkiezen van koude dranken in juli boven warme chocolademelk in de winter.

  • Regionale context: standaard, zoals tijdzone of taalvoorkeur.

Les voor bouwers: als de beste beschikbare tool niet goed genoeg is voor uw specifieke branche, moet u bereid zijn deze zelf te bouwen.

4. Betrouwbaarheid door ‘GRACE’

In de keuken zijn AI-fouten niet alleen maar typefouten; het is óf een nutteloos commando, óf een veiligheidsrisico. Een recent incident in Stefanina’s Pizza Restaurant in Missouri, waar AI tijdens het diner neptransacties hallucineertHet benadrukt hoe snel het merkvertrouwen kan verdampen als er geen bescherming is.

Om dergelijke chaos te voorkomen, houden Palona-ingenieurs de interne onderdelen in de gaten GRACE-framework:

  • Vangrails: strikte beperkingen op het gedrag van agenten om niet-goedgekeurde promoties te voorkomen.

  • Red Teaming: Proactieve inspanningen om de AI te ‘breken’ en potentiële triggers voor hallucinaties te identificeren.

  • Toepassingssectie: API’s vergrendelen en integratie van derden met TLS, tokenisatie en systemen voor aanvalspreventie.

  • Naleving: Baseer elk antwoord op geverifieerde en doorgelichte menugegevens om nauwkeurigheid te garanderen.

  • Escalatie: Stuur complexe interacties door naar menselijke managers voordat gasten onjuiste informatie ontvangen.

Deze betrouwbaarheid wordt geverifieerd door middel van grootschalige simulaties. “We hebben miljoenen manieren gesimuleerd om pizza te bestellen,” zei Zhang, waarbij hij de ene AI gebruikte om als klant op te treden en de andere om de bestelling op te nemen, waarbij de nauwkeurigheid werd gemeten om hallucinaties te elimineren.

Het belangrijkste is

Met de lancering van Vision en Workflow gokt Palona erop dat de toekomst van enterprise AI niet ligt in brede assistenten, maar in gespecialiseerde ‘besturingssystemen’ die in specifieke domeinen kunnen zien, horen en denken.

In tegenstelling tot AI-agenten voor algemeen gebruik, is het systeem van Palona ontworpen om de workflows van restaurants uit te voeren en niet alleen om te reageren op vragen. Het is in staat om klanten te onthouden, hen ‘gewoon’ eten te horen bestellen en de restaurantactiviteiten te monitoren om er zeker van te zijn dat ze eten aan klanten leveren volgens hun interne processen en richtlijnen, en signaleert wanneer er fouten of cruciale problemen optreden. over Fout.

Voor Zhang is het doel om menselijke operators zich op hun vak te laten concentreren: “Als je dat heerlijke eten hebt… zullen we je vertellen wat je moet doen.”

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in