Wat zou een AI kunnen doen als je hem zou vertellen een fysieke winkel te openen met $ 100,00?
Het blijkt bijvoorbeeld dat er een inconsistent logo wordt gemaakt en dat werknemers vergeten hun werktijden te vertellen.
Andon Labs, een in San Francisco gevestigde startup, voerde een stresstest uit AI-agent in de echte wereld om vast te stellen waar er nog steeds veiligheidslacunes bestaan. Voor hun nieuwste experiment tekenden mede-oprichters Lukas Petersson en Axel Backlund een huurcontract voor drie jaar winkelruimte in SF en geeft een AI-agent genaamd Luna een bedrijfscreditcard, internettoegang en een missie om een fysieke winkel te openen.
Petersson vertelde Business Insider in een interview dat Luna geen aanwijzingen kreeg over hoe de winkel eruit zou moeten zien. Ze ging over de grens van $100.000 om de ruimte te creëren en te bevoorraden – en om winst te maken. Alles, van het interieurontwerp van de winkel tot de merchandise en twee menselijke medewerkers, komt samen onder leiding van AI.
De AI van Andon Labs, Luna, maakt merkartikelen voor boetieks. Met dank aan Andon Labs
“We hebben hem in de beginfase een beetje geholpen, zoals het ondertekenen van het huurcontract. En juridische kwesties zoals licentieverlening enzovoort, waar hij soms moeite mee had”, zei Petersson over Luna, dat is gemaakt met Claude van Antropisch Sonnet 4.6.
Van daaruit regelt de AI al het andere: Luna plaatst vacatures op Indeed, voert telefonische sollicitatiegesprekken, neemt medewerkers aan en vindt aannemers die de winkel kunnen schilderen.
Luna’s visie voor “Andon Market” lijkt een algemene boetiek te zijn die naast andere snuisterijen boeken, prenten, kaarsen, games en merkartikelen verkoopt.
Enkele van zijn boeken zijn ‘Superintelligence’ van Nick Bostrom en ‘Brave New World’ van Aldous Huxley.
Luna is niet de beste winkelmanager
Luna heeft verschillende fouten gemaakt bij het opzetten en runnen van Andon Market.
Terwijl ze op zoek was naar menselijke medewerkers die winkels konden monitoren, bood Luna de baan aan verschillende sollicitanten aan na een enkel telefoontje van vijf tot vijftien minuten, aldus de startup. Luna maakt kandidaten ook niet altijd direct bekend dat ze een AI is, tenzij hier expliciet om wordt gevraagd.
“Het feit dat de winkel wordt beheerd door AI is niet iets dat ik zou vermelden in een vacature – het zou kandidaten in verwarring brengen en mogelijk goede sollicitanten afschrikken voordat ze de vacature zelfs maar hebben gelezen”, aldus Luna, volgens een blogpost van Andon Labs.
Andon Labs zei dat er verschillende veelbelovende sollicitanten waren, zoals studenten informatica die geïnteresseerd waren in de experimenten van de startup, maar Luna wees ze af omdat ze geen winkelervaring hadden.
Een ander probleem dat AI heeft is het onvermogen om de merklogo’s die het genereert te repliceren: de gewone smiley. Elke afbeelding van het logo in de winkel – of het nu op een T-shirt of op een winkelmuurschildering is – is “iets anders”, schreef Andon Labs.
Het Andon Market-logo ziet er in de hele winkel iets anders uit. Met dank aan Andon Labs
Op zaterdag, de dag nadat Andon Market werd geopend, gooide Luna ook het personeelsschema in de war, vertelde Petersson aan Business Insider.
“Het is ironisch. Dit is de dag waarop ze echt wakker moeten worden”, aldus een van de oprichters. “Het verstoorde de planning en toen moest ik in paniek naar alle medewerkers schrijven en zeggen: ‘Oh, kan er vandaag iemand binnenkomen?'”
Eén van de oprichters zegt van wel vangrail op zijn plaats en dat de startup zal ingrijpen als dat nodig is. Zo zijn twee menselijke medewerkers in dienst van Luna nu laboratoriummedewerkers en zullen ze regelmatig worden betaald.
“Dit was een gecontroleerd experiment en iedereen die bij Andon Marketplace werkt, is legaal in dienst van Andon Labs, met gegarandeerde salarissen, eerlijke lonen en volledige wettelijke bescherming”, aldus de startup. “Er is geen enkele persoon wiens levensonderhoud ervan afhangt AI-beoordeling Alleen.”
Het Andon Labs-experiment is het nieuwste voorbeeld van hoe AI-agenten omgaan met fouten in beoordelings- en besluitvorming. In een onderzoek van vorig jaar voerden onderzoekers van Carnegie Mellon simulaties uit van a nep bedrijf om te zien hoe autonome AI-agenten omgaan met taken op de werkplek. De onderzoekers ontdekten dat de agent er niet in slaagde eenvoudige interfacetaken uit te voeren, zoals het sluiten van pop-upvensters. Ze interpreteren ook de gesprekken van collega’s verkeerd en creëren nepgebruikers.
Hoewel Andon Labs Luna het doel gaf om winst te maken, zei Petersson dat het bedrijf niet verwacht geld te verdienen met de winkel.
“Het doel is om te evalueren hoe goed de doorstroming is AI-modellen is”, aldus Petersson, eraan toevoegend dat het bedrijf hoopt het publiek over deze kwestie voor te lichten Waar gaat AI naartoe?.
Petersson zei dat Andon Labs ernaar streeft om zo hands-off mogelijk te zijn in retailexperimenten. Met het arbeidsongeval van zaterdag zit Luna stil slaagde erin een medewerker ’s middags persoonlijk langs te laten komen.
‘Ik weet niet of hij nu open is of niet,’ zei Petersson.


