Home Nieuws Deze AI-aangedreven motor verandert foto’s in geuren

Deze AI-aangedreven motor verandert foto’s in geuren

2
0
Deze AI-aangedreven motor verandert foto’s in geuren

Stel je een herinnering uit je kindertijd voor, een herinnering die echt en vol nostalgie aanvoelt, maar op de een of andere manier ongrijpbaar is: misschien een familie-uitje naar het strand, of een moment waarop je aan een speeltje slingert, of een middag op jacht naar klavertje vier. Stel je nu voor dat je die gouden momenten in een geur zou kunnen verwerken.

Een wetenschapper bij METCyrus Clarke probeert precies dat te doen. Samen met een team van collega-onderzoekers heeft Clarke een fysieke machine ontwikkeld, genaamd Anemoia-apparaatdie gebruik maken van een generatieve AI-modellen om archieffoto’s te analyseren, ze in korte zinnen te beschrijven en, na input van de gebruiker, die beschrijvingen om te zetten in unieke geuren.

Het woord ‘anemoia’ is dat wel gemaakt door schrijver John Koenig en opgenomen in zijn boek uit 2021, Woordenboek van duistere smarten. Het verwijst naar een bepaald gevoel van nostalgie naar een tijd of plaats die je nog nooit persoonlijk hebt ervaren – en dat is wat het team van Clarke hoopt vast te leggen met het Anemoia Device.

Volgens een papier Dit apparaat, gepubliceerd door het team, onderzoekt het concept van ‘extra geheugen’, of het idee dat herinneringen in het digitale tijdperk steeds vaker worden opgeslagen en toegankelijk worden gemaakt via externe media, zoals digitale archieven.

Uit onderzoek is gebleken dat herinneringen indirect kunnen worden gevormd – bijvoorbeeld wanneer tweedehands rekeningen, misschien van ouders, iemands herinneringen vormgeven – maar het Anemoia-apparaat is een leuk fysiek en interactief experiment in hoe AI waardoor gebruikers misschien herinneringen kunnen ervaren aan een verleden dat ze nooit echt hebben meegemaakt.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Anemoia-apparaat

Het Anemoia-apparaat ziet eruit als iets dat zou kunnen worden gevonden in de medische ruimte van een retro sci-fi ruimteschip. Het is een slank apparaat, gemaakt van metaal en plastic met een enkel neongroen schermaccent en een eenvoudige reeks van drie fysieke wijzerplaten. Onderaan wacht een bekerglas om het uiteindelijke aroma op te vangen.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Om te beginnen plaatst de gebruiker een foto in het apparaat. Het ingebouwde vision-taalmodel (VLM) analyseert de afbeelding en genereert een eerste onderschrift op basis van wat het vindt. Voor een afbeelding van toeristen in China, een voorbeeld dat in de krant wordt gebruikt, zou de tool kunnen schrijven: ‘Een toerist in zwarte korte broek en een kind poseert in een deuropening langs de Grote Muur van China, met zijn iconische stenen trappen en bergachtig landschap dat zich uitstrekt tot aan de hemel.’

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Gebruikers kunnen vervolgens de ondertitelingsparameters aanpassen met drie knoppen: één om aan te geven welke persoon of object in de afbeelding het onderwerp moet zijn; de tweede om de leeftijd van het onderwerp te beschrijven; en de derde om de sfeer van de scène te beschrijven.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

“Persoonlijk ben ik erg geïnteresseerd in het creëren van nieuwe fysieke interfaces voor generatieve AI”, zegt Clarke. “Generatieve AI begint meestal met lege commando’s. De knoppen vervangen ze door gemakkelijk te begrijpen fysieke grammatica. Je probeert niet ‘het juiste te zeggen’ tegen een algoritme, het lijkt meer op het afstemmen van een instrument.”

Het taalleermodel, gebouwd op ChatGPT-4o, combineert echte tekst en gebruikersinvoer tot korte, poëtische verhalen. Als je de Grote Muur van China zelf als onderwerp van de bovengenoemde vraag zou kiezen, zou het resultaat ongeveer zo zijn: ‘Door de eeuwen heen, van de Strijdende Staten tot de Ming-dynastie, heb ik met vreugde het verstrijken van de tijd en de talloze ontdekkingsreizigers op mijn pad van steen, baksteen en hout gadegeslagen.’

Vervolgens komt de meest indrukwekkende taak van de LLM: deze geschreven gedichten omzetten in echte geuren.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Het ruikt naar een geheugenportaal

Het proces van geurontwikkeling is niet alleen afhankelijk van het identificeren van de juiste geurnoten, maar ook van het oproepen van de juiste emoties.

Het team van Clarke trainde het model om te kiezen uit een geurbibliotheek van 39 verschillende geuren (sindsdien uitgebreid naar een breder portfolio van 50 geuren), variërend van oude boeken tot leer en vuil. Elke geur is gecodeerd met een reeks descriptoren, waarbij de geur wordt gelabeld met details zoals de hoofdnoot, gerelateerde concepten en sterkste emoties. Het Large Language Model (LLM) gebruikt zijn training om de juiste geur te selecteren en te bepalen hoeveel van de geur in het uiteindelijke brouwsel moet worden gebruikt.

Al die informatie wordt naar een speciaal reukscherm gevoerd, dat vier pompen gebruikt om de benodigde vloeistof uit de fles te zuigen en in een wachtende beker te doen (de uiteindelijke formule voor de geur van de Grote Muur van China omvat kampvuur, aarde, cederhout en bamboe). Het Anemoia-apparaat kan een vrijwel onbeperkt aantal geuren vastleggen, variërend van de geur van een zandstrand op een zomerdag in de jaren 80 met de geur van een stel dat geniet van peren in een prachtige tuin.

Uiteindelijk, zo concludeert de studie, is het apparaat een provocatie die de vraag stelt “wat het betekent om te onthouden wanneer herinneringen zelf kunnen worden gegenereerd, wat het betekent om te voelen wanneer die gevoelens samen met machines worden gecreëerd, en wat het betekent om mens te zijn als we mooie en geurige ficties kunnen creëren uit een verleden dat we nog nooit hebben geleefd.”

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in