Home Nieuws AI-modellen beginnen te leren door zichzelf vragen te stellen

AI-modellen beginnen te leren door zichzelf vragen te stellen

18
0
AI-modellen beginnen te leren door zichzelf vragen te stellen

Zelfs de slimste kunstmatige intelligentie modellen zijn in wezen copycats. Ze leren door voorbeelden van menselijk werk te consumeren of door te proberen problemen op te lossen die door menselijke instructeurs zijn gesteld.

Maar misschien kan AI op een meer menselijke manier leren – door interessante vragen te bedenken die ze zichzelf kunnen stellen en door te proberen de juiste antwoorden te vinden. Een project van Tsinghua UniversiteitDat Peking Instituut voor Algemene Kunstmatige Intelligentie (BIGAI) en Pennsylvania State University laten zien dat AI op deze manier kan leren redeneren door met computercode te spelen.

De onderzoekers ontwierpen een systeem genaamd Absoluut nul reden (AZR) was de eerste die grote taalmodellen gebruikte om uitdagende maar oplosbare Python-coderingsproblemen te genereren. Vervolgens gebruikt het hetzelfde model om het probleem op te lossen voordat het de werking ervan controleert door te proberen de code uit te voeren. En ten slotte gebruikt het AZR-systeem successen en mislukkingen als signalen om het oorspronkelijke model te verbeteren, waardoor het beter in staat is betere problemen te stellen en op te lossen.

Het team ontdekte dat hun aanpak de codeer- en redeneervaardigheden van de 7 miljard en 14 miljard parameterversies aanzienlijk verbeterde. Qwen open source taalmodel. Op indrukwekkende wijze presteerde het model zelfs beter dan sommige modellen die door mensen samengestelde gegevens ontvingen.

Ik sprak met Andrew Zhaoeen promovendus aan de Tsinghua Universiteit die ook met het oorspronkelijke idee voor Absolute Zero kwam Zilong Zhengeen onderzoeker bij BIGAI die samen met hem aan het project werkte, via Zoom.

Zhao vertelde me dat deze aanpak lijkt op een manier van menselijk leren die verder gaat dan uit het hoofd leren of imitatie. “Eerst imiteer je je ouders en gedraag je je als je leraar, maar dan moet je eigenlijk je eigen vragen stellen”, zei hij. “En uiteindelijk kun je degenen die je op school lesgaven overtreffen.”

Zhao en Zheng merken op dat het idee van AI-leren op deze manier, ook wel ‘autonoom spelen’ genoemd, vele jaren teruggaat en eerder is onderzocht door mensen als Jürgen Schmidhuberberoemde AI-pioniers, en Pierre-Yves Oudeyereen computerwetenschapper bij Inria in Frankrijk.

Een van de meest interessante elementen van het project is volgens Zheng het vermogen van het model om problemen te stellen en problemen op te lossen. “De moeilijkheidsgraad neemt toe naarmate het model robuuster wordt,” zei hij.

De grootste uitdaging is dat het systeem momenteel alleen werkt op vragen die gemakkelijk te controleren zijn, zoals vragen die betrekking hebben op wiskunde of coderen. Naarmate het project vordert, kan het mogelijk zijn om het te gebruiken voor AI-agenttaken, zoals surfen op internet of kantoorwerk. Het kan daarbij gaan om een ​​AI-model dat probeert te beoordelen of de acties van de agent correct zijn.

Een interessante mogelijkheid van een benadering als Absolute Zero is dat het modellen in theorie in staat stelt de menselijke leer te overstijgen. “Als we dat eenmaal hebben, is het een manier om superintelligentie te bereiken,” vertelde Zheng me.

Er zijn vroege tekenen dat de Absolute Zero-aanpak vaste voet begint te krijgen in sommige grote AI-laboratoria.

Een project genaamd Agent0van Salesforce, Stanford en de Universiteit van North Carolina in Chapel Hill, waarbij agenten softwaretools gebruiken die zichzelf verbeteren door in hun eigen tempo te spelen. Net als Absolute Zero wordt dit model beter in algemeen redeneren door middel van experimentele probleemoplossing. A nieuwste papier geschreven door onderzoekers van Meta, de Universiteit van Illinois, en Carnegie Mellon University presenteert een systeem dat soortgelijke games in eigen tempo gebruikt voor software-engineering. De auteurs van dit werk beweren dat dit “een eerste stap is in de richting van een trainingsparadigma voor superintelligente softwareagenten.”

Het vinden van nieuwe manieren waarop AI kan leren zal dit jaar waarschijnlijk een groot thema zijn in de technologie-industrie. Naarmate conventionele gegevensbronnen steeds schaarser en duurder worden, en laboratoria op zoek gaan naar nieuwe manieren om modellen capabeler te maken, zullen projecten als Absolute Zero waarschijnlijk AI-systemen opleveren die minder copycats zijn en meer op mensen lijken.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in