Home Nieuws Google heeft FunctionGemma uitgebracht: een klein edge-model dat mobiele apparaten met natuurlijke...

Google heeft FunctionGemma uitgebracht: een klein edge-model dat mobiele apparaten met natuurlijke taal kan besturen

19
0
Google heeft FunctionGemma uitgebracht: een klein edge-model dat mobiele apparaten met natuurlijke taal kan besturen

Ook al maakt de Gemini 3 nog steeds furore, Google waagt geen sprong in het diepe bij het uitbrengen van nieuwe modellen.

Gisteren dus het bedrijf heeft FunctionGemma uitgebrachteen op maat gemaakt AI-model met 270 miljoen parameters, ontworpen om een ​​van de meest hardnekkige obstakels in de moderne applicatieontwikkeling op te lossen: superieure betrouwbaarheid.

In tegenstelling tot chatbots voor algemene doeleinden is FunctionGemma ontworpen voor één belangrijk hulpprogramma: het vertalen van gebruikersopdrachten in natuurlijke taal naar gestructureerde code die kan worden uitgevoerd door applicaties en apparaten, allemaal zonder verbinding te maken met de cloud.

Deze release markeert een belangrijke strategische spil voor Google DeepMind en het Google AI Development-team. Terwijl de industrie schaalgrootte blijft nastreven met biljoenen parameters in de cloud, zet FunctionGemma in op “Small Language Models” (SLM) die lokaal draaien op telefoons, browsers en IoT-apparaten.

Voor AI-ingenieurs en bedrijfsbouwers biedt het model een nieuwe architecturale primitief: een privacy-first “router” die complexe logica kan verwerken op apparaten met een verwaarloosbare latentie.

FunctionGemma is direct beschikbaar om te downloaden Knuffelend gezicht En Kaggle. Je kunt het model ook in actie zien door de Google AI Edge Gallery-app te downloaden in de Google Play Store.

Prestatiesprong

In de kern pakt FunctionGemma de ‘uitvoeringskloof’ in generatieve AI aan. Standaard grote taalmodellen (LLM’s) zijn geweldig in gesprekken, maar hebben vaak moeite om softwareacties op betrouwbare wijze te activeren, vooral op apparaten met beperkte middelen.

Volgens de interne ‘Mobile Actions’-evaluatie van Google worstelde een veelgebruikt klein model met de betrouwbaarheid en bereikte het slechts 58% basisnauwkeurigheid voor functieaanroeptaken. Eenmaal aangepast voor dit specifieke doel, steeg de nauwkeurigheid van FunctionGemma echter naar 85%, waardoor een aangepast model ontstond dat hetzelfde succesniveau kon aantonen als modellen die vele malen groter waren.

Het diagram toont de prestaties van FunctionGemma voor en na verbeteringen. Krediet: Google

Hierdoor kan het model meer aan dan alleen een simpele aan/uit-schakelaar; het kan complexe argumenten ontleden, zoals het identificeren van specifieke rastercoördinaten om spelmechanismen of gedetailleerde logica aan te sturen.

Deze release bevat meer dan alleen modelgewichten. Google biedt een compleet ‘recept’ voor ontwikkelaars, waaronder:

  • Model: 270 miljoen parametertransformator getraind op 6 biljoen tokens.

  • Trainingsgegevens: een verzameling ‘Mobiele acties’-gegevens waarmee ontwikkelaars hun eigen agenten kunnen trainen.

  • Ecosysteemondersteuning: compatibiliteit met Hugging Face Transformers, Keras, Unsloth en NVIDIA NeMo-bibliotheken.

Omar Sanseviero, Developer Experience Lead bij Hugging Face, benadrukte de veelzijdigheid van de release

Deze local-first-aanpak biedt drie duidelijke voordelen:

  • Privacy: Persoonlijke gegevens (zoals agenda-items of contacten) verlaten het apparaat nooit.

  • Latentie: Acties gebeuren onmiddellijk zonder te wachten op een round-trip-server. Dankzij het kleine formaat is de invoerverwerkingssnelheid aanzienlijk, vooral met toegang tot versnellers zoals GPU’s en NPU’s.

  • Kosten: Ontwikkelaars betalen geen API-kosten per token voor eenvoudige interacties.

Voor AI-makers: nieuwe patronen voor productieworkflows

Voor bedrijfsontwikkelaars en systeemarchitecten stelt FunctionGemma voor om van monolithische AI-systemen over te stappen naar federatieve systemen. In plaats van elk klein gebruikersverzoek naar een groot en duur cloudmodel zoals GPT-4 of Gemini 1.5 Pro te sturen, kunnen ontwikkelaars FunctionGemma nu inzetten als een intelligente ‘verkeerscontroller’ aan de edge.

Hier ziet u hoe een AI-maker het gebruik van FunctionGemma in de productie zou moeten conceptualiseren:

1. Architectuur “Verkeersregelaar”: In een productieomgeving kan FunctionGemma fungeren als eerste verdedigingslinie. Het bevindt zich op het apparaat van de gebruiker en verwerkt rechtstreeks algemene, hoogfrequente opdrachten (navigatie, mediabediening, basisgegevensinvoer). Als een verzoek diep nadenken of wereldkennis vereist, kan het model die behoefte identificeren en het verzoek doorsturen naar een groter cloudmodel. Deze hybride aanpak vermindert de kosten en latentie van cloud-inferentie drastisch. Dit maakt gebruiksscenario’s mogelijk, zoals het routeren van zoekopdrachten naar de juiste subagenten.

2. Deterministische betrouwbaarheid ten opzichte van creatieve chaos: Bedrijven hebben hun bank- of agenda-apps zelden ‘creatief’ nodig. Ze hebben het nodig dat het accuraat is. De sprong naar een nauwkeurigheid van 85% bevestigt dat specialisatie belangrijker is dan grootte. Door deze kleine modellen te verfijnen op basis van domeinspecifieke gegevens (bijvoorbeeld eigen bedrijfs-API’s) ontstaan ​​tools die zeer betrouwbaar zijn en zich voorspelbaar gedragen – een vereiste voor productie-implementaties.

3. Privacy-First-naleving: Voor sectoren als de gezondheidszorg, de financiële sector of beveiligde bedrijfsactiviteiten brengt het verzenden van gegevens naar de cloud vaak compliancerisico’s met zich mee. Omdat FunctionGemma efficiënt genoeg is om op apparaten te draaien (compatibel met NVIDIA Jetson, mobiele CPU’s en browsergebaseerde Transformers.js), hoeven gevoelige gegevens zoals PII of eigen opdrachten het lokale netwerk niet te verlaten.

Vergunningen: Open met vangrail

FunctionGemma is uitgebracht op basis van de gewoonte van Google Gebruiksvoorwaarden van Gemma. Voor zakelijke en commerciële ontwikkelaars is dit een belangrijk verschil met standaard open source-licenties zoals MIT of Apache 2.0.

Hoewel Google Gemma omschrijft als een ‘open model’, is het niet strikt ‘Open Source’ volgens de Open Source Initiative (OSI)-definitie.

Deze licentie staat gratis commercieel gebruik, herdistributie en wijziging toe, maar omvat bepaalde gebruiksbeperkingen. Het is ontwikkelaars niet toegestaan ​​dit model te gebruiken voor beperkte activiteiten (zoals het genereren van haatzaaiende uitlatingen of malware), en Google behoudt zich het recht voor om deze voorwaarden bij te werken.

Voor de meeste startups en ontwikkelaars is de licentie tolerant genoeg om commerciële producten te bouwen. Teams die technologieën voor tweeërlei gebruik ontwikkelen of technologieën die strikte auteursrechtvrijheid vereisen, moeten echter specifieke clausules met betrekking tot “schadelijk gebruik” en attributie herzien.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in