Volg ZDNET: Voeg ons toe als voorkeursbron op Google.
Kernpunten van ZDNET
- OpenAI herkadert afbeeldingen als beeldtaal.
- De denkmodus bouwt contextbewuste infographics.
- Merkloyaliteit blijft inconsistent bij de eerste tests.
Vandaag heeft OpenAI ChatGPT Images 2.0 aangekondigd, het beeldmodel van de volgende generatie, dat zich volgens het bedrijf richt op precisie, bruikbaarheid en complexe visuele taken.
De meest opvallende nieuwe mogelijkheid is de mogelijkheid om tekst en afbeeldingen te combineren om complexe en mooie pagina’s te creëren. OpenAI herformuleert het hele idee van beeldcreatie van een proces dat decoratie creëert (de woorden) naar een taal (ook de termen).
Ook: Beste AI-beeldgeneratoren van 2026: Er is nu maar één winnaar
OpenAI beschrijft het als volgt: “Een goed beeld doet wat een goede zin doet: het selecteert, organiseert en drukt uit. Het kan mechanismen verklaren, een stemming oproepen, een idee testen of een argument aandragen.”
Denkvermogen maakt complexe workflows mogelijk
Naast het veel betere vermogen om tekst en afbeeldingen te combineren, maakt het nieuwe model gebruik van verbeterde denkmogelijkheden. Het kan meerdere afbeeldingen per prompt produceren met continuïteit in de uitvoer. Deze benadering is mogelijk omdat het model de redenering daadwerkelijk in de beelduitvoer integreert.
Deze verschuiving is groot. In plaats van eenvoudigweg een afbeelding te maken die aan de vereiste details voldoet, kan Afbeelding 2.0 vagere opdrachten uitvoeren, zoals “Maak een infographic over de activiteiten die ik moet doen, rekening houdend met het weer van morgen in San Francisco.”
Ook: Hoe u kunt overstappen van ChatGPT naar Gemini
Op basis van deze opdrachten verzamelt de AI weer- en activiteitsgegevens in San Francisco, bepaalt welke activiteiten overeenkomen met het weer en maakt vervolgens een afbeelding of een reeks afbeeldingen die overeenkomen met de resultaten.
Volgens OpenAI: “In dit model gedraagt Images 2.0 zich meer als een partner voor visueel denken, die helpt projecten van een ruw concept naar een voltooid product te brengen, met minder werk van uw kant.”
Precisiebediening en ontwerp verbeteren de bruikbaarheid
Velen van ons hebben lang moeite gehad om ChatGPT ervan te overtuigen afbeeldingen in een bepaalde gewenste beeldverhouding te produceren. Vaak produceert AI koppig wat het wil. Maar nu, met Image 2.0, ondersteunt het model een “3:1 brede en 1:3 hoge beeldverhouding.”
Het model ondersteunt ook hifi-uitvoer die (meestal) nauwkeurige objectplaatsing, gedetailleerde tekstweergave en complexe composities oplevert. We zullen kijken of we het woord ‘meest’ uit die zin kunnen verwijderen zodra het product officieel is uitgebracht.
Ook: ik heb Persoonlijke Intelligentie geprobeerd en de resultaten waren accuraat (maar verontrustend)
AI ondersteunt ook kleine tekst, UI-elementen en stijlbeperkingen tot een resolutie van 2K. Koud.
Voorbeeld testen
Ik kreeg de dag vóór de release toegang tot een preview en de meeste modellen zijn indrukwekkend. Ik gaf hem een screenshot van de ZDNET-startpagina en een concept van het Images 2.0-persbericht.
Vervolgens gaf ik de opdracht: “Maak op basis van de inhoud van het persbericht een 16:9-infographic over de nieuwe afbeeldingsupdate en laat deze de merkstijl van ZDNET gebruiken, zoals weergegeven in het ZDNET-startpaginadocument.”
Bovendien: ik heb de nieuwe AI Enhancement-tool van Google Foto’s geprobeerd: hoe deze je foto’s bijsnijdt, markeert en verbetert – soms
Het model deed het goed in de infographic, maar hoe het ook zij, het kon het ZDNET-logo niet reproduceren. Bij de eerste poging zag de Z in ZDNET er een beetje slap uit.
Ik heb verschillende verzoeken geprobeerd in de volgorde: “ZDNET-logo repareren. Z hangt in jouw versie, maar niet in het daadwerkelijke logo.” Maar Afbeeldingen 2.0 is er nooit in geslaagd dit probleem op te lossen.
Daarom startte ik een nieuwe sessie. Deze keer heb ik de instructie toegevoegd: “Wees voorzichtig bij het nauwkeurig reproduceren van het ZDNET-logo.”
Ook: ik heb ChatGPT Plus versus Gemini Pro getest om te zien welke beter is – en of het de overstap waard is
Dit is waar dingen echt raar worden. Voor de eerste run heeft het model op de een of andere manier een kopie van het ZDNET-logo opgegraven voorafgaand aan ons herontwerp in 2022. Dit logo is momenteel niet te vinden op onze startpagina. Verrassend genoeg wordt het oude logo weergegeven in het huidige kleurenschema. Het model duwt vervolgens het logo en de infographic-informatie vanaf de linkerrand van de afbeelding. Hij koos ook voor lichtblauw voor “Images 2.0”, wat niet de merkkleur van ZDNET is.
Ik heb mijn best gedaan om hem ervan te overtuigen het huidige logo te gebruiken. Ik slaagde erin de afbeelding naar rechts te duwen, zodat er niets werd bijgesneden. Maar het toevoegen van de opdracht “Gebruik het bestaande ZDNET-logo op de aangeboden pagina. Zoek niet naar alternatieve logo’s” loste geen enkel probleem op.
Ik heb deze uitdaging nog een keer geprobeerd voordat ik besloot terug te keren om dit artikel af te maken. Opnieuw startte ik een nieuwe sessie zodat de AI geen spiergeheugen had van eerdere rekenfouten.
Ook: deze krachtige Gemini-instellingen maken mijn AI-resultaten veel persoonlijker en nauwkeuriger
Het model heeft het logo opnieuw verprutst. Deze keer besloot AI een roervorm toe te voegen aan de uitgerekte stam van de hoofdletter D.
Om eerlijk te zijn, gebruik ik een pre-releaseversie van Image 2.0. Ik kom terug met een veel uitgebreidere modeltest na de officiële productrelease.
Ik heb ook een soortgelijke test geprobeerd met een ander document met Google’s Nano Banana Pro, maar omdat die test niet met synthese omgaat zoals deze nieuwe versie van het OpenAI-product dat doet, kon hij de resultaten die ik hier kreeg niet reproduceren. We zullen meer weten als we verder testen
Prijs en beschikbaarheid
Dit nieuwe model is vandaag beschikbaar voor alle ChatGPT- en Codex-gebruikers. Geavanceerde uitvoer- en denkmogelijkheden zijn beschikbaar voor ChatGPT Plus-, Pro-, Business- en Enterprise-gebruikers. Zorg ervoor dat u ‘Denken’ selecteert in de vervolgkeuzelijst ChatGPT bovenaan het scherm.
Op het moment van schrijven, vóór de release, is het nieuwe Images 2.0-model alleen beschikbaar op desktop. Maar OpenAI belooft dat deze mogelijkheid ook aanwezig zal zijn in de mobiele versie, samen met de mogelijkheid om afbeeldingen met je vinger te selecteren via het aanraakscherm van je mobiel.
Afbeeldingen zijn ook beschikbaar via API met behulp van het gpt-image-2-model. API-prijzen variëren afhankelijk van kwaliteit, gedachte (mijn woord) en gewenste beeldresolutie.
Als AI een combinatie van lay-out en inhoud aankan, zou dit dan de manier veranderen waarop u ontwerpprojecten benadert? Laat het ons weten in de reacties hieronder.
Je kunt mijn dagelijkse projectupdates volgen op sociale media. Zorg ervoor dat u zich abonneert op mijn wekelijkse update-nieuwsbrief en volg mij op Twitter/X op @DavidGewirtzop Facebook op Facebook.com/DavidGewirtz, op Instagram op Instagram.com/DavidGewirtz, op Bluesky op @DavidGewirtz.com en op YouTube op YouTube.com/DavidGewirtzTV.


