Home Nieuws OpenAI versterkt het ChatGPT-model voor het genereren van afbeeldingen

OpenAI versterkt het ChatGPT-model voor het genereren van afbeeldingen

2
0
OpenAI versterkt het ChatGPT-model voor het genereren van afbeeldingen

OpenAI wordt gelanceerd nieuw AI-model voor beeldgeneratie op dinsdag, genaamd ChatGPT Images 2.0. Het model kan met één opdracht meer dan één afbeelding produceren, zoals een heel leerboek, en ook tekst uitvoeren, ook in niet-Engelse talen zoals Chinees en Hindi. Deze release is wereldwijd beschikbaar voor GPT-chat En Oude manuscripten gebruikers, met een krachtigere versie beschikbaar voor betalende klanten.

Wanneer een groot AI-bedrijf een nieuw imagomodel uitbrengt, kan dit de interesse doen herleven en het gebruik vergroten, vooral als gebruikers van sociale media meme-trends overnemen en daardoor hun eigen zelfbeeld veranderen. Vorig jaar was de lancering door Google van het Nano Banana-model een groot moment voor het bedrijf, vooral toen gebruikers begonnen met posten hyperrealistische beelden van zichzelf online. Eerder dit jaar veroorzaakten ChatGPT-afbeeldingen opschudding op sociale media toen gebruikers ze deelden AI gegenereerde karikaturen.

Wat is het verschil?

Omdat het nieuwe model gebruik kan maken van de “redeneringsmogelijkheden” van ChatGPT, kan Images 2.0 op internet zoeken naar actuele informatie en meer dan één afbeelding tegelijk genereren. In wezen kunnen bots aanvullende stappen gebruiken om vanaf één enkele prompt een grondiger generatie te produceren. Figuur 2.0 heeft ook een nieuwere datadeadline: december 2025.

Dit betekent ook dat de output van het nieuwe model gedetailleerder is. Ik heb bijvoorbeeld een infographic gemaakt met de weersvoorspelling van San Francisco voor de volgende dag, evenals activiteiten die de moeite waard zijn om te doen. De resulterende afbeeldingen van ChatGPT bevatten nauwkeurige weersdetails voor een regenachtige dag, samen met nauwkeurig ogende afbeeldingen van het Ferry Building, Castro Theatre, House of the Painted Lady en de Transamerica Pyramid.

Bovendien is Image 2.0 beter aanpasbaar voor gebruikers die unieke beeldverhoudingen voor beelduitvoer willen. Het nieuwe model kan afbeeldingen produceren van 3:1 breedte tot 1:3 hoogte, en gebruikers kunnen de afbeeldingsgrootte aanpassen als onderdeel van hun opdracht aan de AI-tool.

Eerste indruk

Na een paar uur renderen met het nieuwe model was ik over het algemeen onder de indruk van de tekstweergavemogelijkheden, tenminste in het Engels. Nog niet zo lang geleden bevatte de uitvoer van afbeeldingen, van welk groot model dan ook, vaak veel verkeerd opgemaakte tekens of woorden met onjuiste extra letters. GPT-chat moeite om het te labelen twee jaar eerder nauwkeurig getekend, dus de schonere, complexere uitkomst van Figuur 2.0 is een teken van voortdurende verbetering. Google richt zich ook op het verbeteren van de uitvoer van afbeeldingen waarin tekst wordt weergegeven nieuwste iteratie van Nanobanaan.

Afbeelding kan advertenties bevatten Posters Mensen Koffiedrankjes Koffiekopjes Kleding Jassen en jacks

AI GEGENEREERD DOOR REECE ROGERS

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in