OpenAI har lanserat en uppdaterad version av AI-bildgenereringsmodell som är direkt integrerat i modellen GPT-4o i ChatGPT. Denna förbättrade modell ersätter den tidigare DALL-E 3 och erbjuder användare möjligheten att skapa mer realistiska och detaljerade bilder direkt inom ChatGPT och den kan även skapa text på ett korrekt sätt i bilder.


Generera text i bild och mycket mer
GPT-4o är en multimodal modell, vilket innebär att den kan förstå och generera både text och bilder. En av de viktigaste förbättringarna jämfört med tidigare versioner är modellens ökade förmåga att skapa realistiska och detaljerade bilder samt korrekt återge text och symboler inuti genererade bilder.


Nedan kan du se ett urval av olika typer av bilder genererat med ChatGPT. ChatGPT kan nu generera fotorealistiska bilder, någon som den hade svårt med förut, men nu klarar av riktigt bra.
Gör om en bild till en annan och ladda upp din egna bild och redigera med ChatGPT.
Mer användbara och precisa bilder
För att uppnå dessa framsteg har OpenAI använt sig av “reinforcement learning from human feedback” (RLHF), där över 100 mänskliga tränare har bidragit till att korrigera fel i AI-genererade bilder. Denna metod har avsevärt förbättrat modellens förmåga att följa användarinstruktioner och producera mer användbara och precisa bilder.
Den är jättebra, men med vissa utmaningar
Trots dessa framsteg kvarstår vissa utmaningar, såsom svårigheter med att exakt återge komplexa detaljer i bilder. Vissa av dessa utmaningar som bildgeneratorn har är:
- Beskärning av bild
-
Hallucinationer – kan hitta på saker som du inte bad om i bilden
-
Problem med stark bindning – när du skapar bilder som baseras på kunskap/verklighet så kan den ha svårt att hålla reda på mer än 10 till 20 saker åt gången i bilden.
-
Att skapa exakta grafer eller tabeller
-
Flerspråkig textrendering
-
Exakt redigering – kan vara svårt för den att redigera din bild exakt så som du vill ha det
-
Att skapa en bild med riktigt mycket text i bilden kan vara svårt
OpenAI fortsätter dock sitt arbete med att förbättra modellens kapacitet och säkerhetsåtgärder för att förhindra missbruk, inklusive implementering av filter för att blockera skapandet av skadligt innehåll.
Tillgänglig för alla användare som standard AI-bildgenerator
DEnnan ya generation ab AI-bildgenerator nu lanserat av ChatGPT rullas ut till ChatGPT Plus-, Teams-, Pro och även gratisanvändare. När denna utrullning når Sverige återstår att se, det kan eventuellt ta lite längre innan vi i EU får tillgång till denna nya AI-bildgenerator från OpenAI, det återstår att se. I skrivande stund har vi i Sverige ej tillgång.
Detta är ännu ett stort steg i att göra AI-bildgenerering mer avancerad där den förstår mer exakt vad användaren vill visualisera och kan skapa en bild med större precision. Samt att du kan skapa karaktärer och den karaktären kan ChatGPT minnas och återskapa i andra miljöer och scener, något som är eftertraktad av många, specielt i våra AI-utbildningar har många frågat och önskat efter detta, och nu är det äntligen här! Vi ser såklart till att du lär dig allt detta i vår AI-utbildning i ChatGPT, låt kreativiteten flöda!