Skip to content

OpenAI lanserar ny generation AI-bildgenerator

Bildkälla: Kollage
Bildkälla: Kollage

​OpenAI har lanserat en uppdaterad version av AI-bildgenereringsmodell som är direkt integrerat i modellen GPT-4o i ChatGPT. Denna förbättrade modell ersätter den tidigare DALL-E 3 och erbjuder användare möjligheten att skapa mer realistiska och detaljerade bilder direkt inom ChatGPT och den kan även skapa text på ett korrekt sätt i bilder.

Men en enkel prompt (beskrivning) får vi en bild med korrekt text och en logisk förklaring på hur ett prisma fungerar. Den nya ChatGPT bildgeneratorn förstår bättre logik och text i bilder och vad du menar i din beskrivning av bild.
Men en enkel prompt (beskrivning) får vi en bild med korrekt text och en logisk förklaring på hur ett prisma fungerar. Den nya ChatGPT bildgeneratorn förstår bättre logik och text i bilder och vad du menar i din beskrivning av bild.
Du kan fortsätta att prompta och gör om den första bilden till något annat.
Du kan fortsätta att prompta och gör om den första bilden till något annat.

Generera text i bild och mycket mer

GPT-4o är en multimodal modell, vilket innebär att den kan förstå och generera både text och bilder. En av de viktigaste förbättringarna jämfört med tidigare versioner är modellens ökade förmåga att skapa realistiska och detaljerade bilder samt korrekt återge text och symboler inuti genererade bilder.

Skapa en serietidning genom endast att beskriva i text. Text i bild blir korrekt.
Skapa en serietidning genom endast att beskriva i text. Text i bild blir korrekt.
Visalisera en enkel logisk instruktion genom att endast beskriva det i text.
Visalisera en enkel logisk instruktion genom att endast beskriva det i text.

Nedan kan du se ett urval av olika typer av bilder genererat med ChatGPT. ChatGPT kan nu generera fotorealistiska bilder, någon som den hade svårt med förut, men nu klarar av riktigt bra.

Gör om en bild till en annan och ladda upp din egna bild och redigera med ChatGPT.

Mer användbara och precisa bilder

För att uppnå dessa framsteg har OpenAI använt sig av “reinforcement learning from human feedback” (RLHF), där över 100 mänskliga tränare har bidragit till att korrigera fel i AI-genererade bilder. Denna metod har avsevärt förbättrat modellens förmåga att följa användarinstruktioner och producera mer användbara och precisa bilder.

Den är jättebra, men med vissa utmaningar

Trots dessa framsteg kvarstår vissa utmaningar, såsom svårigheter med att exakt återge komplexa detaljer i bilder. Vissa av dessa utmaningar som bildgeneratorn har är:

  • Beskärning av bild
  • Hallucinationer – kan hitta på saker som du inte bad om i bilden

  • Problem med stark bindning – när du skapar bilder som baseras på kunskap/verklighet så kan den ha svårt att hålla reda på mer än 10 till 20 saker åt gången i bilden.

  • Att skapa exakta grafer eller tabeller

  • Flerspråkig textrendering

  • Exakt redigering – kan vara svårt för den att redigera din bild exakt så som du vill ha det

  • Att skapa en bild med riktigt mycket text i bilden kan vara svårt

OpenAI fortsätter dock sitt arbete med att förbättra modellens kapacitet och säkerhetsåtgärder för att förhindra missbruk, inklusive implementering av filter för att blockera skapandet av skadligt innehåll.

Tillgänglig för alla användare som standard AI-bildgenerator

DEnnan ya generation ab AI-bildgenerator nu lanserat av ChatGPT rullas ut till ChatGPT Plus-, Teams-, Pro och även gratisanvändare. När denna utrullning når Sverige återstår att se, det kan eventuellt ta lite längre innan vi i EU får tillgång till denna nya AI-bildgenerator från OpenAI, det återstår att se. I skrivande stund har vi i Sverige ej tillgång.

Detta är ännu ett stort steg i att göra AI-bildgenerering mer avancerad där den förstår mer exakt vad användaren vill visualisera och kan skapa en bild med större precision. Samt att du kan skapa karaktärer och den karaktären kan ChatGPT minnas och återskapa i andra miljöer och scener, något som är eftertraktad av många, specielt i våra AI-utbildningar har många frågat och önskat efter detta, och nu är det äntligen här! Vi ser såklart till att du lär dig allt detta i vår AI-utbildning i ChatGPT, låt kreativiteten flöda!

Missa inte senaste AI nyheter. Avregistrera när du vill.

Tipsa vän eller kollega om artikeln
AI-quiz-x1b

Hur bra är du på att upptäcka AI-bilder? Gör vår AI-Quiz

kontakt@aiutbildning.se

Publicerat av: Marko Tosic