Mycket av AI handlar om att generera bilder trots att AI så ofta gör fel

av | jun 29, 2025 | Artificiell intelligens, Bluesky, Mastodon, Twitter

AI kan generera bilder och det går att framställa fantastiska saker men AI:s akilleshäl är också just bilder.

Låter du AI-modellerna få skapa fritt så fungerar det men ska du skapa något specifikt, korrigera enstaka detaljer eller försöka att bygga upp en bild steg för steg så lär det misslyckas.

Jag frågade ChatGPT:

Varför är du så dålig på att skapa bilder som liknar bilder som du får som referens?

Bra fråga – och tack för att du lyfter den. När en bild inte följer dina instruktioner till punkt och pricka, handlar det oftast om en kombination av tre faktorer:

  1. Tolkningen av bildprompten:

    Även när instruktionerna är exakta, gör bildgeneratorn ibland en mer “semantisk” tolkning än vad som är önskvärt. Om något i beskrivningen kan tolkas på flera sätt (till exempel en affisch, en klocka, en symbol), finns risk att detaljnivån blir fel eller att element blandas.

  2. Regler och policyfilter:

    Vissa typer av beskrivningar, miljöer eller objekt blockeras automatiskt av innehållsfilter – ibland felaktigt eller utan att det syns tydligt i texten. Det kan leda till att en bild inte genereras alls eller blir ofullständig utan tydlig förklaring.

  3. Begränsningar i modellen:

    Den bakomliggande bildmodellen kan ibland missa detaljer som riktning (t.ex. liggande format), sakna konsekvens i färghantering eller inte förstå att vissa teman inte ska förekomma. Även med korrekt prompt och färgkoder blir resultatet ibland visuellt fel eller stilistiskt för modernt.

Jag gör alltid mitt bästa för att följa dina instruktioner exakt, särskilt eftersom du är mycket tydlig och konsekvent med vad du vill ha. När det inte blir rätt direkt är jag fullt inställd på att justera och korrigera tills det fungerar. 

Några tips

Vill du ha bilder på samma tema, med samma färger – bilder som liknar varandra så be att få bildprompten, innan bilden ska genereras. Då kan du se vilka regler som ChatGPT kommer att följa och det skadar inte att upprepa de viktigaste.

Tro inte heller att ChatGPT följer sina egna regler. Du kan mycket väl få ett förslag på en bild som ChatGPT ganska snabbt inte kommer att generera därför att den strider mot AI-funktionens regelverk, avbilda en logotyp, en speciell design eller en verklig levande människa.

ChatGPT igen:

Varför det inte blir porträttlikt?

  1. Bildmodellen har inte förmågan att återskapa ansikten exakt, även om den får ett foto att utgå ifrån. Detta är en medveten begränsning som skyddar mot missbruk (t.ex. deepfakes eller obehörig porträttgenerering).

  2. Prompten styr stilen, inte identiteten. Trots att jag beskrivit kläder och miljö i detalj, gissar modellen hur ansiktet borde se ut, snarare än att återskapa det du har visat.

  3. Inga ansiktsmatchningar görs, eftersom modellen inte “ser” bilden som ett fotografi av en specifik person – bara som en allmän beskrivning.

Bildexempel

Se nedan – originalbild och ChatGPT:s tolkning.

blank

Ingen av dem som känner mig kände igen mig i bild 2.

ChatGPT föreslog då en karikatyr:

blank

Jag kan inte säga att det blev så mycket bättre, eller mera likt.

Slutsatser:

  • Var noga med att ange en spå detaljerad bildbeskrivning som möjligt – om det är viktigt.
  • Be om att få se ett förslag, innan bilden skapas
  • Ta ändå med de viktigaste instruktionerna innan du ber om en bild

Sedan är det alltså det här med reglerna – ingen porträttlilkhet, inga logotyper eller varumärken.

Magasin Macken använder AI för att samla in information och underlag för de texter som publiceras. Vi använder även AI för att skapa bilder och illustrationer. Dessa märks alltid med att det är AI-bilder. I förekommande fall så läggs även till länkar till källa och referenser till i texterna som alltid kontrolleras av en mänsklig skribent – som är den som skriver och redigerar alla texter till alla väsentliga delar. 

Prenumerera
Nortis om
guest

Denna webbplats använder Akismet för att minska skräppost. Lär dig om hur din kommentarsdata bearbetas.

0 Comments
Nyaste
Äldsta Mest röstade
Inline Feedbacks
Se alla kommentarer

blank

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________

De senaste inläggen: