Svartvitt bildcollage av gammaldags klädda kvinnor som talar i mobiltelefon.
Bild: Malmö universitet.
Texten baseras på en nyhet från Malmö universitet

Läs mer om vårt innehåll.

I ett forskningsprojekt har forskare testat hur en AI-modell visualiserar året 1936. Resultatet: Bilder som är stereotypiska och ibland rakt av felaktiga. Som svart-vita bilder av människor med tidstypiska kläder – och mobiltelefon i handen.

Forskarna valde medvetet 1936 i Sverige och i Skandinavien – ett till synes icke-spektakulärt år, men präglat av framväxande modernitet. I stället för att fokusera på dramatiska år som 1939 ville de undersöka hur AI hanterar det vardagliga.

Utgår från 5,8 miljarder bilder

Forskarna använde AI-modellen Stable Diffusion, som har tränats på 5,8 miljarder nätbaserade bilder. En central fråga var: Om en AI-modell ska visa upp en bild av 1936, vilka bilder kommer tjänsten att visar upp?

Genom enkla instruktioner, till exempel att be om bilder på ”kvinnor som pratar i telefon 1936”, blev modellens begränsningar tydliga, konstaterar forskarna. Bilderna kunde se historiskt trovärdiga ut – svartvita fotografier med tidstypiska kläder – men innehöll uppenbara anakronismer som mobiltelefoner.

Kvinna i mycket gammaldags klänning och håruppsättning talar i mobiltelefon.
Bild: Depositphotos.

Det är en anakronism

En anakronism (från grekiska anachronismos, ett kronologiskt misstag) innebär att en företeelse placeras i fel tidsepok i ett litterärt eller konstnärligt verk. Det kan till exempel vara att någon använder en mobiltelefon i en film som utspelar sig på 1800-talet.

Källa: Wikipedia

Fel och stereotypt

– Det visar att träningsdatan är snedvriden mot en mobilburen kultur och att en stor del av bilderna som finns inmatade är från senare decennier, säger Fredrik Mohammadi Norén, biträdande lektor i medie- och kommunikationsvetenskap vid Malmö universitet.

Även när AI-modellen gavs öppna instruktioner blev resultaten homogena och stereotypa. En instruktion om ”cyklister i Skandinavien” gav exempelvis nästan alltid norska fjäll i bakgrunden på bilder från Norge.

– Historierepresentationerna blir väldigt ospecifika och generella och inte särskilt nyanserade, säger Fredrik Mohammadi Norén.

AI ger svar, oavsett

När forskarna bad modellen att skapa bilder av händelser som sannolikt aldrig har ägt rum, som ett möte mellan Selma Lagerlöf, Knut Hamsun och Karen Blixen, genererades generiska bilder med suddiga ansikten.

Modellen är konstruerad för att alltid producera ett resultat, även när underlag saknas.

– Modellen måste leverera. Man måste därför vara försiktig med hur man använder den här typen av historieframställande praktik, säger Fredrik Mohammadi Norén.

”Karen Blixen på Safari”, enligt AI-modell. Bild: Malmö universitet.

Kvinna görs passiv

Ett annat exempel gällde den danska författaren Karen Blixen på safari. Trots att det finns autentiska bilder där Karen Blixen uppträder som en aktiv aktör skapade modellen stereotypa motiv, till exempel en bild av en passiv kvinna lutad mot en bil.

– Det finns riktiga bilder på Karen Blixen där hon har skjutit ett lejon. Det är ganska långt ifrån de stereotypa bilderna av en passiv kvinna, säger Fredrik Mohammadi Norén.

När modellen ombads visa representativa bilder för Sverige 1936 utan närmare specificering blev resultatet allmänna stads- och landskapsbilder.

– Modellen skapar en representation av året, men det är kanske inte så representativt, säger Fredrik Mohammadi Norén.

Nutida bilder styr

Studien visar att AI-genererade bilder som föreställer det förflutna är representationer formade av träningsdata och modellens algoritmer. Historien riskerar att bli förenklad, stereotyp och anakronistisk. Projektet gav inte någon ny bild av 1936, snarare visar den hur vår tids AI-system föreställer sig historien.

När allt fler använder AI för att visualisera det förflutna blir det avgörande att förstå hur verktygen fungerar, menar Fredrik Mohammadi Norén. En del historiker studerar hur vanliga människor använder historia i vardagen.

– Att göra så här är ett slags historiebruk. Det är också en form av digital minnespraktik där man vill föreställa sig olika händelser som aldrig ägt rum, säger Fredrik Mohammadi Norén.

Vetenskaplig artikel:

On the Historical Gaze of Generative AI: Visions of Scandinavia in Stable Diffusion, Scandinavian Journal of History.

Nyhetsbrev med aktuell forskning

Visste du att robotar som ser en i ögonen är lättare att snacka med? Missa ingen ny forskning, prenumerera på vårt nyhetsbrev!

Jag vill prenumerera