Språkbruket på Twitter förändrades på ett positivt vis i kölvattnet av #metoo, enligt en ny avhandling i nationalekonomi från Ekonomihögskolan vid Lunds universitet.
Nyblivna doktorn i nationalekonomi, Sara Moricz, började redan som masterstudent att använda sig av programmerade datamodeller för sin forskning. Nationalekonomi använder av tradition statistiska modeller. Steget till att använda mer datadrivna sätt, alltså maskininlärning och AI, är inte långt.
– Det är svårt att undersöka normer eftersom att vi forskare saknar data att jobba med. Men med sociala medier som Twitter och med dagens maskininlärningsalgoritmer går det att automatiskt läsa av så kallade implicit bias, ungefär omedvetna fördomar, i text. Det har jag använt mig av i undersökningen, säger Sara Moricz, som disputerat med avhandlingen Institutions, Inequality and Societal transformations.
Modell lär sig att läsa ”som en människa”
Med hjälp av tusentals svenska tweets har Sara Moricz lärt en AI-modell att läsa Twitter-inlägg ”som en människa”. Kort sagt gick det ut på att träna modellen att uppfatta så kallat könskodat språk och därmed placera in orden ”hon” eller ”han” på rätt plats i olika meningar.
Det kan vara allt från om en person som kallas ”sötis” är en kvinna eller man, eller om det är en kvinna som bakar kakor och en man som äter dem. Modellen har tillgång till tillräckligt med data för att lära sig att se de könskodade mönstren i språkbruket.
– Resultatet av undersökningen visar att svenska tweets i genomsnitt reflekterar könskodat språk i mindre utsträckning ett halvår efter den första metoo-hashtaggen, jämfört med ett halvår innan, säger Sara Moricz.
Metoo startade den 17 oktober 2017, och ett halvår innan dess stoppar modellen i genomsnitt in rätt könskodat ord i 78 av 100 tweets och ett halvår efter minskar det till 76,5 per 100 tweets. Förändringen innebär en minskning med cirka 2 procent av genomsnittet innan Metoo.
Är inte andelen som visar förändring väldigt låg? Bara någon procent?
– Det är inte en stor effekt, men inte heller en liten. Det man ska komma ihåg är att det är ovanligt att kunna mäta normer på en sådan fin skala. Detta visar att något verkligen förändrats, i alla fall vad gäller svenska Twitter, säger Sara Moricz och tillägger:
– Det är svårt att jämföra med tidigare forskning eftersom man inte tidigare har mätt könskodat språk, eller könsnormer, på detta sätt. Jag tycker det är lättare att tänka på hur stor effekten är i termer av att den indikerar att det skulle ta 18 år med en ihållande metoo-effekt för att helt ta bort det könskodade språk som modellen lärt sig.
Könskodning
I engelskan används ofta en adjektivform av gender, gendered, för att beskriva att något uppvisar skillnad enligt en viss uppfattad genusordning. Om man exempelvis utgår från att en genusordning är strukturerad i två genus, ett manligt och ett kvinnligt, kan en sak, en egenskap eller ett fenomen vara kodat som maskulint eller feminint. Ett exempel kan vara färger. Rosa anses vara feminint medan blått upplevs vara maskulint. Det finns ingen allmänt vedertagen svensk version av begreppet gendered, men exempel på möjliga översättningar är genusifierad, genuspräglad, könad, könskodad eller genuskodad. (källa: Wikipedia)
Könskodat språk blir utifrån detta ett språk som är subtilt färgat utifrån det kön som vi, ofta omedvetet, kopplar ihop med vissa ord. Samhället har vissa förväntningar på vad män och kvinnor är, och hur de skiljer sig åt, och detta avspeglas i det språk vi använder. Ett kvinnligt färgat, stereotypt språk eller ordval kan till exempel vara snäll, försiktig, söt. Ett maskulint färgat språk kan vara aktiv, driven, företagsam. Självklart kan människor av vilket kön som helst kan ha någon av dessa egenskaper, men i den nämnda forskningen har de separerats.
Enligt rapporten Svenskarna och internet 2018 använder fler män (25 procent) än kvinnor (18 procent) Twitter. Den största användargruppen är 16–25 år. Hur representativt är då Twitter och dina resultat för svenskarna som helhet?
– Det är viktigt att poängtera att min undersökning enbart utgör ett exempel på att normer kan förändras snabbt. Resultatet i sig är inte generaliseringsbart eftersom att vi vet att Twitteranvändare inte återspeglar hur folk är mest i Sverige, säger hon och tillägger:
– Resultatet visar att en nerifrån och upp-folkrörelse kan förändra normer, i alla fall på kort sikt. Jag menar att engagemanget hos dem som vågade berätta om sexuella övergrepp under #metoo ledde till en konkret förändring, åtminstone utifrån Twitter-datan.
Ett konkret exempel på hur jargongen på Twitter har förändrats är att fåtalet kvinnor tillskrivs att ha åsikter innan metoo, efter metoo finns det fler tweets som handlar om att kvinnor faktiskt har åsikter.
Du säger att andelen tweets som reflekterar könsnormer är mindre efter #metoo än före. Hur vet du att det kan kopplas till just #metoo och inte till slumpen eller andra orsaker?
– Man kan aldrig vara hundra procent säker när man jämför saker över tid. Det kan absolut vara något annat som förändras samtidigt, men jag har gjort metoden så bra som jag någonsin kunnat för att säkert kunna säga att det är metoo som driver den här förändringen på Twitter. Till exempel har jag gjort en parallell undersökning, med samma metod, men för en annan norm, där jag inte ser någon förändring alls.
Kontakt:
Sara Moricz, Doktorand i nationalekonomi, sara.moricz@nek.lu.se
Om studien:
Sara Moricz har i sin avhandling skrivit tre artiklar, varav den första behandlar kortsiktiga förändringar av könsnormer. Artikeln tar tillvara på senare tids utveckling av maskininlärningsalgoritmer för att studera normförändringar i svenska tweets. Mer specifikt så tränas en LSTM neural network-modell till att definiera könsnormer på ett omfattande och datadrivet sätt. Modellen används som ett verktyg för att ta fram ett mått på könsnormer som människor möter i vardagslivet, vilket används för att studera normförändringar i samband med Metoo-rörelsen.
#Metoo startade den 17 oktober 2017 efter att en amerikansk skådespelerska uppmuntrade kvinnor att dela med sig av sina erfarenheter av sexuellt ofredande. Datumet för händelsen är orelaterat till svenska könsnormer och därmed tillåter kontexten att en effekt skattas utan jämförelseproblem. Tweets som innehåller Metoo-hashtaggen eller relaterade taggar tas bort från analysen för att inte effekten av en mer intensiv könsdebatt ska mätas.
Artikeln finner att svenska tweets reflekterar könsnormer i en mindre utsträckning sex månader efter Metoo-händelsen i jämförelse med fem månader innan. Föregående års normförändringar används som en jämförelsegrupp. Resultatet är robust gentemot att använda fixa effekter för kalenderdagar och Twitter-användare.
Resultatet får även stöd genom att istället undersöka en orelaterad norm som inte borde förändras med placebo-test. Studien ger ett exempel på att normer kan förändras snabbt, vilket kan göra det möjligt att ifrågasätta tidigare litteratur där normer visas som relativt oföränderliga.
Avhandlingen (del av):
Institutions, Inequality and Societal transformations av Sara Moricz.