Nytt datorbaserat verktyg mäter läsbarheten för olika läsare
De flesta samhällstjänster bygger numera på elektronisk kommunikation, vilket kräver en relativt god läsförmåga. Men en stor andel vuxna kan inte tillgodogöra sig de texter som presenteras till exempel på webben, utan har behov av förenklat material. En avhandling från Göteborgs universitet visar att datorer kan användas som verktyg för att mäta texters läsbarhet och lämplighet för olika målgrupper.
– Idag ställs stora krav på individen när det gäller förmåga att orientera sig i samhället och att självständigt fatta viktiga beslut. Det kan handla om allt från bankärenden till kontakt med myndigheter på nätet, där personens läsförmåga är avgörande, säger avhandlingens författare Katarina Heimann Mühlenbock.
I Sverige har man sedan 1968 förlitat sig på LIX (läsbarhetsindex) som ett mått på läsbarhet. LIX-måttet ger en uppfattning av hur en text ser ut på ytan, det vill säga det anger textens genomsnittliga meningslängd och procentandelen ord som är längre än sex bokstäver. Den underliggande hypotesen är att långa meningar är mer grammatiskt komplexa än korta meningar, och att längre ord är svårare än korta ord. Fördelen med LIX är att formeln är lätt att använda och inte kräver andra resurser än papper och penna. Resultaten har också visat sig fungera som fingervisning om på vilken läsbarhetsnivå man kan förvänta sig att en given text ligger.
Dagens språkteknologiska metoder och digitala språkresurser bidrar dock till att mer korrekta och träffsäkra läsbarhetsanalyser kan göras. Katarina Heimann Mühlenbock har granskat tidigare studier där forskare undersökt vilka textegenskaper som påverkar olika läsares förståelse, till exempel ordvariation och meningsbyggnad. I hennes avhandling jämförs sedan ordinära och förenklade texter från tre olika genrer – skönlitteratur, nyhetstext och informationstext.
Avhandlingen undersöker på vilka överordnade språkliga nivåer dessa textegenskaper finns, och om de verkligen mätbart skiljer sig åt.
– På vokabulärnivån hittar vi till exempel mått på hur ofta ord repeteras i en text, och på hur stor andel mycket vanliga och basala ord som finns i en viss text. På meningsnivå mäts grammatisk komplexitet, som till exempel mängden bisatser, medan idétätheten speglar det betydelsemässiga innehållet.
Totalt har 23 olika språkliga variabler undersökts, som sedan i kombination har använts i ett datorprogram som automatiskt klassificerar texter. Uppgiften för programmet var då att skilja inte bara mellan texter som var ordinära och förenklade, utan också mellan skönlitteratur, nyhetstext och informationstext av båda typerna.
Det visade sig att programmet klarade uppgifterna med en noggrannhet som varierade mellan 84 och 100 procent. Om man använde LIX för samma uppgift blev resultatet mellan 45 och 99,5 procent. Kombinationen, som kallas SVIT, klarade alla uppgifterna bättre än LIX, och skillnaden mellan de båda metoderna låg på mellan 0,2 och 55,4 procentenheter.
– Mina forskningsresultat visar att SVIT kan användas både för att anpassa text till specifika målgrupper av läsare, men också för att hitta texter som passar en särskild läsarprofil. Personer med olika språklig bakgrund har behov av olika typer av text, säger Katarina Heimann Mühlenbock.