[voikko] Tekstin luettavuuden mittaus

Tapio Lehtonen tapio.lehtonen at dnainternet.net
Mon Feb 21 07:35:23 EET 2011


Jukka K. Korpela kirjoitti:
> Huomasin, että tammikuussa oli pari viestiä tekstin luettavuuden 
> mittauksesta:
> http://lists.puimula.org/pipermail/voikko/2011-January/001412.html
>
> Diplomityö on
> http://media.tkk.fi/GTTS/Suomi/dt&raportit/DI_J_Haataja.pdf
> ja sen mukaan Wiion mittareista yksinkertaisin olisi
>
> 2,7 + 0,3 × PS
>
> missä PS = pitkien sanojen (perusmuodossa vähintään 4 tavua) määrä 
> sadan sanan otoksessa, ja tämä antaisi estimaatin luokkatasolle 
> peruskoulun luokkina 1 - 12.
>
> (Mittari siis edellyttää paitsi sanojen jäsentämistä tavuihin myös 
> perusmuodon tunnistamista. En muista, sisältyykö tähän vielä 
> omistusliitteiden kuten -nsa ja liitepartikkelien kuten -kin poisto - 
> luullakseni sisältyy. Mutta esimerkiksi siis "matkustettiin" ei siis 
> ole tässä yhteydessä pitkä sana, vaikka siinä on 4 tavua, sillä 
> perusmuodossa "matkustaa" on vain 3 tavua.)
>
Tämmöinenhän vaikuttaa oikein hienolta. Nythän Voikko, Malaga jne. 
käsittääkseni tarjoaisivat työkalut tekstin analyysiin ja tekstistä 
saisi tiristettyä noiden mittareiden tarvitsemat suureet. Varmaan siellä 
on jotain mittaria joka huomioi sanojen tavumäärän lisäksi sanojen 
harvinaisuuden, paljon sivistyssanoja sisältävän tekstin luulisi olevan 
hankalammin luettava kuin selkoteksti.

Ei olisi lainkaan hassumpaa saada luettavuusmittareita käyttöönsä.

-- 
Tapio Lehtonen
pj. Linux-Aktivaattori http://l-a.fi




More information about the voikko mailing list