[voikko] Tekstin luettavuuden mittaus
Tapio Lehtonen
tapio.lehtonen at dnainternet.net
Mon Feb 21 07:35:23 EET 2011
Jukka K. Korpela kirjoitti:
> Huomasin, että tammikuussa oli pari viestiä tekstin luettavuuden
> mittauksesta:
> http://lists.puimula.org/pipermail/voikko/2011-January/001412.html
>
> Diplomityö on
> http://media.tkk.fi/GTTS/Suomi/dt&raportit/DI_J_Haataja.pdf
> ja sen mukaan Wiion mittareista yksinkertaisin olisi
>
> 2,7 + 0,3 × PS
>
> missä PS = pitkien sanojen (perusmuodossa vähintään 4 tavua) määrä
> sadan sanan otoksessa, ja tämä antaisi estimaatin luokkatasolle
> peruskoulun luokkina 1 - 12.
>
> (Mittari siis edellyttää paitsi sanojen jäsentämistä tavuihin myös
> perusmuodon tunnistamista. En muista, sisältyykö tähän vielä
> omistusliitteiden kuten -nsa ja liitepartikkelien kuten -kin poisto -
> luullakseni sisältyy. Mutta esimerkiksi siis "matkustettiin" ei siis
> ole tässä yhteydessä pitkä sana, vaikka siinä on 4 tavua, sillä
> perusmuodossa "matkustaa" on vain 3 tavua.)
>
Tämmöinenhän vaikuttaa oikein hienolta. Nythän Voikko, Malaga jne.
käsittääkseni tarjoaisivat työkalut tekstin analyysiin ja tekstistä
saisi tiristettyä noiden mittareiden tarvitsemat suureet. Varmaan siellä
on jotain mittaria joka huomioi sanojen tavumäärän lisäksi sanojen
harvinaisuuden, paljon sivistyssanoja sisältävän tekstin luulisi olevan
hankalammin luettava kuin selkoteksti.
Ei olisi lainkaan hassumpaa saada luettavuusmittareita käyttöönsä.
--
Tapio Lehtonen
pj. Linux-Aktivaattori http://l-a.fi
More information about the voikko
mailing list