[voikko-devel] Yleisyysluokitus Joukahaisessa
Harri Pitkänen
hatapitk at cc.jyu.fi
Tue Dec 19 18:47:24 EET 2006
Lisäsin tänään Joukahaiseen mahdollisuuden luokitella sanoja niiden yleisyyden
mukaan. Luokitus on kymmenportainen, ja löytyy sivulta
http://joukahainen.lokalisointi.org/docs/muutkentat.html
Ei ole välttämättä tarkoituksenmukaista tässä vaiheessa alkaa
järjestelmällisesti lisäämään sanoille yleisyysluokkia. Koska tuo asteikko on
lisäksi melko tulkinnanvarainen, suosittelisin ettei kukaan vaihtaisi toisen
asettamaa yleisyysluokkaa yhtä pykälää alemmaksi tai ylemmäksi, sillä tämä
aiheuttaa vain turhaa "kohinaa" muutostietoja seuraaville. Lähinnä ajattelin
tuon sitä varten, että voimme Kotuksen sanalistaa liittäessämme tuoda
sanastoon sellaisiakin harvinaisia sanoja, joita ei oikoluvussa välttämättä
tarvita. Yleisyysluokan asettaminen tarvittaessa arvoon 10 hoitaa tämän.
Lisäksi käytettävissä on kaksi uutta lippua. "Sekoittuu helposti yleisempään
sanaan" on käyttökelpoinen niissä tilanteissa, joissa sana halutaan poistaa
oikolukusanastosta koska se tunnistuu jonkun yleisemmän sanan
kirjoitusvirheenä, mutta sana itsessään on kuitenkin oikein. Ainoastaan
suhteellisen harvinaiset sanat (yleisyysluokka 9) voidaan poistaa tällä
tavalla. "Tyypillinen kirjoitusvirhe" on uusi lippu jonka vaikutus on
täsmälleen sama kuin lipun "ei kuulu oikolukusanastoon", mutta uusi lippu on
useissa tapauksissa semanttisesti vähän järkevämpi.
Harri
More information about the devel
mailing list