[voikko-devel] Yleisyysluokitus Joukahaisessa

Harri Pitkänen hatapitk at cc.jyu.fi
Tue Dec 19 18:47:24 EET 2006


Lisäsin tänään Joukahaiseen mahdollisuuden luokitella sanoja niiden yleisyyden 
mukaan. Luokitus on kymmenportainen, ja löytyy sivulta
http://joukahainen.lokalisointi.org/docs/muutkentat.html

Ei ole välttämättä tarkoituksenmukaista tässä vaiheessa alkaa 
järjestelmällisesti lisäämään sanoille yleisyysluokkia. Koska tuo asteikko on 
lisäksi melko tulkinnanvarainen, suosittelisin ettei kukaan vaihtaisi toisen 
asettamaa yleisyysluokkaa yhtä pykälää alemmaksi tai ylemmäksi, sillä tämä 
aiheuttaa vain turhaa "kohinaa" muutostietoja seuraaville. Lähinnä ajattelin 
tuon sitä varten, että voimme Kotuksen sanalistaa liittäessämme tuoda 
sanastoon sellaisiakin harvinaisia sanoja, joita ei oikoluvussa välttämättä 
tarvita. Yleisyysluokan asettaminen tarvittaessa arvoon 10 hoitaa tämän.

Lisäksi käytettävissä on kaksi uutta lippua. "Sekoittuu helposti yleisempään 
sanaan" on käyttökelpoinen niissä tilanteissa, joissa sana halutaan poistaa 
oikolukusanastosta koska se tunnistuu jonkun yleisemmän sanan 
kirjoitusvirheenä, mutta sana itsessään on kuitenkin oikein. Ainoastaan 
suhteellisen harvinaiset sanat (yleisyysluokka 9) voidaan poistaa tällä 
tavalla. "Tyypillinen kirjoitusvirhe" on uusi lippu jonka vaikutus on 
täsmälleen sama kuin lipun "ei kuulu oikolukusanastoon", mutta uusi lippu on 
useissa tapauksissa semanttisesti vähän järkevämpi.

Harri



More information about the devel mailing list