[voikko-devel] Utu-alkuisista yhdyssanoista

Teemu Likonen tlikonen at iki.fi
Thu May 31 09:43:42 EEST 2007


Hannu Väisänen kirjoitti:

> Joukahaisessa utu on merkitty sanaksi, joka ei voi olla yhdyssanan
> osana. Tämä on ihan oikein, koska sanalle tulisi liian paljon vääriä
> tunnistuksia (esim. hautautumaan = hauta+utu+maa+n ja kaikki muut
> utua-loppuiset teonsanat :-).
>
> Kuitenkin tiedostojen indeksoinnissa on tullut vastaan utu-alkuisia
> yhdyssanoja, joista tähdellä merkityt voisivat olla
> oikolukusanastossakin. Mitä mieltä ollaan?

Oikolukuun voisi lisätä tarpeellisimmat utu-alkuiset sanat toisten 
sanojen kirjoitusasuiksi. Siis esimerkiksi pilvi-tietueeseen 
lisättäisiin kirjoitusasut "pilvi" ja "utu=pilvi".

Useimmat listaamistasi sanoista ovat kyllä niin harvinaisia, että ovat 
todennäköisemmin enemmän haitaksi kuin hyödyksi oikoluvussa. Sellaiset 
laitetaan erikseen omiksi tietueikseen ja lisätään "ei 
oikolukusanastoon" -lippu tai asetetaan sanan yleisyysluokaksi 10.



More information about the devel mailing list