[voikko-devel] Utu-alkuisista yhdyssanoista
Teemu Likonen
tlikonen at iki.fi
Thu May 31 09:43:42 EEST 2007
Hannu Väisänen kirjoitti:
> Joukahaisessa utu on merkitty sanaksi, joka ei voi olla yhdyssanan
> osana. Tämä on ihan oikein, koska sanalle tulisi liian paljon vääriä
> tunnistuksia (esim. hautautumaan = hauta+utu+maa+n ja kaikki muut
> utua-loppuiset teonsanat :-).
>
> Kuitenkin tiedostojen indeksoinnissa on tullut vastaan utu-alkuisia
> yhdyssanoja, joista tähdellä merkityt voisivat olla
> oikolukusanastossakin. Mitä mieltä ollaan?
Oikolukuun voisi lisätä tarpeellisimmat utu-alkuiset sanat toisten
sanojen kirjoitusasuiksi. Siis esimerkiksi pilvi-tietueeseen
lisättäisiin kirjoitusasut "pilvi" ja "utu=pilvi".
Useimmat listaamistasi sanoista ovat kyllä niin harvinaisia, että ovat
todennäköisemmin enemmän haitaksi kuin hyödyksi oikoluvussa. Sellaiset
laitetaan erikseen omiksi tietueikseen ja lisätään "ei
oikolukusanastoon" -lippu tai asetetaan sanan yleisyysluokaksi 10.
More information about the devel
mailing list