[voikko] Ongelmallinen "asana"
Harri Pitkänen
hatapitk at iki.fi
Sat Aug 16 19:32:32 EEST 2008
On Saturday 16 August 2008, Teemu Likonen wrote:
> En ymmärrä, miten "biologia-sana" ja muut sanaan "sana" loppuvat,
> yhdysmerkin sisältävät yhdyssanat voivat tulla mukaan pelkästään tällä
> muutoksella, mutta niin vain tulevat. Kyseessä on lyhenne "a" + "sana"
> eli yhdyssanassa esimerkiksi "biologi" + "a-sana".
Yhdysmerkki hyväksytään tapauksissa, joissa sanalla ilman yhdysmerkkiä olisi
useita eri jakokohdan sisältäviä analyyseja. Jos sana "asana" on mukana
sanastossa, voidaan "biologiasana" jakaa "biologia=sana" tai "biologi=asana",
jolloin libvoikko sallii yhdysmerkin käytön jommassakummassa rajakohdista
selkeyttämään sanan merkitystä.
> Ongelmallinen "asana" on toki myös siksi, että se on niin lähellä
> "sanaa" ja helposti hyväksytään jälkimmäisen näkökulmasta
> kirjoitusvirheitä. Ehdottaisin, että estetään "asana" yhdyssanojen osana
> ja lisätään tarpeelliset yhdyssanat erikseen.
Laitoin tuohon "Sekoittuu helposti yleisempään sanaan", koska
selvästikin "asana" ja "sana" ovat liian lähellä toisiaan. A ja S ovat vielä
näppäimistössäkin vierekkäin, jolloin huolimaton sormiliike tuottaa helposti
tuon ylimääräisen a:n sanan alkuun. Koska olin muutenkin luokitellut
sanan "asana" yleisyysluokkaan 9, poistuu se tällä muutoksella kokonaan
oikoluvun perussanastosta. Tämä ei mielestäni ole kovin suuri menetys sanan
tuottamaan haittaan nähden.
> PS. Mistä muuten johtuu, että Malagan analyysi ei oikein enää toimi? Se
> ei enää läheskään aina kerro Complete Paths -asetuksella, mistä
> sanahahmo koostuu.
Tuon "biologia-sana"-sanan tapauksessa syy on siinä, että kyseistä sanaa ei
Suomi-malagassa ole, vaan libvoikko on käyttänyt yhdysmerkittömästä versiosta
tehtyä analyysia. En ole itse törmännyt tapaukseen, jossa tuo Complete paths
ei olisi antanut tulosta sanalle, joka on mukana Suomi-malagassa. Jos
tällaisia kuitenkin löytyy, voin yrittää selvittää syytä.
Harri
More information about the voikko
mailing list