[voikko] ien-sana yhdyssanoissa

Teemu Likonen tlikonen at iki.fi
Fri Dec 14 22:57:46 EET 2007


Harri Pitkänen kirjoitti:

> Kokeilin pikaisesti, mitä tapahtuisi jos sanan "ien" käytön estäisi
> yhdyssanan loppuosana. 300000 yleisimmän Wikipedia-sanan aineistossa
> muutokset olivat seuraavat:
>
> -C: estonien
> -C: Albanien
> -C: fotonien
>
> Näistä mikään ei oikeasti sisällä sanaa "ien", joten vaikuttaisi
> siltä, että tämä rajoitus voisi olla järkevää toteuttaa. Isommalla
> aineistolla en ole kokeillut. Mutta voisi kuvitella, että tämä
> mahdollistaisi joidenkin helppojen kirjoitusvirheiden tunnistamisen
> ("talojen" -> "taloien").

Laittamalla ei_ysj-lipun ien-sanalle menetetään n. 3,5 miljoonan sanan 
testisanaston perustella oikeastaan pelkkiä kirjoitusvirheitä. Tuo 
lippu kannattaa lisätä. Lisäsin Joukahaiseen substantiivin "fotoni", 
joka aiemmin on tunnistunut yhdistelmästä "foto" + "ni"-omistusliite.



More information about the voikko mailing list