[hunspell-fi-devel] Sanastonkeruusovellus - muutoksia käytössä

Harri Pitkänen hatapitk at cc.jyu.fi
Tue Apr 11 10:39:46 EEST 2006


On Tuesday 11 April 2006 07:29, Hannu Väisänen wrote:
> On Mon, Apr 10, 2006 at 11:46:41PM +0300, Harri Pitkänen wrote:
> > - Jos törmäät sanaan, josta Voikko ei tunnista kaikkia taivutusmuotoja,
> > voit lisätä tunnistamatta jääneen muodon sovellukseen vaikka sana muuten
> > olisikin jo sanastossa.
>
> Tämmöisistä sanoista voi ilmoittaa minullekin kuten myös sanoista,
> jotka voikko (tai siis suomi-malaga) tunnistaa väärin ja sanoista,
> joita voikko ei tunnista ollenkaan.

Joo, ei ole tosiaan mikään välttämättömyys lähettää yksinkertaisia korjauksia 
tänne listalle. Tuohon sanastonkeruusovellukseen voisin tehdä liittymän, 
josta saisit helposti ulos esimerkiksi tietyllä päivämäärävälillä 
sovellukseen lisätyt sanat. Vaihtoehtoisesti voisin antaa sinulle tunnukset 
tuohon sovellukseen niin, että pääsisit katsomaan lisättyjä sanoja suoraan, 
mutta tämä on varmaan käytännössä työläämpää. Kerro kumpi ratkaisu tuntuu 
paremmalta, niin toimin sen mukaan. Uskon kuitenkin, että puuttuvien sanojen 
kohdalla on helpompaa käyttää tuota sanastonkeruusovellusta kuin kirjoittaa 
sähköpostia.

Jos sinulla on aikaa setviä puuttuvia sanoja, niin kannattaa katsoa läpi Jukka 
Nikulaisen Myspell-sanasto: 
http://www.mv.helsinki.fi/home/jnikulai/projects/index.html
Sieltä löytyy yli 8000 sanaa joita Suomi-Malaga ei tunnista. Tuo sanasto on 
käytettävissä GPL-lisenssillä, joten siitä voi turvallisesti sanoja kopioida. 
Tai turvallisesti lisenssimielessä: osa sanoista on kylläkin virheellisiä, ja 
osa saattaa olla teoreettisen filosofian erikoissanastoa jota ainakaan 
oikolukuohjelmassa ei ehkä ole hyvä olla mukana perussanastossa.

Yksi yhdyssanatyyppi, jonka automaattista tunnistamista kannattaisi varmaan 
tutkia, on tällaiset sanat kuin "avosydäminen", "rapeareunainen" jne. 
Suomi-Malaga ei tunnista noita edellisiä, mutta tunnistaa esimerkiksi 
sanat "nopeakätinen" ja "kaunissilmäinen". Tosin se hyväksyy myös 
sanan "silmäinen" mikä mielestäni on väärin. Yleisesti ei kai voida olettaa, 
että jos adjektiivi+"silmäinen" on oikein, niin pelkkä "silmäinen" on oikein. 
Minulle ei ole ihan selvää, miten tämä ongelma on parasta ratkaista. 
Kannattaa ehkä tutustua muiden oikolukuohjelmien toimintaan testailemalla 
erilaisia yhdistelmiä ja yrittämällä päätellä, millä logiikalla ne 
erottelevat hyväksyttävät ja virheelliset muodot.

Harri



More information about the devel mailing list