[hunspell-fi-devel] Sanastonkeruusovellus - muutoksia käytössä
Harri Pitkänen
hatapitk at cc.jyu.fi
Tue Apr 11 10:39:46 EEST 2006
On Tuesday 11 April 2006 07:29, Hannu Väisänen wrote:
> On Mon, Apr 10, 2006 at 11:46:41PM +0300, Harri Pitkänen wrote:
> > - Jos törmäät sanaan, josta Voikko ei tunnista kaikkia taivutusmuotoja,
> > voit lisätä tunnistamatta jääneen muodon sovellukseen vaikka sana muuten
> > olisikin jo sanastossa.
>
> Tämmöisistä sanoista voi ilmoittaa minullekin kuten myös sanoista,
> jotka voikko (tai siis suomi-malaga) tunnistaa väärin ja sanoista,
> joita voikko ei tunnista ollenkaan.
Joo, ei ole tosiaan mikään välttämättömyys lähettää yksinkertaisia korjauksia
tänne listalle. Tuohon sanastonkeruusovellukseen voisin tehdä liittymän,
josta saisit helposti ulos esimerkiksi tietyllä päivämäärävälillä
sovellukseen lisätyt sanat. Vaihtoehtoisesti voisin antaa sinulle tunnukset
tuohon sovellukseen niin, että pääsisit katsomaan lisättyjä sanoja suoraan,
mutta tämä on varmaan käytännössä työläämpää. Kerro kumpi ratkaisu tuntuu
paremmalta, niin toimin sen mukaan. Uskon kuitenkin, että puuttuvien sanojen
kohdalla on helpompaa käyttää tuota sanastonkeruusovellusta kuin kirjoittaa
sähköpostia.
Jos sinulla on aikaa setviä puuttuvia sanoja, niin kannattaa katsoa läpi Jukka
Nikulaisen Myspell-sanasto:
http://www.mv.helsinki.fi/home/jnikulai/projects/index.html
Sieltä löytyy yli 8000 sanaa joita Suomi-Malaga ei tunnista. Tuo sanasto on
käytettävissä GPL-lisenssillä, joten siitä voi turvallisesti sanoja kopioida.
Tai turvallisesti lisenssimielessä: osa sanoista on kylläkin virheellisiä, ja
osa saattaa olla teoreettisen filosofian erikoissanastoa jota ainakaan
oikolukuohjelmassa ei ehkä ole hyvä olla mukana perussanastossa.
Yksi yhdyssanatyyppi, jonka automaattista tunnistamista kannattaisi varmaan
tutkia, on tällaiset sanat kuin "avosydäminen", "rapeareunainen" jne.
Suomi-Malaga ei tunnista noita edellisiä, mutta tunnistaa esimerkiksi
sanat "nopeakätinen" ja "kaunissilmäinen". Tosin se hyväksyy myös
sanan "silmäinen" mikä mielestäni on väärin. Yleisesti ei kai voida olettaa,
että jos adjektiivi+"silmäinen" on oikein, niin pelkkä "silmäinen" on oikein.
Minulle ei ole ihan selvää, miten tämä ongelma on parasta ratkaista.
Kannattaa ehkä tutustua muiden oikolukuohjelmien toimintaan testailemalla
erilaisia yhdistelmiä ja yrittämällä päätellä, millä logiikalla ne
erottelevat hyväksyttävät ja virheelliset muodot.
Harri
More information about the devel
mailing list