[hunspell-fi-devel] Sanastonkeruusovellus - muutoksia käytössä

Hannu Väisänen hvaisane at joyx.joensuu.fi
Wed Apr 12 07:35:22 EEST 2006


On Tue, Apr 11, 2006 at 10:39:46AM +0300, Harri Pitkänen wrote:
> Joo, ei ole tosiaan mikään välttämättömyys lähettää yksinkertaisia korjauksia 
> tänne listalle.

Mutta saa ne laittaa listallekin. (-:

Erityisen kiinnostunut olen sanoista, joitten kaikkia taivutusmuotoja
suomi-malaga ei tunnista, ja sanoista, jotka se tunnistaa väärin.
Tuollaiset virheet ovat merkki siitä, että suomi-malagan muoto-opissa
on vikaa. Kokonaan tunnistamattomat sanat ovat "vain" sanoja, joita ei
ole sanastossa.


> Tuohon sanastonkeruusovellukseen voisin tehdä liittymän, 
> josta saisit helposti ulos esimerkiksi tietyllä päivämäärävälillä 
> sovellukseen lisätyt sanat. Vaihtoehtoisesti voisin antaa sinulle tunnukset 
> tuohon sovellukseen niin, että pääsisit katsomaan lisättyjä sanoja suoraan, 
> mutta tämä on varmaan käytännössä työläämpää.

En osaa päättää ennen kuin kokeilen eli voisinko saada molemmat, kiitos.


> Jos sinulla on aikaa setviä puuttuvia sanoja, niin kannattaa katsoa läpi Jukka 
> Nikulaisen Myspell-sanasto: 
> http://www.mv.helsinki.fi/home/jnikulai/projects/index.html
> Sieltä löytyy yli 8000 sanaa joita Suomi-Malaga ei tunnista.

Iiiiikkkk!!!! (-:



> Yksi yhdyssanatyyppi, jonka automaattista tunnistamista kannattaisi varmaan 
> tutkia, on tällaiset sanat kuin "avosydäminen", "rapeareunainen" jne. 
> Suomi-Malaga ei tunnista noita edellisiä, mutta tunnistaa esimerkiksi 
> sanat "nopeakätinen" ja "kaunissilmäinen". Tosin se hyväksyy myös 
> sanan "silmäinen" mikä mielestäni on väärin. Yleisesti ei kai voida olettaa, 
> että jos adjektiivi+"silmäinen" on oikein, niin pelkkä "silmäinen" on oikein. 
> Minulle ei ole ihan selvää, miten tämä ongelma on parasta ratkaista. 

Yksi mahdollisuus on, että sanastoon merkitään ne sanat, jotka voivat
olla vain yhdyssanojen jälkiosana.

Sanat, jotka voivat olla vain yhdyssanojen alkuosana, ovat
suomi-malagassa etuliitteitä. (-:



More information about the devel mailing list