[voikko] Perusmuodot VFST-morfologiassa

Harri Pitkänen hatapitk at iki.fi
Sun Sep 14 22:25:11 EEST 2014


Hei!

Lupasin aiemmin, että yritän saada perusmuotoon palauttamisen toimimaan VFST-
morfologiassa tämän viikon aikana. Tein koko alkuviikon töitä asian parissa, 
ja nyt tilanne on tämä:

- Adjektiivit ja substantiivit palautuvat perusmuotoihinsa melko hyvin. 
Joitakin ongelmia voi vielä olla johdoksissa (esim. asukkaan nimet).

- Verbit palautuvat perusmuotoihinsa myös pääsääntöisesti hyvin. Johdoksissa 
on vielä bugeja. Näistä kuulen mielelläni, koska kaikkia korjausta vaativia 
tapauksia on ollut vaikea jäljittää.

- Numeraalien perusmuodot eivät vielä palaudu oikein. Tämän toteuttamista en 
ehtinyt vielä edes aloittaa.

- Muissa luokissa on vaihtelevia puutteita. Toisaalta usein VFST-morfologian 
tuottama perusmuoto on näissä jopa parempi kuin aiempi Malaga-morfologian 
tuottama muoto.


VFST-morfologian julkaisukuntoon saamisen (ja Malgasta eroon pääsemisen) 
tiellä on enää kolme suurta tehtäväkokonaisuutta:

- WORDBASES- ja WORDIDS-attribuuttien toteuttaminen. Näitä ei tulla 
perussanastosta tuottamaan (kuten ei tähänkään saakka ole tehty), mutta 
erillisestä sanastosta nämä edelleen on saatava, koska eräät tekstihaut 
tarvitsevat näitä.

- Satunnaisten bugien korjaaminen muista attribuuteista (vertailemalla Malaga- 
ja VFST-morfologioita koneellisesti testiaineiston avulla).

- Kieliopin tarkistimen ns. autocorrect-datan siirto libvoikosta sanaston 
osaksi.


Harri


More information about the voikko mailing list