[voikko] Perusmuodot VFST-morfologiassa
Harri Pitkänen
hatapitk at iki.fi
Sun Sep 14 22:25:11 EEST 2014
Hei!
Lupasin aiemmin, että yritän saada perusmuotoon palauttamisen toimimaan VFST-
morfologiassa tämän viikon aikana. Tein koko alkuviikon töitä asian parissa,
ja nyt tilanne on tämä:
- Adjektiivit ja substantiivit palautuvat perusmuotoihinsa melko hyvin.
Joitakin ongelmia voi vielä olla johdoksissa (esim. asukkaan nimet).
- Verbit palautuvat perusmuotoihinsa myös pääsääntöisesti hyvin. Johdoksissa
on vielä bugeja. Näistä kuulen mielelläni, koska kaikkia korjausta vaativia
tapauksia on ollut vaikea jäljittää.
- Numeraalien perusmuodot eivät vielä palaudu oikein. Tämän toteuttamista en
ehtinyt vielä edes aloittaa.
- Muissa luokissa on vaihtelevia puutteita. Toisaalta usein VFST-morfologian
tuottama perusmuoto on näissä jopa parempi kuin aiempi Malaga-morfologian
tuottama muoto.
VFST-morfologian julkaisukuntoon saamisen (ja Malgasta eroon pääsemisen)
tiellä on enää kolme suurta tehtäväkokonaisuutta:
- WORDBASES- ja WORDIDS-attribuuttien toteuttaminen. Näitä ei tulla
perussanastosta tuottamaan (kuten ei tähänkään saakka ole tehty), mutta
erillisestä sanastosta nämä edelleen on saatava, koska eräät tekstihaut
tarvitsevat näitä.
- Satunnaisten bugien korjaaminen muista attribuuteista (vertailemalla Malaga-
ja VFST-morfologioita koneellisesti testiaineiston avulla).
- Kieliopin tarkistimen ns. autocorrect-datan siirto libvoikosta sanaston
osaksi.
Harri
More information about the voikko
mailing list