[voikko] Voikon morfologian siirto transduktoriksi

"Harri Pitkänen" hatapitk at iki.fi
Thu Apr 26 17:55:08 EEST 2012


to 26.4.2012 8:16 Hannu Väisänen kirjoitti:
> Mikä olisi paras tapa valmistella Sukija käyttämään uutta morfologiaa?
> Kannattaisiko esimerkiksi tehdä Sukijasta versio, joka käyttää
> Malagalla tehtyä Voikon morfologiaa?

Kyllä tuo varmasti on kaikkein helpoin tapa. Eli jos muutat Sukijan
käyttämään libvoikon
voikkoAnalyzeWordCstr-funktiota ja otat analyyseistä BASEFORM-attribuutin,
niin lopputuloksen pitäisi olla periaatteessa samankaltainen kuin Sukijan
Malaga-morfologian tuottama tulos.

Kun näin tekee, niin myöhemmin VFST-morfologiaan siirtyminen ei
luultavasti vaatisi enää mitään lisämuutoksia Sukijaan.

Toki Sukijan ja Voikon sanastot poikkeavat toisistaan jonkin verran. Tätä
eroa saa korjattua sillä, että teet Voikon sanastosta mahdollisimman
laajan version. suomimalaga/README kertoo käytettävissä olevat valitsimet.
Vielä pitäisi varmaankin lisätä sellainen valitsin, joka ottaa mukaan myös
attribuutilla ei_voikko olevat sanat. Voin tämän valitsimen lisätä, jos
päädyt tällä tavalla asiassa etenemään.

Harri




More information about the voikko mailing list