[voikko] libvoikko HFST-transduktoreilla

Flammie Pirinen flammie at iki.fi
Thu Oct 29 20:08:13 EET 2009


Kokeilin toteuttaa voikko.h:ssa määritellyn rajapinnan käyttäen
pelkästään HFST-transduktoripaketteja
<http://www.helsinki.fi/~tapirine/tmp/huikka-0.1-alpha.tar.bz2>. Jos
oikein ymmärrän niin jos tämän tekisi täysin voisi kokeilla kaikkea
mitä voikko-sovellukset jo tukevat transduktoreilla, eikä tarvitsisi
duplikoida työtä millä portata transduktoripohjaiset morfologiat
enchantille, OO.o:lle jne? Kuulostaisiko tämä järkevältä työltä? Sillä
saisi paljon vähemmistökieliä ym. joilla on perinteisiä morfologioita
toteutettuna oikolukimiksi melko vähällä vaivalla, kun
transduktorimorfologiasta saa tuon paketin toteutuksella spellerin
ottamalla tietysti projektion ja ehdotusgeneraattorin esimerkiksi
kompositiolla edit-distance-transduktorin (tietysti käytännössä jonkin
elegantimman, mutta kaikki ehdotuskaavat on toki esitettävissä
painollisena transduktorina) kanssa.

Paketissa
<http://www.helsinki.fi/~tapirine/tmp/huikka-0.1-alpha.tar.bz2> on
voikko.h:n rajapinnan cstr-funktiot toteutettuna ja testasin
muokkaamalla voikkospellin cstr-tyyppiseksi että se sinänsä jo toimii,
eli ainakin huikkaspell ja huikkaspell -s toimivat :-)

Omorfista tehty vastaava transduktoripaketti on
<http://www.helsinki.fi/~tapirine/tmp/huikka-omorfi.tar.bz2>, se on
isohko koska ehdotustransduktorissa nyt on vain äärettömän mittainen
homogeenisesti painotettu edit distance epädeterministisenä jne.

Niin ja HFST-transduktorikirjasto on
<http://sourceforge.net/projects/hfst>.


-- 
Flammie, computer scientist bachelor, linguist master, free software
Finnish localiser, and more! <http://www.iki.fi/flammie/>



More information about the voikko mailing list