[voikko] Voikon Java-rajapinnan morfologinen analyysi

Harri Pitkänen hatapitk at iki.fi
Fri Mar 25 15:24:14 EET 2011


On Friday 25 March 2011, Juho Heinonen wrote:
> > Tarkasti ottaen nämä analyysit eivät ole identtisiä:
> Pahoittelen huolimattomuuttani.

Eipä mitään, hiukan hämääväähän tuo tosiaan on, kun tulee kaksi analyysiä 
oleellisesti samasta asiasta.

> Olen harjoittelemassa tekemässä yliopiston
> projektissa rajoitekielioppiin perustuvaa morfologista disambiguaattoria
> ja käytämme Voikkoa morfologiseen analysointiin. Käytämme Voikkoa, koska
> sitä voi käyttää Java-ohjelmissa.

Jos/kun saatte tuloksia projektistanne, olisi mielenkiintoista kuulla niistä. 
Tästä voisi olla meille suurestikin hyötyä, koska tarvitsemme jossain 
vaiheessa disambiguaattoria myös Voikossa. Java-toteutus sinällään ei Voikkoon 
oikein sovi, mutta kaikki ideat ja havainnot toteutustekniikasta auttaisivat 
meitä kyllä paljon.

Toistaiseksi en itse ole asiaa tutkinut juuri lainkaan, mutta tiedän, että 
jonkinlaisia GPL-lisensoituja toteutuksia on jo olemassa. Eli on olemassa VISL 
GC-3, jota tosin ei ilmeisesti voi käyttää kirjastona, joten sen käyttäminen 
libvoikosta olisi toistaiseksi mahdotonta:

  http://beta.visl.sdu.dk/cg3.html

Lisäksi Fred Karlssonin rajoitekielioppi suomen kielelle on viime vuonna 
julkaistu GPL-lisenssillä:

  https://victorio.uit.no/langtech/trunk/kt/fin/src/fin-dis.cg1

Mutta en ole tosiaan itse edes kokeillut näitä, joten enpä osaa vielä 
ihmeemmin arvioida niiden käyttökelpoisuutta.

Harri



More information about the voikko mailing list