[voikko] HFST ja tiedostojen indeksointi (oli Re: libvoikko HFST-transduktoreilla)

Hannu Väisänen hvaisane at joyx.joensuu.fi
Mon Nov 16 07:36:03 EET 2009


On Wed, Nov 04, 2009 at 12:31:34PM +0200, Flammie Pirinen wrote:
> 2009-11-02, Harri Pitkänen sanoi:
> > Käsittääkseni teillä olisi olemassa HFST-morfologioita myös muille
> > kielille kuin suomelle?
> 
> Kyllä välittömästi on ainakin pohjois-saame ja fääri kai saatavilla,
> luultavasti vastaavia löytyy paljonkin kun morfologiset jäsentimet oli
> usein tapana tehdä fst-työkaluilla, joita hfst:hen on kloonattu.
> Lisäksi sanalistat ja monet spell-sanastot on aika helposti
> käännettävissä automaateiksi.

Ja kun HFST-morfologioista taitaa saada esiin sanojen perusmuodon,
niitä voi käyttää tiedostojen indeksointiin, kun tekee esimerkiksi
Java-pluginin HFST:n ja Nutchin (http://lucene.apache.org/nutch/)
välille. Hmmm....



More information about the voikko mailing list