[voikko] Malaga-fi Finnish plugin for Nutch

Hannu Väisänen hvaisane at joyx.joensuu.fi
Tue Apr 13 10:53:09 EEST 2010


On Mon, Apr 12, 2010 at 05:51:37PM +0300, Harri Pitkänen wrote:
> Onko riippuvuus suomen kieleen kovin syvään rakennettu? Koodista
> katsomalla vaikuttaisi, että ei ole, eli tämän yleistäminen muillekin
> kielille voisi olla mahdollista.

Yleistäminen eri kielille on tavoitteena.

Ainoa kielestä riippuva asia on public interface Morphology. Tai
oikeastaan se riippuu kielen morfologian kuvauksesta: Malaga, HFST, ...

Nutchissa joutuu luultavasti kirjoittamaan Tokenizer-, Analyzer- ja
QueryFilter-luokat jokaiselle kielelle erikseen, mutta ne ovat aika
triviaaleja.


>   http://wiki.apertium.org/wiki/Lttoolbox-java

Kiitos vihjeestä!


> Myös HFST:stä on olemassa luultavasti tähän tarkoitukseen riittävä Java-
> toteutus.

Jeps.



More information about the voikko mailing list