[voikko] Malaga-fi Finnish plugin for Nutch
Hannu Väisänen
hvaisane at joyx.joensuu.fi
Tue Apr 13 10:53:09 EEST 2010
On Mon, Apr 12, 2010 at 05:51:37PM +0300, Harri Pitkänen wrote:
> Onko riippuvuus suomen kieleen kovin syvään rakennettu? Koodista
> katsomalla vaikuttaisi, että ei ole, eli tämän yleistäminen muillekin
> kielille voisi olla mahdollista.
Yleistäminen eri kielille on tavoitteena.
Ainoa kielestä riippuva asia on public interface Morphology. Tai
oikeastaan se riippuu kielen morfologian kuvauksesta: Malaga, HFST, ...
Nutchissa joutuu luultavasti kirjoittamaan Tokenizer-, Analyzer- ja
QueryFilter-luokat jokaiselle kielelle erikseen, mutta ne ovat aika
triviaaleja.
> http://wiki.apertium.org/wiki/Lttoolbox-java
Kiitos vihjeestä!
> Myös HFST:stä on olemassa luultavasti tähän tarkoitukseen riittävä Java-
> toteutus.
Jeps.
More information about the voikko
mailing list