[voikko] Uusi Sukija pre-alpha on SourceForgessa
Hannu Väisänen
hannu.vaisanen at uef.fi
Fri Sep 9 17:00:05 EEST 2011
Sukija on ohjelma suomenkielisten tekstien indeksointiin.
Sukija analysoi sanat morfologisesti, muuttaa sanat perusmuotoon (joka
on sanakirjoissa) ja indeksoi perusmuodot, jotta sanan kaikki
taivutusmuodot löytyvät vain perusmuotoa etsimällä.
Mitä tarvitaan:
0. Sukija.
https://sourceforge.net/projects/sukija/
1. Suomi-Malaga
2. Malaga (*)
3. Apache Commons Logging (*)
4. Apache Lucene Core versio 3.3.0
5. Apache Tika versio 0.9
6. JNA (*)
(*) Ovat saatavissa Fedora 15:n ja Ubuntu 11.04:n paketteina.
Tarkemmat ohjeet ovat tiedostossa
LUE-MINUT.txt
More information about the voikko
mailing list