[voikko] Uusi Sukija pre-alpha on SourceForgessa

Hannu Väisänen hannu.vaisanen at uef.fi
Fri Sep 9 17:00:05 EEST 2011


Sukija on ohjelma suomenkielisten tekstien indeksointiin.

Sukija analysoi sanat morfologisesti, muuttaa sanat perusmuotoon (joka
on sanakirjoissa) ja indeksoi perusmuodot, jotta sanan kaikki
taivutusmuodot löytyvät vain perusmuotoa etsimällä.

Mitä tarvitaan:

0. Sukija.
   https://sourceforge.net/projects/sukija/

1. Suomi-Malaga
2. Malaga (*)
3. Apache Commons Logging (*)
4. Apache Lucene Core versio 3.3.0
5. Apache Tika versio 0.9
6. JNA (*)
 
(*) Ovat saatavissa Fedora 15:n ja Ubuntu 11.04:n paketteina.

Tarkemmat ohjeet ovat tiedostossa
LUE-MINUT.txt


More information about the voikko mailing list