[voikko] pointtereita dokumenttien indeksointiin?
Tuomas Salo
tuomas.salo at iki.fi
Thu May 26 00:19:08 EEST 2011
Moi,
kiitokset - tuonne löysinkin ja koetin päästä README-tiedoston avulla eteenpäin. Nutch toimii, mutta malaga-fi-pluginilla ei tunnu olevan mitään vaikutusta.
Ohjeessa oli ainakin kaksi kohtaa, jotka menivät jotenkin väärin:
1) strings-komento ei näytä Malaga-Java-rivejä. Vain nämä:
$ strings build/nutch*{job,war} | grep -i malaga
plugins/malaga-fi/PK
plugins/malaga-fi/malaga-fi.jar
plugins/malaga-fi/plugin.xml
plugins/malaga-fi/PK
plugins/malaga-fi/malaga-fi.jarPK
plugins/malaga-fi/plugin.xmlPK
WEB-INF/classes/plugins/malaga-fi/PK
WEB-INF/classes/plugins/malaga-fi/malaga-fi.jar
WEB-INF/classes/plugins/malaga-fi/plugin.xml
WEB-INF/classes/plugins/malaga-fi/PK
WEB-INF/classes/plugins/malaga-fi/malaga-fi.jarPK
WEB-INF/classes/plugins/malaga-fi/plugin.xmlPK
2) Kuudes kohta kehottaa kopioimaan malaga-fi-pluginin plugins-hakemistoon, mutta sellaista hakemistoa ei ole lainkaan.
Teenköhän jotain väärin?
Mulla on käytössä Ubuntu 10.04 (amd64), java 1.6.0_24 ja apache-nutch 1.2. Suomimalagasta on versio 1.9, mutta musta tuntuu että sinne asti ei edes päästä.
Tuomas
On 20.5.2011, at 7:27, Hannu Väisänen wrote:
> On Thu, May 19, 2011 at 11:50:29PM +0300, Tuomas Salo wrote:
>> mulla on kasa suomenkielisiä dokumentteja (html, pdf, yms, mutta
>> voin kyllä muuntaa ne tekstimuotoonkin), jotka haluaisin indeksoida
>> jollain hyvällä enginellä, jotta voin tehdä vapaasanahakuja. Ja
>> tietysti niin, että se löytää suomen kielen muodot, siksihän tänne
>> kirjoitankin.
>
> http://sourceforge.net/projects/malaga-fi/
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> http://lists.puimula.org/listinfo/voikko
>
More information about the voikko
mailing list