[voikko] pointtereita dokumenttien indeksointiin?

Tuomas Salo tuomas.salo at iki.fi
Thu May 26 00:19:08 EEST 2011


Moi,

kiitokset - tuonne löysinkin ja koetin päästä README-tiedoston avulla eteenpäin. Nutch toimii, mutta malaga-fi-pluginilla ei tunnu olevan mitään vaikutusta.

Ohjeessa oli ainakin kaksi kohtaa, jotka menivät jotenkin väärin:

1) strings-komento ei näytä Malaga-Java-rivejä. Vain nämä:

$ strings build/nutch*{job,war} | grep -i malaga
plugins/malaga-fi/PK
plugins/malaga-fi/malaga-fi.jar
plugins/malaga-fi/plugin.xml
plugins/malaga-fi/PK
plugins/malaga-fi/malaga-fi.jarPK
plugins/malaga-fi/plugin.xmlPK
WEB-INF/classes/plugins/malaga-fi/PK
WEB-INF/classes/plugins/malaga-fi/malaga-fi.jar
WEB-INF/classes/plugins/malaga-fi/plugin.xml
WEB-INF/classes/plugins/malaga-fi/PK
WEB-INF/classes/plugins/malaga-fi/malaga-fi.jarPK
WEB-INF/classes/plugins/malaga-fi/plugin.xmlPK

2) Kuudes kohta kehottaa kopioimaan malaga-fi-pluginin plugins-hakemistoon, mutta sellaista hakemistoa ei ole lainkaan.

Teenköhän jotain väärin?

Mulla on käytössä Ubuntu 10.04 (amd64), java 1.6.0_24 ja apache-nutch 1.2. Suomimalagasta on versio 1.9, mutta musta tuntuu että sinne asti ei edes päästä.


Tuomas


On 20.5.2011, at 7:27, Hannu Väisänen wrote:

> On Thu, May 19, 2011 at 11:50:29PM +0300, Tuomas Salo wrote:
>> mulla on kasa suomenkielisiä dokumentteja (html, pdf, yms, mutta
>> voin kyllä muuntaa ne tekstimuotoonkin), jotka haluaisin indeksoida
>> jollain hyvällä enginellä, jotta voin tehdä vapaasanahakuja. Ja
>> tietysti niin, että se löytää suomen kielen muodot, siksihän tänne
>> kirjoitankin.
> 
> http://sourceforge.net/projects/malaga-fi/
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> http://lists.puimula.org/listinfo/voikko
> 




More information about the voikko mailing list