[voikko] Solr ja Voikko

Harri Pitkänen hatapitk at iki.fi
Tue Dec 20 16:17:43 EET 2011


On Tuesday 20 December 2011, Ismo Raitanen wrote:
> Ehdin vihdoin testata Harrin tekemää koodia Voikon yhdistämisestä
> Solriin. Laitanpa pientä raporttia, jos vaikka joku muukin on
> kiinnostunut Voikon käyttämisestä Solrin kanssa. (Edellinen,
> alimmaisena oleva, meni vain Harrille.)
> 
> Sain siis koodit toimimaan, ja Voikon avulla saatu sanan (ensimmäinen)
> perusmuoto tuntuisi päätyvän indeksiin. Sanat, joille ei löydy
> perusmuotoa, menevät indeksiin sellaisenaan. Vastaavasti kyselyn sanat
> muuttuvat perusmuotoon.

Hienoa, että sait toimimaan. Tuota koodia kannattaisi vielä täydentää niin, 
että kaikki mahdolliset perusmuodot indeksoidaan. Korjattavat paikat koodissa 
ovat täällä:

  http://www.puimula.org/htp/tmp/solr/solrtest/src/main/java/org/puimula/experimental/solrtest/VoikkoBaseformFilter.java

Itse en nyt ehdi tätä tekemään, mutta tammi-helmikuussa ehkä. Luulisin, että 
näillä muutoksilla tästä saisi varsin hyvän ja käyttökelpoisen työkalun, jonka 
voisi paketoida ja julkaistakin. Melko varmasti se ainakin päihittäisi nuo 
Solrin ohjeissa mainitut vaihtoehdot.

Harri



More information about the voikko mailing list