<div dir="ltr">Moi,<div><br></div><div> Muistaakseni jonkinlaista omaa tokenize versiota käytinkin alkuun, mutta tuo Voikon oma paremmin hanskasi Suomen kielen yhdyssanat, väliviivat ja muuta vastaavaa. Siksi sitä tykkäsin käyttää, ei tarvinnut alkaa detaileja itse säätään. En ole kyllä sorsia katsonut kuinka yksinkertaista se sitten oikeasti on.</div><div><br></div><div> Mutta voitko tehdä Java versiosta uuden Maven deploymentin eli sellaisen että voin vetäistä sen Maven centralista versionumeroa muuttamalla? Entä onko libvoikon sorsien päivityksestä webbisivuille mahdollista aikataulua? Voikon sivuilla myös ehdotetaan kysymään listalla apua OSX kääntämiseen. Auttakee? Tai kuka sitä homebrew versiota hoitaa ja voiko siihen saada näitä uusimpia muutoksia?</div><div><br></div><div>t.Teemu</div></div><div class="gmail_extra"><br><div class="gmail_quote">2016-01-07 8:03 GMT+02:00 Hannu Väisänen <span dir="ltr"><<a href="mailto:Hannu.Vaisanen@uef.fi" target="_blank">Hannu.Vaisanen@uef.fi</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class=""><br>
06.01.2016, 18:13, Harri Pitkänen kirjoitti:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Nyt tuo toimii kuten pitääkin, 5 miljoonan merkin teksti meni läpi noin 10<br>
sekunnissa.<br>
</blockquote>
<br></span>
Jos on vieläkin liian hidas ja jos käyttää Javaa, niin jflex'illä voi tehdä oman tokenizer-luokan. Katso Solr (tai Sukija :-).<div class="HOEnZb"><div class="h5"><br>
_______________________________________________<br>
voikko mailing list<br>
<a href="mailto:voikko@lists.puimula.org" target="_blank">voikko@lists.puimula.org</a><br>
<a href="http://lists.puimula.org/listinfo/voikko" rel="noreferrer" target="_blank">http://lists.puimula.org/listinfo/voikko</a><br>
</div></div></blockquote></div><br></div>