[voikko] Tiedoksi Sukija-sovellus: Puheenvuorot.kansanmuisti.fi (ja hiukan sanoja)

Tuomas Salo tuomas.salo at iki.fi
Wed Dec 7 10:23:54 EET 2011


Hei!

Nyt vasta ehdin palata aiheeseen.

Tutkiskelin Lucenen ja Solrin käyttöä, mutta koska olen kaikkea muuta kuin Java-ohjelmoija, en oikein päässyt niiden kanssa vauhtiin.

Ja juuri siitä syystähän tuolla Puheenvuorot-palvelussa ei olekaan kunnollista hakua, ainakaan vielä.

Perusmuotoon palauttamiseen käytän tekemääni Perusta-palvelua (http://perusta.kansanmuisti.fi), joka on vain purkkaa Malagan ma-komennon päälle, ja käyttää siis pohjana melko tuoretta trunk-versiota svn:stä.

Sanat ja sanojen esiintymät on tallennettu mysql-kantaan, josta on sitten ollut melko triviaalia tehdä koontihaut sanapilviä ja diagrammeja varten. Suorituskyky ja skaalautuvuus eivät ole huippuluokkaa, mutta tähän projektiin aivan riittävät, kun importin yhteydessä lasketaan valmiiksi mm. yleisimmät sanat.

T

On 8.11.2011, at 8:16, Hannu Väisänen wrote:

> ma, 2011-11-07 kello 19:10 +0200, Tuomas Salo kirjoitti:
>> Joskus mietityttää, minkä verran ja minkälaisiin asioihin Voikkoa ja
>> Sukijaa käytetään.
> 
> Olen monesti miettinyt, käyttääkö Sukijaa kukaan muu kuin minä. (-:
> 
> Olisi mukava tietää, mitä Sukijan versiota käytät. Nythän SourceForgessa
> on kaksi: vanhempi, nimeltä Sukija, joka käyttää indeksointiin Lucenea
> ja jossa on yksinkertainen omatekoinen käyttöliittymä, ja SukijaSolr,
> joka lähettää tiedostot Solr:ään indeksoitavaksi (ja Solr:ään
> konfiguroimani liitännäinen muuttaa sanat perusmuotoon ennen
> indeksointia), ja sanoja täytyy sitten etsiä Solr:n kautta.
> 
> Myös Solr käyttää Lucenea indeksointiin, mutta Solr:ssa on parempi
> käyttöliittymä sanojen etsimiseen kuin minun omatekoinen viritys.
> 
> 
>> pidättäydytään (Voikko tunnistaa, Sukija ei?)
> 
> Tosi on. Kiitos! Tuo pitää korjata vielä tänään ja laittaa korjaus
> SourceForgeen. Sukijan pitää tunnistaa ja muuttaa perusmuotoon kaikki
> sanat, mitkä Voikkokin, ja sitten vielä lisää: wanhoja sanoja ja
> yleisimpiä kirjotusvihreitä.
> 
> 
> 
> 
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> http://lists.puimula.org/listinfo/voikko
> 

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20111207/aebb2fb7/attachment.html>


More information about the voikko mailing list