[voikko] Perusmuodot ja erisnimet Sukijassa

Marko Laakso marko.laakso at valuemotive.com
Fri May 22 15:02:06 EEST 2015


Hei,

Yritin testailla tuota voikkospell:in käyttöä morfologioiden hakemiseen, 
mutten saanut fi-x-malmor -kirjastoa toimimaan. Löysin saman nimisen 
hakemiston paikasta corevoikko/tests/voikkotest/fi-x-malmor, mutta 
sitäkin käyttäessä sain seuraavan virheilmoituksen:
E: Initialization of Voikko failed: Specified dictionary variant was not 
found

Ilmeisesti jokin asennus on jäänyt tekemättä vaikka ajoinkin make:n 
libvoikoille.

> Vfst-morfologiaan siirtyminen antaa tilaisuuden
> kirjoittaa Sukija uudelleen niin, että se saa käyttöönsä kaikki ne
> tiedot, jotka vfst-morfologia tuottaa.
Tällöin siis Sukijan Java API:n kautta saisi sekä uudet paikannimet 
(Lahti, Kotka, jne.), että tyyliset kirjoitusvirheet (kirjottaa, juveli, 
...)?

Ystävällisesti,
Marko

21.05.2015, 08:01, Hannu Väisänen kirjoitti:
> ke, 2015-05-20 kello 17:14 +0300, Harri Pitkänen kirjoitti:
>
>> Tämäkin onnistuu voikkospell-komennolla:
>>
>> $ echo Nurmekseen | voikkospell -m -d fi-x-malmor | grep 'CLASS\|BASEFORM'
>> A(Nurmekseen):1:BASEFORM=Nurmes
>> A(Nurmekseen):1:CLASS=paikannimi
>> A(Nurmekseen):2:BASEFORM=nurmi
>> A(Nurmekseen):2:CLASS=nimisana
>> A(Nurmekseen):3:BASEFORM=Nurmi
>> A(Nurmekseen):3:CLASS=sukunimi
> Tulokset saattavat olla erilaiset kuin Sukijassa. Sukija nimittäin
> tunnistaa yleisiä kirjoitusvirheitä ("kirjottaa"), vanhoja taivutuksia
> ("isäinsä") ja vanhoja sanoja ("juveli" eli jalokivi). Sovelluksesta
> riippuu, onko tällä merkitystä vai ei.
>
> Koska Sukija on tehty Solr:n (http://lucene.apache.org/solr/)
> liitännäiseksi, siinä ei ole komentorivityökaluja, ja koska tein Sukijan
> sanojen muuttamiseksi perusmuotoon, siinä ei saa sanoista irti muuta
> kuin perusmuodot. (-: Vfst-morfologiaan siirtyminen antaa tilaisuuden
> kirjoittaa Sukija uudelleen niin, että se saa käyttöönsä kaikki ne
> tiedot, jotka vfst-morfologia tuottaa. Samalla Sukijan voi muuttaa
> paremmin yhteensopivaksi Solr:n API:n kanssa (joka on muuttunut paljon
> Sukijan eka version jälkeen).
>
> Vfst-morfologiassa Sukijaa voi käyttää sekä Voikon oikolukusanaston että
> Sukijan generoiman indeksointisanaston kanssa.
>
>
>
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> http://lists.puimula.org/listinfo/voikko



More information about the voikko mailing list