[voikko] Perusmuodot ja erisnimet Sukijassa

Marko Laakso marko.laakso at valuemotive.com
Wed May 20 14:34:36 EEST 2015


Hei,

Kiitoksia vastauksista!

Näyttää erittäin lupaavalta! Periaatteessa mallisi mukainen lista on jo 
itsessään samaa tasoa, kuin Malagasta saamani tulosteet, mutta 
mainitsemistasi sanaluokista ja erisnimien tyypeistä olisi meille kyllä 
paljon apua. Käsittelemme esimerkiksi henkilöiden ja paikkojen nimet 
aivan eri tavalla. Jos ohjelma erottelee verbit, adjektiivit yms. 
toisistaan, niin tämäkin helpottaisi tulosten jatkokäsittelyä.

Onko morfologioiden tunnistus Java-ohjelmalle iso urakka ts. selviääkö 
sen kanssa pitkistäkin listoista sanoja? Malaga on selvinnyt 
kohtuullisella odottelulla kymmenistä tai sanoista tuhansista kyselyistä 
joten samaa luokkaa oleva suorituskyky riittää kyllä tarpeisiimme. 
Käytämme Malagaa ainoastaan löytääksemme sanojen perusosat, joten 
siirtyminen vfst-morfologiaan ei liene teknisesti kovinkaan suuri hyppy 
kunhan tiedämme kuinka vastaavat kyselyt hoituvat sen päällä.

Ystävällisesti,
Marko

20.05.2015, 14:05, Hannu Väisänen kirjoitti:
> Pienellä Java-ohjelmalla saan vfst-morfologiasta ulos seuraavaa (sana on
> "Nurmekseen"):
>
> "Nurmekseen": "Nurmes"
> "Nurmekseen": "Nurmi"
> "Nurmekseen": "nurmi"
>
>
> "Nurmi" on Joukahaisessa sukunimenä.
>
> Onko syytä erottaa toisistaan erilaiset erisnimet? Joukahaisessa on
> etunimi, sukunimi, paikannmi, muu erisnimi. Entä eri sanaluokat?
>
>
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> http://lists.puimula.org/listinfo/voikko



More information about the voikko mailing list