[voikko] Perusmuodot ja erisnimet Sukijassa
Marko Laakso
marko.laakso at valuemotive.com
Wed May 20 14:34:36 EEST 2015
Hei,
Kiitoksia vastauksista!
Näyttää erittäin lupaavalta! Periaatteessa mallisi mukainen lista on jo
itsessään samaa tasoa, kuin Malagasta saamani tulosteet, mutta
mainitsemistasi sanaluokista ja erisnimien tyypeistä olisi meille kyllä
paljon apua. Käsittelemme esimerkiksi henkilöiden ja paikkojen nimet
aivan eri tavalla. Jos ohjelma erottelee verbit, adjektiivit yms.
toisistaan, niin tämäkin helpottaisi tulosten jatkokäsittelyä.
Onko morfologioiden tunnistus Java-ohjelmalle iso urakka ts. selviääkö
sen kanssa pitkistäkin listoista sanoja? Malaga on selvinnyt
kohtuullisella odottelulla kymmenistä tai sanoista tuhansista kyselyistä
joten samaa luokkaa oleva suorituskyky riittää kyllä tarpeisiimme.
Käytämme Malagaa ainoastaan löytääksemme sanojen perusosat, joten
siirtyminen vfst-morfologiaan ei liene teknisesti kovinkaan suuri hyppy
kunhan tiedämme kuinka vastaavat kyselyt hoituvat sen päällä.
Ystävällisesti,
Marko
20.05.2015, 14:05, Hannu Väisänen kirjoitti:
> Pienellä Java-ohjelmalla saan vfst-morfologiasta ulos seuraavaa (sana on
> "Nurmekseen"):
>
> "Nurmekseen": "Nurmes"
> "Nurmekseen": "Nurmi"
> "Nurmekseen": "nurmi"
>
>
> "Nurmi" on Joukahaisessa sukunimenä.
>
> Onko syytä erottaa toisistaan erilaiset erisnimet? Joukahaisessa on
> etunimi, sukunimi, paikannmi, muu erisnimi. Entä eri sanaluokat?
>
>
> _______________________________________________
> voikko mailing list
> voikko at lists.puimula.org
> http://lists.puimula.org/listinfo/voikko
More information about the voikko
mailing list