[voikko] Voikon Java-rajapinnan morfologinen analyysi

juhohe at cc.joensuu.fi juhohe at cc.joensuu.fi
Wed Mar 2 15:09:43 EET 2011


Kun Voikon Java-rajapinnalla suorittaa numeraalien yksikön  
nominatiiveille Voikko.analyze()-metodin, ei analyysissä kerrota sanan  
sijamuotoa,
ei myöskään sitä, onko kyse yksiköstä vai monikosta.
Esimerkiksi sanalle "kolme" analyysi on seuraavanlainen:
[{BASEFORM=kolme, CLASS=lukusana, WORDBASES=+kolme(kolme), STRUCTURE==ppppp}]
Samoin persoonamuotojen vastaavat muodot, sekä esimerkiksi pronomini  
"joka" perusmuodossaan eivät kerro sijamuotoa.
Sanan "joka" analyysi:
[{BASEFORM=joka, CLASS=asemosana, WORDBASES=+joka(joka), STRUCTURE==pppp}]

Onko asian tarkoituskin olla näin?
Voiko tilanteessa, jossa analyysi ei ilmoita nominin sijamuotoa,  
olettaa kyseessä olevan yksikön nominatiivin?

Haluaisin myös verbeistä enemmän tietoa. Esimerkiksi "hypätä"-sana  
tuottaa seuraavanlaiset analyysit:
[{BASEFORM=hypätä, CLASS=teonsana, WORDIDS=+hypätä(w503040),  
WORDBASES=+hypätä(hypätä), STRUCTURE==pppppp, MOOD=indicative},
{BASEFORM=hypätä, CLASS=teonsana, WORDIDS=+hypätä(w503040),  
WORDBASES=+hypätä(hypätä), STRUCTURE==pppppp}]
Miksi näistä kumpikaan ei sisällä tietoa, että kyse on A-infinitiivistä?

Minulla on sanastona dict-morpho.zip-tiedoston sisältämä sanasto.



More information about the voikko mailing list