[voikko] Voikon Java-rajapinnan morfologinen analyysi
juhohe at cc.joensuu.fi
juhohe at cc.joensuu.fi
Wed Mar 2 15:09:43 EET 2011
Kun Voikon Java-rajapinnalla suorittaa numeraalien yksikön
nominatiiveille Voikko.analyze()-metodin, ei analyysissä kerrota sanan
sijamuotoa,
ei myöskään sitä, onko kyse yksiköstä vai monikosta.
Esimerkiksi sanalle "kolme" analyysi on seuraavanlainen:
[{BASEFORM=kolme, CLASS=lukusana, WORDBASES=+kolme(kolme), STRUCTURE==ppppp}]
Samoin persoonamuotojen vastaavat muodot, sekä esimerkiksi pronomini
"joka" perusmuodossaan eivät kerro sijamuotoa.
Sanan "joka" analyysi:
[{BASEFORM=joka, CLASS=asemosana, WORDBASES=+joka(joka), STRUCTURE==pppp}]
Onko asian tarkoituskin olla näin?
Voiko tilanteessa, jossa analyysi ei ilmoita nominin sijamuotoa,
olettaa kyseessä olevan yksikön nominatiivin?
Haluaisin myös verbeistä enemmän tietoa. Esimerkiksi "hypätä"-sana
tuottaa seuraavanlaiset analyysit:
[{BASEFORM=hypätä, CLASS=teonsana, WORDIDS=+hypätä(w503040),
WORDBASES=+hypätä(hypätä), STRUCTURE==pppppp, MOOD=indicative},
{BASEFORM=hypätä, CLASS=teonsana, WORDIDS=+hypätä(w503040),
WORDBASES=+hypätä(hypätä), STRUCTURE==pppppp}]
Miksi näistä kumpikaan ei sisällä tietoa, että kyse on A-infinitiivistä?
Minulla on sanastona dict-morpho.zip-tiedoston sisältämä sanasto.
More information about the voikko
mailing list