[voikko] Samoin taipuvien sanojen yhdistäminen

Sami Liedes sami.liedes at iki.fi
Sun Jul 13 20:37:33 EEST 2014


Hei!

Käytän Voikkoa ja fi-x-morphoid-sanastoa (Python-rajapintaa, mutta
voin tarvittaessa kyllä siirtyä C++:aan) tekstin morfologiseen
analysointiin.

Minulla olisi ajatus siihen, miten saisin vähennettyä tietyllä
monitulkintaisten sanojen merkityksiä, mutta en ole ihan varma, miten
tätä lähtisin toteuttamaan. Pystyykö Voikon avulla taivuttamaan sanoja
perusmuodosta lähtien? Tai selvittämään, ovatko kahden merkityksen
kaikki taivutusmuodot identtisiä?

Kaivannee esimerkkiä.

Sanan "voimassa" merkitykset ovat (webvoikon mukaan) seuraavat:

1. Perusmuoto: voida
  Sanaluokka: verbi eli teonsana
  Sijamuoto: inessiivi eli sisäolento
  Tapaluokka tai nominaalimuoto: MA-infinitiivi
  Rakenne: voida

2. Perusmuoto: voimassa
  Sanaluokka: substantiivi (yleisnimi)
  Sijamuoto: nominatiivi eli nimentö
  Rakenne: voi+massa

3. Perusmuoto: voima
  Sanaluokka: substantiivi (yleisnimi)
  Sijamuoto: inessiivi eli sisäolento
  Rakenne: voima

4. Perusmuoto: voima
  Sanaluokka: substantiivi (yleisnimi)
  Sijamuoto: inessiivi eli sisäolento
  Partisiippi: agenttipartisiippi (-MA)
  Rakenne: voi+ma

Mikäli en ole erehtynyt, merkitysten 3 ja 4 kaikki taivutusmuodot ovat
täsmälleen samat. Kääntäen tästä seuraa se, että sana X on merkityksen
4 voi+ma-sanan johdannainen jos ja vain jos se on myös merkityksen 3
voima-sanan johdannainen. Tällaisia sanoja on uskoakseni paljon; niitä
ovat muun muassa

 * monet sanastosta löytyvät -jA-päätteiset tekijänimityyppiset sanat
 * aasialainen ja aasi+ala+inen
 * hirvi+ttävä, hirvittä+vä
 * hyppyse+llinen, hyppy+sell+inen
 * iljettä+vä, ilje+ttävä
 * kohotta+va, koho+ttava
 * kohtuullinen, kohtuu+llinen
 * kaikki yhdyssanat, joiden alkuosa on monimerkityksinen mutta
  taipumaton

Sovelluksessani en ole erityisen kiinnostunut sanan tarkasta
rakenteesta; mielelläni kohtelisin yhtenä sanana kaikkia sanoja, jotka
täyttävät seuraavat ehdot:

 1. sama sanaluokka
 2. sama perusmuoto
 3. kaikki kuviteltavissa olevat taivutusmuodot ovat samat

Tällöin sanan "voimassa" merkityksiksi jäisi listan merkitykset 1 ja 2
ja yhdistetty merkitys 3+4. Sanalle "viini" pitäisi edelleen palauttaa
molemmat substantiivimerkitykset, koska ne taipuvat eri tavalla;
kuitenkin sanalle "viinileili" jäisi vain yksi merkitys.

Pystyykö siis Voikosta kaivamaan jotenkin sen tiedon, ovatko kahden
sanan kaikki taivutusmuodot samat?

	Sami
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 819 bytes
Desc: Digital signature
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20140713/cad07b34/attachment.sig>


More information about the voikko mailing list