[hunspell-fi-devel] Semanttinen informaatio ja johtaminen

Ville Nygrén ville.nygren at gmail.com
Sun Nov 27 11:35:24 EET 2005


Hei!

Tuota johdoslistan tynkää katsoessa tuli mieleen sellainenkin
asia kun semantiikan vaikutus sanojen johtamiseen.

Yksinkertainen tapahan on hoitaa erottelu produktiivisiin ja
ei-produktiiviin johtimiin lisäämällä jälkimmäisillä johdetut
sanat suoraan sanastoon. Tämä tietenkin vaatii manuaalista
työtä, mutta on varmaan hyvä tapa varmistua siitä ettei
ohjelma tunnista vääränlaisia johdoksia.

Toisaalta monessa tapauksessa on niin, että koodaamalla
sanaan jotakin perusinformaatiota sen merkityksestä,
voitaisiin nämäkin ei-produktiiviset johtimet tehdä
produktiiviseksi: produktiivisuuden sanaluokan sisällä
tilalle tulisi produktiivisuus tietyn suppeamman sanajoukon
sisällä.

Esimerkki: -(i)nen -johtimesta:

vetinen
sokerinen
kalainen

mutta:

*kuppinen
*takkinen
*sormuksinen

Ainakin äkkiseltään tulee mieleen että kysymys on
siitä, voidaanko kantasanaa käyttää massaterminä
(mass noun) vai ei. Joitakin sanoja voi käyttää
kumpanakin (yksi vesi - paljon vettä), joitakin vain
massatermeinä (*yksi kura - paljon kuraa) ja taas
joitakin vain yksilötermeinä (yksi sormus - *paljon
sormusta). Olisiko mahdollista koodata
tämänkaltaista informaatiota sanastoon?

Semanttisen informaation määrä tosin kasvaisi
melko suureksi ja monimutkaistaisi asioita.
Olisi otettava huomioon myös esimerkiksi se,
että jotkin sanat (esim. *takkinen) ovat ovat täysin
mielekkäitä yhdyssanojen osana ("mustatakkinen
mies").

Heitän tämän nyt näin pohdittavaksi sen vuoksi,
että nähdäkseni asia koskettaa hyvin monia oikoluvun
kehittämiseen liittyviä periaatteellisia kysymyksiä.
Ihan peruskysymyshän tietenkin on se, missä määrin
oikoluvun tulisi ottaa kantaa sisällölliseen puoleen, vai
tarkistaa ainostaan muodon oikeellisuus. Toisaalta
muodon ja sisällön erottaminen ylipäätään kielen
teorissa on erittäin ongelmallinen kysymys (onko
"hölkkäin" jossakin mielessä muodollisesti oikein,
vaikka sillä ei olekaan selkeää semanttista sisältöä?).

Terveisin,

--
Ville Nygrén                    tel. +35840 837 9731
Uudenmaantie 70 C 51    ville.nygren at gmail.com
20720 Turku



More information about the devel mailing list