[voikko] Sanojen generoinnin laajentaminen
Jukka K. Korpela
jukkakk at gmail.com
Wed Aug 14 09:46:43 EEST 2019
Käsittääkseni muutos, jossa -hkO-johdokset ruvettiin käsittelemään
systemaattisesti eikä sanastoon erikseen vietyinä sanoina, on sujunut
ongelmitta. Hyötynä on ollut, että laaja sanatyyppi voidaan käsitellä
oikein, jolloin myöskin harvinaisehkot -hkO-johdokset tunnistuvat.
Tämä herätti mielessäni kysymyksen, onko muitakin johdostyyppejä, jotka
voisi ja kannattaisi käsitellä samaan tapaan. Ryhdyin tekemään koostetta
suomen kielen produktiivisista johtimista:
http://jkorpela.fi/johtimet.html
Ilmeisesti Voikko jo käsittelee useita näistä johtimista. Päättelen tämän
naiivisti (?) sellaisista asioista, että esimerkiksi verbiä ”tulostella” ei
ole Joukahaisessa, mutta Oikofix tunnistaa sen ja ilmoittaa rakenteeksi
tulostel+la (mihin on varmaan joitakin teknisiä syitä; morfologisesti oikea
analyysihan on tulost+el+la).
Seuraavien melko produktiivisten johtimien käsittelyä voisi ehkä harkita;
olen ottanut esimerkeiksi johdoksia, joita on oikeasti käytetty suomessa ja
joita Oikofix ei tunnista, vaikka se tunnistaa kantasanan erikseen
annettuna.
-en, esim. paloittain → paloittainen (Voikko osannee -ittain-johtimen,
mutta ei näitä edelleenjohdoksia, jotka kieltämättä ovat harvinaisia, mutta
täysin ymmärrettäviä)
-in (teonnimijohdin), esim. herättää → herätin (jonka Oikofix tunnistaa
vain verbinmuodoksi)
-inen, esim. persikka → persikkainen (ilmeisesti Voikko käsittelee
-inen-johtimen, mutta vain osittain)
-isa, esim. pahka → pahkaisa
-ismi, esim. Putin → putinismi (produktiivinen, kun kanta on
henkilötarkoitteinen erisnimi)
-isti, esim. Putin → putinisti
-itse, esim. Wilma → wilmoitse (voidaanko tulkita yleiskieliseksi? Kotuksen
mielestä kai voidaan)
-ittaa, esim. tukala → tukaloittaa
-lainen, esim. Dante → dantelainen (nyt ilmeisesti käsitellään, kun
kantasana on paikannimi, mutta ei, kun se on henkilönnimi)
-nen (pienennysjohdin), esim. ruukku → ruukkunen
-sto, esim. rapu → ravusto
-ttaa (teetto- tai aiheuttamisjohdin), esim. tatuoida → tatuoittaa
-ua (passiivijohdin), esim. katsastaa → katsastua (sen sijaan Voikko
ilmeisesti käsittelee passiivisen -tua-johtimen, esim. betonoida →
betonoitua)
-uttaa (teetto- tai aiheuttamisjohdin), esim. kalastaa → kalastuttaa
Tällaisten toteuttaminen olisi tietysti aika iso asia, ja siinä voi olla
riskelä ja ongelmia, joita en hahmota (niiden lisäksi, jotka ovat melko
ilmeisiä, kuten se, että produktiivisuuden rajoitukset pitäisi selvittää,
samoin sananmuodostuksen yksityiskohdat kuten kantasanan vartalon
mahdollinen muuntuminen).
Jukka
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20190814/e640a4a8/attachment.html>
More information about the voikko
mailing list