[voikko] Uusi sanaluokka etuliitteille
Harri Pitkänen
hatapitk at iki.fi
Sun Sep 28 18:16:45 EEST 2014
Tähän saakka Voikko on luokitellut yhdyssanat, joiden loppuosa on jätetty pois
(esim. "pehmeä- ja karkeakarvainen") sanan alkuosan sanaluokan mukaan.
Varsinaiset etuliitteet (esim. "pika- ja vakiovuoro") ovat taas jääneet
kokonaan ilman sanaluokkaa.
Tuntematta sanan loppuosaa on käytännössä kovin vaikeaa sanoa mitään
yhdyssanan sanaluokasta. Tämä onnistuisi vain, jos lauseyhteys on tiedossa,
mutta morfologinen analyysi Voikossa tehdään toistaiseksi sana kerrallaan.
Tästä syystä lisäsin libvoikkoon (sekä Malaga- että VFST-analysaattoreihin)
uuden sanaluokan "etuliite". Tähän luokkaan luokitellaan jatkossa kaikki
yhdysmerkkiin päättyvät kelvollisiksi katsotut sanat.
Muutos tulee mukaan libvoikon ja suomi-malagan seuraaviin versioihin. Mikäli
tuolloin julkaistavaa suomi-malagaa käytetään vanhan libvoikon kanssa, eräät
sanat (esim. "pehmeä-") menettävät sanaluokkansa. En kuitenkaan usko, että
tästä on käytännön sovelluksissa haittaa. Aiempi luokitteluhan on ollut
mahdollisesti väärä, ja sovellusten on jo aiemmin täytynyt varautua sanoihin,
joilta sanaluokka puuttuu. Asiasta täytyy kuitenkin mainita tulevien
versioiden julkaisutiedoissa, ja luultavasti järkevintä on julkaista
seuraavalla kerralla libvoikko ja suomi-malaga samana päivänä.
Harri
More information about the voikko
mailing list