[voikko] Uusi sanaluokka etuliitteille

Harri Pitkänen hatapitk at iki.fi
Sun Sep 28 18:16:45 EEST 2014


Tähän saakka Voikko on luokitellut yhdyssanat, joiden loppuosa on jätetty pois 
(esim. "pehmeä- ja karkeakarvainen") sanan alkuosan sanaluokan mukaan. 
Varsinaiset etuliitteet (esim. "pika- ja vakiovuoro") ovat taas jääneet 
kokonaan ilman sanaluokkaa.

Tuntematta sanan loppuosaa on käytännössä kovin vaikeaa sanoa mitään 
yhdyssanan sanaluokasta. Tämä onnistuisi vain, jos lauseyhteys on tiedossa, 
mutta morfologinen analyysi Voikossa tehdään toistaiseksi sana kerrallaan. 
Tästä syystä lisäsin libvoikkoon (sekä Malaga- että VFST-analysaattoreihin) 
uuden sanaluokan "etuliite". Tähän luokkaan luokitellaan jatkossa kaikki 
yhdysmerkkiin päättyvät kelvollisiksi katsotut sanat.

Muutos tulee mukaan libvoikon ja suomi-malagan seuraaviin versioihin. Mikäli 
tuolloin julkaistavaa suomi-malagaa käytetään vanhan libvoikon kanssa, eräät 
sanat (esim. "pehmeä-") menettävät sanaluokkansa. En kuitenkaan usko, että 
tästä on käytännön sovelluksissa haittaa. Aiempi luokitteluhan on ollut 
mahdollisesti väärä, ja sovellusten on jo aiemmin täytynyt varautua sanoihin, 
joilta sanaluokka puuttuu. Asiasta täytyy kuitenkin mainita tulevien 
versioiden julkaisutiedoissa, ja luultavasti järkevintä on julkaista 
seuraavalla kerralla libvoikko ja suomi-malaga samana päivänä.

Harri


More information about the voikko mailing list