[voikko] Uusia lukutapoja morfologiseen analyysiin

Harri Pitkänen hatapitk at iki.fi
Wed Apr 20 19:05:31 EEST 2011


On Wednesday 20 April 2011, Jukka K. Korpela wrote:
> Juho Heinonen wrote:
> > Karlssonin CG-säännöstössä on sellaisia lukutapoja, joita Voikon
> > morfologinen analyysi ei tuota.
> > Esimerkiksi sananmuoto "ajoissa" voidaan disambiguoida adverbiksi ja
> > "voi" interjektioksi. Olisiko mielekästä lisätä nämä lukutavat?
> 
> Interjektiovaihtoehdot ovat varmaankin huomionarvoisia, mutta sellaisten
> sanojen kuin "ajoissa" tunnistaminen adverbeiksi ei tunnu tarpeelliselta.
> Sehän on morfologisesti aika-sanan monikon inessiivi ja semanttisestikin
> vain sellaisen muodon hiukan erikoistunutta käyttöä.

Riippuu toki sovelluksesta, onko tämän huomioiminen oleellista. Vaikkapa 
käännettäessä lauseita "Olin ajoissa paikalla" ja "Hiihtäjien ajoissa on 
parantamisen varaa" muille kielille on tärkeää osata päätellä, onko "ajoissa" 
adverbi vai nominin "aika" monikon inessiivi. Tätä Karlssonin säännöissä 
käsittääkseni yritetään tehdä, eikä se onnistu, ellei morfologisesta 
analyysistä saada ulos molempia vaihtoehtoja. (Tai oikeammin sieltä pitäisi 
tulla kolme vaihtoehtoa, ja nyt Voikko tuottaa vain kaksi.)

> Jos
> paikallissijaisille nomininmuodoille ruvetaan tuottamaan
> jäsennysvaihtoehtoja, joissa ne ovat adverbeja, syntyy varmaankin aika
> paljon tulkinnanvaraisuuksia - kysehän pikemminkin ambiguoinnista kuin
> disambiguoinnista. :-)

Määrällisesti näitä adverbeja ei toivottavasti tarvitse kovin paljon lisätä. 
Kotus-sanalistalla näyttää olevan 124 issA-päätteistä adverbia, Voikon 
sanastossa puolestaan 99 kappaletta. "Ajoissa" on mukana Kotuksen listalla 
mutta ei Voikon sanastossa. Tästä voi karkeasti arvioida, että noin 25 sanan 
lisääminen Voikon sanastoon riittäisi tämän kyseisen sijapäätteen osalta 
varsin pitkälle. Samalla periaatteella pitäisi tarkistaa myös yksikön 
inessiivi sekä muut paikallissijat. En pitäisi suurena ongelmana, jos tämän 
johdosta joutuisin lisäämään sanastoon vaikkapa sata uutta sanaa.

HarriMore information about the voikko mailing list