[voikko-devel] Monikolliset perusmuodot

Harri Pitkänen hatapitk at cc.jyu.fi
Tue Dec 19 20:48:37 EET 2006


On Tuesday 19 December 2006 15:19, Teemu Likonen wrote:
> Suomi-Malagan poikkeavat.lex-tiedostossa on joitakin taivutusluokan
> <risti> sanoja (eli Joukahaiseen periaatteessa sopivia) ilmeisesti
> siksi, että Joukahaisessa on puute perusmuodoltaan monikolta näyttävien
> sanojen käsittelyssä, esimerkiksi Andit, Filippiinit ja Malediivit.
> Käytännössä kuitenkin myös yksikkömuotoiset taivutukset tunnistetaan:
> Andi, Filippiini, Malediivi.
>
> Olisiko nykyjärjestelyllä parempi laittaa Joukahaiseen em. yksikössä
> olevat perusmuodot ja lisätä lippu "ei yksikkömuotoja"? (Vaikka kyseinen
> lippu ei ilmeiseti vielä teekään mitään.) On kyllä vähän ikävää laittaa
> erisnimestä väärää muotoa sanatietueeksi.
>
> Jospa jossain tulevassa Joukaisen versiossa voisi hakusanoina käyttää
> myös monikon nominatiivia, mikäli sanalla on lippu "ei yksikkömuotoja".
> Ja jospa taivutustiedoissa ei tällöin näkyisi yksikkömuotoja
> lainkaan. :)

Hakeminen muun kuin tietokantaan tallennetun muodon perusteella on käytännössä 
hirvittävän vaikea toteuttaa tehokkaasti. Parempi vain tallentaa nämä sanat 
siinä kuvitteellisessa yksikkömuodossaan, tai säilyttää poikkeavina sanoina. 
Onhan tuolla sanastossa jo nyt paljon "sanoja", jotka eivät ole mitään 
todellisia sanoa. Sitten kun siirrämme etuliitteet Joukahaiseen, niitä on 
vielä paljon enemmän.

Sen sijaan yksikkömuotojen poistaminen taivutustiedoista on täysin mahdollista 
tehdä. Täytyykin tämä tehdä jossain vaiheessa.

> Tiedostossa poikkeavat.lex on myös nimi Stallman luokassa <risti>. Eikö
> se sopisi Joukahaiseen <kalsium>-luokkaan? Kotuksen luokka kyllä on
> 5 (risti).

Katsoin noita taivutuksia, enkä kyllä osaa sanoa kumpi on parempi.

Harri



More information about the devel mailing list