[voikko-devel] Monikolliset perusmuodot
Harri Pitkänen
hatapitk at cc.jyu.fi
Tue Dec 19 20:48:37 EET 2006
On Tuesday 19 December 2006 15:19, Teemu Likonen wrote:
> Suomi-Malagan poikkeavat.lex-tiedostossa on joitakin taivutusluokan
> <risti> sanoja (eli Joukahaiseen periaatteessa sopivia) ilmeisesti
> siksi, että Joukahaisessa on puute perusmuodoltaan monikolta näyttävien
> sanojen käsittelyssä, esimerkiksi Andit, Filippiinit ja Malediivit.
> Käytännössä kuitenkin myös yksikkömuotoiset taivutukset tunnistetaan:
> Andi, Filippiini, Malediivi.
>
> Olisiko nykyjärjestelyllä parempi laittaa Joukahaiseen em. yksikössä
> olevat perusmuodot ja lisätä lippu "ei yksikkömuotoja"? (Vaikka kyseinen
> lippu ei ilmeiseti vielä teekään mitään.) On kyllä vähän ikävää laittaa
> erisnimestä väärää muotoa sanatietueeksi.
>
> Jospa jossain tulevassa Joukaisen versiossa voisi hakusanoina käyttää
> myös monikon nominatiivia, mikäli sanalla on lippu "ei yksikkömuotoja".
> Ja jospa taivutustiedoissa ei tällöin näkyisi yksikkömuotoja
> lainkaan. :)
Hakeminen muun kuin tietokantaan tallennetun muodon perusteella on käytännössä
hirvittävän vaikea toteuttaa tehokkaasti. Parempi vain tallentaa nämä sanat
siinä kuvitteellisessa yksikkömuodossaan, tai säilyttää poikkeavina sanoina.
Onhan tuolla sanastossa jo nyt paljon "sanoja", jotka eivät ole mitään
todellisia sanoa. Sitten kun siirrämme etuliitteet Joukahaiseen, niitä on
vielä paljon enemmän.
Sen sijaan yksikkömuotojen poistaminen taivutustiedoista on täysin mahdollista
tehdä. Täytyykin tämä tehdä jossain vaiheessa.
> Tiedostossa poikkeavat.lex on myös nimi Stallman luokassa <risti>. Eikö
> se sopisi Joukahaiseen <kalsium>-luokkaan? Kotuksen luokka kyllä on
> 5 (risti).
Katsoin noita taivutuksia, enkä kyllä osaa sanoa kumpi on parempi.
Harri
More information about the devel
mailing list