[voikko-devel] Sanojen taivutus Sukija- ja Voikko-versioissa, muutosehdotus

Hannu Väisänen hvaisane at joyx.joensuu.fi
Mon Dec 4 07:52:25 EET 2006


On Fri, Dec 01, 2006 at 05:17:49PM +0200, Harri Pitkänen wrote:
> On Friday 01 December 2006 08:13, Hannu Väisänen wrote:
> > Parempi ratkaisu voisi olla se, että jos sanat taipuvat eri tavalla
> > Suomi-malagan eri versioissa, niille generoidaan kaksi eri taivutusta:
> >
> > [perusmuoto: "abortti", alku: "abort", luokka: nimisana,
> >  jatko_sukija: <salaatti>, jatko_voikko: <tatti>, äs: a];
> > Eri taivutustyyppien alku-kenttä voi olla erilainen, mutta silloin
> > pitää vain generoida kentät alku_sukija ja alku_voikko.
> 
> Oikein hyvä ajatus.

Selvä. Teen versioon 0.9.4 malliksi abortti- ja matami-sanat, jotka
taipuvat Nykysuomen sanakirjassa kuten paperi ja Suomen kielen
perussanakirjassa kuten risti. Yritän saada version 0.9.4 valmiiksi
ennen joulua.

Tämän jälkeen siis historiallisesta taivutuksesta generoidaan kenttä
jatko_sukija ja nykyisestä taivutuksesta kenttä jatko_voikko, mutta
jos historiallista taivutusta ei ole, generoidaan vain jatko-kenttä.
Noinko se menee?


> Tarvitseeko alku-kentän oikeastaan koskaan olla erilainen? 
> Eikö ole mahdollista aina käyttää niistä lyhyempää?

Jos nykyisen taivutuskaavan X alku-kenttä on "abcd", mutta
Voikko-taivutuksen alku-kentäksi tulee "abc", ensin pitää tarkistaa,
että kaikkien X-tyypin sanojen alku-kenttänä voi olla "abc", ja sen
jälkeen pitää ruveta miettimään, miten Sukija-taivutukselle kerrotaan,
että "c":n jälkeen tulee vielä "d" ennen kuin sanaa voi ruveta
taivuttamaan X-tyypin mukaan.

Yksi mahdollisuus on tietysti muuttaa taivutuskaavojen esimerkkisanoja

Ennen:   abcd+xx+yyy
Jälkeen: abc+dxx+yyy

mutta luultavasti astevaihtelun takia taivutuskaavoja joutuu
muuttamaan useampia kuin yhden. Mitä enemmän niitä joutuu muuttamaan,
sitä enemmän on mahdollisuuksia tehdä virheitä.

Näyttää siltä, että on yksinkertaisempaa vain generoida eri
alku-kentät alku_sukija ja alku_voikko.



More information about the devel mailing list