[voikko-devel] Taivutusluokka "karahka"

Harri Pitkänen hatapitk at cc.jyu.fi
Mon Oct 23 17:31:16 EEST 2006


On Monday 23 October 2006 07:34, Hannu Väisänen wrote:
> On Fri, Oct 20, 2006 at 03:09:39PM +0300, Harri Pitkänen wrote:
> > On Friday 20 October 2006 11:46, Teemu Likonen wrote:
> > > Hmm, en vielä onnistunut tulkitsemaan näkemystäsi tähän karahka-luokan
> > > sanojen läpikäyntiin ja mahdolliseen kulkija-luokkaan siirtämiseen.
> > > Häviääkö jotain Sukijan kannalta arvokasta tietoa, jos näin tekee?
> >
> > Tässä tapauksessa voit tehdä niin, että aina sanaa siirtäessäsi laitat
> > kenttään "Historiallinen taivutusluokka" arvon "karahka". Tällöin
> > informaatiota ei häviä.
>
> Mitä historiallinen taivutusluokka tekee? Jos se on taivutusluokka,
> jolla sanoja taivutetaan Suomi-malagassa, niin silloin "karahka" ei
> voi olla sellaisten sanojen taivutusluokka, jotka taipuvat Sukija-
> versiossa kuten karahka ja Voikko-versiossa kuten kulkija. Tällaisille
> sanoille taivutusluokka ei voi olla kulkijakaan, vaan niille pitää
> tehdä uusi taivutusluokka, jotta Suomi-malagassa osataan generoida eri
> taivutusmuodot tunnistava koodi Sukija- ja Voikko-versioille.

Jos historiallinen taivutusluokka 
on 'antautua', 'banaali', 'kirjoitella', 'kantaja' tai 'pasuuna', niin 
silloin se määrää luokan, jota käytetään Suomi-malagassa. Muussa tapauksessa 
siinä olevaa informaatiota ei toistaiseksi käytetä mihinkään.

Tämä nykyinen järjestely on vain väliaikainen, se oli pakko tehdä näin jotta 
muunnos Suomi-malagan ja Joukahaisen välillä saatiin toimimaan molempiin 
suuntiin. Nyt kun muunnosta Suomi-malagasta Joukahaiseen ei enää tarvita, voi 
tämänkin vähän, mitä historiallisilla taivutusluokilla nykyään tehdään, 
laittaa kokonaan uusiksi.

> Suomi-malagan karahaka-luokassa on luultavasti sanoja, joitten pitäisi
> vanhankin taivutuksen mukaan olla kulkija-luokassa. Tiedostojen
> indeksoinnissa on turvallisempaa erehtyä niin, että (harvinaisia)
> sijamuotoja tunnistetaan liikaa kuin liian vähän. (Asia taitaa olla
> oikoluvussa tasan päinvastoin. :-) On siis parempi, että karahkojen ja
> karahkoja -muodot tunnistetaan sellaisissa sanoissa, joihin ne eivät
> kuulu, kuin että ne jätetään tunnistamatta sanoissa, joihin ne
> kuuluvat.

Olisiko siis mitään haittaa siitä, jos Sukija-versiossa kaikille karahka- ja 
kulkija-luokan sanoille hyväksyttäisiin nuo harvinaiset sijamuodot?

Harri



More information about the devel mailing list