[voikko-devel] Taivutusluokka "karahka"

Hannu Väisänen hvaisane at joyx.joensuu.fi
Mon Oct 23 07:34:18 EEST 2006


On Fri, Oct 20, 2006 at 03:09:39PM +0300, Harri Pitkänen wrote:
> On Friday 20 October 2006 11:46, Teemu Likonen wrote:
> > Hmm, en vielä onnistunut tulkitsemaan näkemystäsi tähän karahka-luokan
> > sanojen läpikäyntiin ja mahdolliseen kulkija-luokkaan siirtämiseen.
> > Häviääkö jotain Sukijan kannalta arvokasta tietoa, jos näin tekee?
> 
> Tässä tapauksessa voit tehdä niin, että aina sanaa siirtäessäsi laitat 
> kenttään "Historiallinen taivutusluokka" arvon "karahka". Tällöin 
> informaatiota ei häviä.

Mitä historiallinen taivutusluokka tekee? Jos se on taivutusluokka,
jolla sanoja taivutetaan Suomi-malagassa, niin silloin "karahka" ei
voi olla sellaisten sanojen taivutusluokka, jotka taipuvat Sukija-
versiossa kuten karahka ja Voikko-versiossa kuten kulkija. Tällaisille
sanoille taivutusluokka ei voi olla kulkijakaan, vaan niille pitää
tehdä uusi taivutusluokka, jotta Suomi-malagassa osataan generoida eri
taivutusmuodot tunnistava koodi Sukija- ja Voikko-versioille.

Suomi-malagan karahaka-luokassa on luultavasti sanoja, joitten pitäisi
vanhankin taivutuksen mukaan olla kulkija-luokassa. Tiedostojen
indeksoinnissa on turvallisempaa erehtyä niin, että (harvinaisia)
sijamuotoja tunnistetaan liikaa kuin liian vähän. (Asia taitaa olla
oikoluvussa tasan päinvastoin. :-) On siis parempi, että karahkojen ja
karahkoja -muodot tunnistetaan sellaisissa sanoissa, joihin ne eivät
kuulu, kuin että ne jätetään tunnistamatta sanoissa, joihin ne
kuuluvat.

En ole jaksanut tarkistaa kaikkien sanojen taivutuksia sanakirjasta,
vaan olen luokitellut niitä kielikorvani mukaan, ja epävarmat
kulkija/karahka-tapaukset olen pannut karahka-luokkaan.



More information about the devel mailing list