[voikko] Joukahaisen luokat Kotus-luokiksi

Flammie Pirinen flammie at iki.fi
Thu Jan 17 17:31:55 EET 2008


2008-01-15, Harri Pitkänen sanoi:

> Omorfia varten seuraava Python-esimerkki siitä, kuinka nämä
> Joukahaisen luokat saa muunnettua Kotus-luokiksi astevaihteluineen:
> 
> =====
> 
> import voikkoinfl
> sana = "matto"
> tluokka = "valo"
> avluokka = "av1"
> 
> nominityypit = voikkoinfl.readInflectionTypes("subst.aff")
> for nominityyppi in nominityypit:
>     if tluokka in nominityyppi.joukahainenClasses:
>         print "Kotus-sanaluokka", nominityyppi.kotusClasses
>         print "Kotus-avluokka", nominityyppi.kotusGradClass(sana,
> avluokka)
> 
> ====
> 
> Tämä esimerkki tulostaa
> 
>   Kotus-sanaluokka [u'1']
>   Kotus-avluokka C

Kopioin tuosta ja generate_lex.pystä liitteen (toivottavasti tulee
läpi) mukaisen version, joka tekee >20000 tietuetta. 

> Kotus-sanaluokat ovat listana siksi, että joissakin tapauksissa
> Joukahaisen luokituksessa kaksi Kotuksen luokkaa on yhdistetty.
> Yhdistetty on Kotuksen luokat 2 ja 4 (nämä voidaan kuitenkin erottaa
> toisistaan sanan päätteen mukaan), luokka 13 ja osa luokasta 14,
> luokat 24 ja 26 sekä luokat 29 ja 30.

Luokissa on jonkin verran joo todella helposti kirjotusasultaan
erotettavia luokkia, kuten 4 ja 14 joilla on monikon inessiivin
tunnus mahdollista liittää heikkoon ja vahvaan asteeseen mikä vaatii
sanalta vähintään kolmea tavua joista viimeinen on kkA (harvoin ttA
tai ppA). 24:ää ja 26:tta kysyinkin sanakirjan tekijöiltä, luokissa ei
ole muuta kuin kahden pääteallomorfin keskinäisellä järjestyksellä
eroa. 29 ja 30 taas ovat selvästi samat myös.

-- 
Flammie, computer scientist-linguist B.Sc., Gentoo translator, and a 
freak. <http://www.iki.fi/flammie/>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: generate_omorfi.py
Type: text/x-python
Size: 3550 bytes
Desc: not available
URL: <http://lists.puimula.org/pipermail/voikko/attachments/20080117/758be3fd/attachment.py>


More information about the voikko mailing list