[voikko] Voikon morfologian siirto transduktoriksi
Flammie Pirinen
flammie at iki.fi
Thu May 3 03:51:54 EEST 2012
2012-04-25, Harri Pitkänen sanoi:
> Olen vihdoin aloittelemassa monta vuotta suunnitteilla ollutta
> projektia Voikon morfologisen kuvauksen siirtämisestä Malaga-muodosta
> transduktoriksi. Tämä on varsin työläs muutos, joten olen lykännyt sen
> aloittamista aika kauan (ensimmäisen kerran olen tätä vakavasti
> suunnitellut jo alkuvuodesta 2008).
>
> Arvelen, että siirto valmistuu vuoden 2013 aikana. Tämä on tosin aika
> lailla hihasta vedetty arvio. Koska teen tätä vapaa-ajallani kaiken
> muun ohella, en pysty sanomaan, kuinka paljon ehdin tähän keskimäärin
> kuukaudessa panostamaan, joten lopullinen aikataulu voi heittää
> paljonkin.
Tämä kuulostaa oikein lupaavalta ja minun kokemuksieni mukaan
tuollainen aikataulu on aika realistinen. Itsehän tein kanssa omorfin
HFST-versiot yms. sotkut vapaa-ajalla, sen alkuperäisen sfst-virityksen
jälkeen, ja jokainen uudelleenkirjoitus on jotakuinkin vienyt lähemmäs
vuoden aina :-)
> == Vaikutukset Voikon ja Sukijan kehittäjille ==
>
> Teknisesti ajatuksena on todellakin
> mahdollisimman suoraviivaisesti portata nykyisen
> suomimalaga/voikko-hakemiston sisältö uuteen formalismiin.
>
> [...]
>
> Kun VFST-morfologia on valmis korvaamaan Malaga-morfologian, täytyy
> tarvittavat työkalut (todennäköisesti HFST) paketoida mukaan
> jakeluihin.
Koska en ole vieläkään kunnolla tutustunut tuohon
suomi-malaga-kuvaukseen, kiinnostaisi sinänsä tietää suunnitelmista,
että mitä HFST-työkaluja tai ominaisuuksia siinä käytetään. Tai
lähinnä, tuleeko siihen kaksitasosääntöjä tai morfofonologiaa jollain
tavalla? Itse olen viime aikoina testaillut ideaa, että suomelle ei
ehkä tarvitse lainkaan erillisiä fonologiasääntöjä (twollia) edes
lexc-tyylin rakenteessa, ehkä tämä vastaa myös malaga-kuvausta jonkin
verran.
--
Flammie, computer scientist bachelor, linguist master, free software
Finnish localiser, and more! <http://www.iki.fi/flammie/>
More information about the voikko
mailing list