[voikko] VFST-morfologian käännösaikaista validointia tiukennettu

Harri Pitkänen hatapitk at iki.fi
Sun Feb 7 14:31:24 EET 2016


Lisäsin versiossa c73dd95fb6723c85610492e21433bbd68494ae27 Makefileen 
komennon, joka varmistaa, että korvattavia symboleja (siis [[L]] ja muut 
vastaavat) ei voi enää päätyä lopulliseen transduktoriin. Aiemmin tätä on 
vahingossa päässyt tapahtumaan useassakin kohdassa. Näiden virheiden 
vaikutukset ovat kuitenkin olleet hyvin vähäisiä tai olemattomia, joten ne 
ovat useimmiten jääneet huomaamatta.

Tuleviin libvoikon versioihin tulee kuitenkin optimointiin liittyviä 
muutoksia, joiden johdosta tällaiset virheet voivat aiheuttaa entistä useammin 
ongelmia. Siksi on hyvä varmistaa teknisesti, ettei niitä voi enää tapahtua.

Korjasin koodista kaikki Voikkoa koskevat tämänkaltaiset ongelmat. Epäilen, 
että Sukijaa varten kirjoitetussa koodissa näitä voi kuitenkin löytyä muutama 
lisää. Mikäli VFST-morfologian kääntäminen Sukijaa varten ei enää mene läpi, 
syy on todennäköisesti tässä. Tällöin virheilmoitusta ennen tulee listaus 
"kielletyistä" riveistä AT&T-muotoisesta transduktorista (all.att). Tätä voi 
käyttää apuna ongelman selvittelyssä. Seuraamalla tilasiirtymiä taaksepäin 
kielletystä symbolista voi yleensä helposti nähdä edeltävän symbolijonon. 
Virhe syntyy, mikäli korvattavan symbolin ja sitä edeltävän vokaalimerkin 
väliin on jäänyt jotain muuta, ja korjaus on järjestellä symbolit oikeaan 
järjestykseen siten, että vokaali on viimeisenä. Joissakin tapauksissa taas 
kyse on siitä, että korvaussäännöistä puuttuu jokin eksoottisempi 
vokaalimerkki.

Harri


More information about the voikko mailing list