[voikko-devel] Diakriittisiä ongelmia

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Aug 16 14:10:42 EEST 2006


On Wednesday 16 August 2006 13:40, Teemu Likonen wrote:
> Jatkan tarkkeiden viilausta...
>
> Huomasin ehdotuksista myös seuraavan ongelman tai lähinnä ominaisuuden:
> Jos sanassa on esimerkiksi kaksi š:ää, niin ehdotuksissa ei molempia
> osata korvata. Siis tähän tapaan:
>
> tsetsenialainen
> W: tsetsenialainen
>
> tšetsenialainen
> W: tšetsenialainen
> S: tšetšenialainen
>
> tsetšenialainen
> W: tsetšenialainen
> S: tšetšenialainen
>
> Yhden š:n virheelle siis löytyy ehdotus. Huomasin kyllä, että yleensäkin
> kahden (saman) kirjaimen muuttaminen toiseksi missä tahansa tilanteessa
> ei tuota oikeaa ehdotusta - eikä mielestäni tarvitsekaan. Voisi
> kuitenkin ajatella, että tarkkeen jättäminen pois on paljon yleisempi
> moka (tai joskus valinta) kuin vaikka kitara-sanan kirjoittaminen
> muodossa *kitoro.
>
> Sanastossa ei ole kuin pari sanaa, joissa on kaksi š:ää: "Tšetšenia",
> jonka juuri lisäsin, sekä "tšetšenialainen". Niitä tosin saatetaan
> käyttää ihan kohtalaisesti. Lisäksi taitaa olla vain "bébé", joka
> käyttäytyy samalla tavalla, eli *bebe-muodolle ei tule ehdotuksia,
> mutta *bebé- ja *bébe-muodoille kyllä. Kyse ei siis ole alkuunkaan
> vakavasta ongelmasta.

Näitä ei tosiaan voi ruveta korjaamaan, koska prosessoriaika ei yleisesti 
ottaen siihen riitä. Ainoa poikkeus on toisiaan vastaavien etu- ja 
takavokaalien vaihto, koska jos sattuu laittamaan sanalle väärän tyyppisiä 
vokaaleja sisältävän taivutuspäätteen, niin siinä menee usein kerralla monta 
vokaalia väärin.

Taidan jättää tuo ü -kirjaimen myös pois. Niitä ei näytä olevan sanastossa 
kuin kahdeksassa sanassa, ja niistäkin suuri osa on melko harvinaisia nimiä. 
u->ü -muunnos maksaisi yhden Malaga-kutsun jokaista sanan u-kirjainta kohden, 
ja meillä on varaa vain noin 300 kutsuun ehdotuksia etsittäessä. Ja tässä 
tapauksessa tarvittaisiin varmaan yhtä lailla myös y->ü -muunnos, senkin 
luulisi olevan lähes yhtä todennäköinen.

Harri



More information about the devel mailing list