[hunspell-fi-devel] vierasperäisten sanojen tavutus

Harri Pitkänen hatapitk at cc.jyu.fi
Tue Aug 1 09:53:50 EEST 2006


On Tuesday 01 August 2006 08:49, Teemu Likonen wrote:
> Voikko tavuttaa jotkut grafia-sanan sisältävät vierasperäiset yhdyssanat
> väärin:
>
> fe-no-me-nog-ra-fi-a
> ty-pog-ra-fi-a
> ko-re-og-ra-fi-a
> li-tog-ra-fi-a
> myog-ra-fi-a
>
> Kuitenkin esimerkiksi "ortografia" menee oikein (or-to-gra-fi-a), mutta
> sitä ei pikaisen vilkaisun perusteella olekaan sanastossa sellaisenaan
> vaan se nähdään yhdyssanana.

Tällaisiin yhdyssanoihin pitää sanajaon paikat laittaa erikseen käsin. 
Suomi-malagasta Joukahaiseen tämä informaatio ei siirry automaattisesti, ja 
siksi en ole kesän aikana ollenkaan vaivautunut näitä korjailemaan. 
Joukahaisessa tämä esitetään hiukan eri tavalla, eli lisäämällä sanan 
kirjoitusasuun yksi tai kaksi pystyviivaa sen mukaan miten selkeästä 
päätteestä on kyse: "fenomeno||grafia", "per|spektiivi". Yhden pystyviivan 
tapauksessa tavutus voidaan tehdä kummalla tavalla vaan, eli "per-spektiivi" 
tai "pers-pektiivi" (tämä informaatio on peräisin Pirkko Leinon "Hyvää 
suomea" -opuksesta).

Näin pitää tehdä myös sellaisille sanoille, joissa päätteiden vokaalityypin 
tunnistus menisi automaattisella algoritmilla väärin, koska yhdyssanan 
alkuosassa on a-, o- ja u-vokaaleja, mutta jälkiosassa vain e- ja i-vokaaleja 
(esim. "maan|tie" jos tämä sana olisi jostain syystä pitänyt sanastoon 
laittaa). Tällaiset tapaukset ovat kuitenkin nykyisessä Suomi-malagassa 
pääsääntöisesti oikein, ongelmia on vain paikoitellen tuon tavutuksen kanssa 
siihen asti kunnes Joukahaisesta otettu versio sanastosta saadaan käyttöön.

Harri



More information about the devel mailing list