[hunspell-fi-devel] vierasperäisten sanojen tavutus
Harri Pitkänen
hatapitk at cc.jyu.fi
Tue Aug 1 09:53:50 EEST 2006
On Tuesday 01 August 2006 08:49, Teemu Likonen wrote:
> Voikko tavuttaa jotkut grafia-sanan sisältävät vierasperäiset yhdyssanat
> väärin:
>
> fe-no-me-nog-ra-fi-a
> ty-pog-ra-fi-a
> ko-re-og-ra-fi-a
> li-tog-ra-fi-a
> myog-ra-fi-a
>
> Kuitenkin esimerkiksi "ortografia" menee oikein (or-to-gra-fi-a), mutta
> sitä ei pikaisen vilkaisun perusteella olekaan sanastossa sellaisenaan
> vaan se nähdään yhdyssanana.
Tällaisiin yhdyssanoihin pitää sanajaon paikat laittaa erikseen käsin.
Suomi-malagasta Joukahaiseen tämä informaatio ei siirry automaattisesti, ja
siksi en ole kesän aikana ollenkaan vaivautunut näitä korjailemaan.
Joukahaisessa tämä esitetään hiukan eri tavalla, eli lisäämällä sanan
kirjoitusasuun yksi tai kaksi pystyviivaa sen mukaan miten selkeästä
päätteestä on kyse: "fenomeno||grafia", "per|spektiivi". Yhden pystyviivan
tapauksessa tavutus voidaan tehdä kummalla tavalla vaan, eli "per-spektiivi"
tai "pers-pektiivi" (tämä informaatio on peräisin Pirkko Leinon "Hyvää
suomea" -opuksesta).
Näin pitää tehdä myös sellaisille sanoille, joissa päätteiden vokaalityypin
tunnistus menisi automaattisella algoritmilla väärin, koska yhdyssanan
alkuosassa on a-, o- ja u-vokaaleja, mutta jälkiosassa vain e- ja i-vokaaleja
(esim. "maan|tie" jos tämä sana olisi jostain syystä pitänyt sanastoon
laittaa). Tällaiset tapaukset ovat kuitenkin nykyisessä Suomi-malagassa
pääsääntöisesti oikein, ongelmia on vain paikoitellen tuon tavutuksen kanssa
siihen asti kunnes Joukahaisesta otettu versio sanastosta saadaan käyttöön.
Harri
More information about the devel
mailing list