[hunspell-fi-devel] Suomi-malaga, sukija ja UTF-8

Harri Pitkänen hatapitk at cc.jyu.fi
Thu Apr 6 17:10:49 EEST 2006


On Thursday 06 April 2006 07:13, Hannu Väisänen wrote:
> Toisaalta, jos hyväksytään =mies=ilta, pitäisi hyväksyä myös =nais=ilta
> (inen-loppuinen nimisana + ilta). Noin minä olen sen korjannut...

No joo, tuolle asialle ei varmaan mahda mitään. =nais=ilta on aivan yhtä 
oikein kuin =naisilta. Nykyinen tavutusalgoritmi on sellainen, että se ei 
huomioi yhdyssanavaihtoehtoja jos sana on sanastossa myös yhtenä sanana, 
jolloin tämäkin tavuttuisi nai-sil-ta. Ongelmia tulee vain silloin, jos 
sanalle on olemassa vain pelkkiä yhdyssanamerkityksiä, jolloin tavurajoiksi 
valitaan varmuuden vuoksi leikkaus kaikista mahdollisista tavutuksista.

Tietysti jos halutaan viimeiseen asti välttää tavurajoja väärissä paikoissa, 
niin naisilta pitäisi tavuttaa naisil-ta. Aion vielä lisätä libvoikkoon 
mahdollisuuden valita, kuinka varovaisia tavutuksia se tarjoaa, mutta 
käytännössä tämä nykyinen malli jossa otetaan pieni riski näyttää toimivan 
aika hyvin.


Sain muuten tänään kuulla, että malaga ja libvoikko toimivat myös Windowsissa 
Cygwin-ympäristössä. Tämä on ihan mukava juttu, Hunspellin 
komentorivityökaluja ei koskaan saatu Windowsissa toimimaan. dll-kirjastojen 
ja Cygwinistä riippumattoman version luonti vain taitaa vaatia vähän enemmän 
työtä ja bugien korjailua.

Harri



More information about the devel mailing list