[hunspell-fi-devel] Suomi-malaga, sukija ja UTF-8
Harri Pitkänen
hatapitk at cc.jyu.fi
Thu Apr 6 17:10:49 EEST 2006
On Thursday 06 April 2006 07:13, Hannu Väisänen wrote:
> Toisaalta, jos hyväksytään =mies=ilta, pitäisi hyväksyä myös =nais=ilta
> (inen-loppuinen nimisana + ilta). Noin minä olen sen korjannut...
No joo, tuolle asialle ei varmaan mahda mitään. =nais=ilta on aivan yhtä
oikein kuin =naisilta. Nykyinen tavutusalgoritmi on sellainen, että se ei
huomioi yhdyssanavaihtoehtoja jos sana on sanastossa myös yhtenä sanana,
jolloin tämäkin tavuttuisi nai-sil-ta. Ongelmia tulee vain silloin, jos
sanalle on olemassa vain pelkkiä yhdyssanamerkityksiä, jolloin tavurajoiksi
valitaan varmuuden vuoksi leikkaus kaikista mahdollisista tavutuksista.
Tietysti jos halutaan viimeiseen asti välttää tavurajoja väärissä paikoissa,
niin naisilta pitäisi tavuttaa naisil-ta. Aion vielä lisätä libvoikkoon
mahdollisuuden valita, kuinka varovaisia tavutuksia se tarjoaa, mutta
käytännössä tämä nykyinen malli jossa otetaan pieni riski näyttää toimivan
aika hyvin.
Sain muuten tänään kuulla, että malaga ja libvoikko toimivat myös Windowsissa
Cygwin-ympäristössä. Tämä on ihan mukava juttu, Hunspellin
komentorivityökaluja ei koskaan saatu Windowsissa toimimaan. dll-kirjastojen
ja Cygwinistä riippumattoman version luonti vain taitaa vaatia vähän enemmän
työtä ja bugien korjailua.
Harri
More information about the devel
mailing list