[hunspell-fi-devel] tmispell-voikko ja emacs

Ilja Sidoroff ilja.sidoroff at iki.fi
Thu Jul 27 16:55:43 EEST 2006


>> Kun yritän käyttää emacsin (21.4.1) tavutustoimintoa, ispell
                                      ^^^^^^^^^^^^^^^^
>Tarkoitat tässä varmaan oikolukua? Tavutusta ispell (tai ainakaan tmispell) ei
>tue.

Juurikin tietysti näin.

>Itse sain tämän kyllä toimimaan. Hannu on luultavasti oikeassa, kyseessä on
>jokin merkistöjuttu. En ole Emacsin käyttäjä joten tätä testiä varten kopioin
>ja liitin hiukan muutettuna Googlen avulla löytämiäni
>asetustiedostoesimerkkejä, ja homma toimi seuraavalla .emacs -tiedoston
>sisällöllä:
>...
                   "[']" t ("-C" "-d" "suomi") "~utf-8" utf-8))
>...

Tästä olikin juuri kysymys, ja tuo ylläoleva utf-8 oli ratkaiseva
tekijä. Emacs oli jo muuten säädetty käyttämään utf-8:aa, mutta
näköjään myös se pitää sanoa myös oikoluvulle. Kiitos paljon avusta!

>> jota ei tunnistettu ei aina näy oikein, vaan sen lihavoitu versio
>> näkyy yhden tai useamman merkin myöhemmin kuin pitäisi (käytössä GNOME
>> Terminal 2.14.2 eikä mitään säätöjä), esimerkkitekstissä tämä ilmenee
>> ensiksi minulla sanan Gloria toisen ilmentymän kohdalla.

>Tämän bugin sain toistetuksi. Varmaankin ongelma UTF-8 -koodatun datan
>käsittelyssä. Tuolla virheellisellä Gloria-rivillä on yksi ä-kirjain rivin
>alkuosassa, jolloin jos ohjelmoija on olettanut, että "merkin paikka rivillä"
>== "merkin etäisyys tavuissa puskurin alusta" niin tulee juuri tuo yhden
>merkin siirtymä eteen päin koska skandimerkit vievät kaksi tavua tilaa
>UTF-8:ssa. Hyvä kun huomasit tämän. Korjaan sen jossain vaiheessa mutta en
>ihan heti, koska en ole vielä lainkaan tutustunut tämän interaktiivisen
>käyttöliittymän lähdekoodiin.

Näin tosiaan on, väärä korostus riippuu siitä, miten monta ääkköstä
ennen korostettavaa sanaa on. Yritin katsella vähän koodia ja etsiä
vikaa, mutta en äkkiä sitä löytänyt. Epäilen, että vika on filter.cc
-tiedostossa, jossain PlainFilter::skip_over_jotain -metodissa, mutta
ne näyttäisivät käyttävän Glib::ustring-iteraattoria, jonka kai
pitäisi osata hanskata utf-8.


Ilja Sidoroff



More information about the devel mailing list