[voikko-devel] Unicode-asiaa

Harri Pitkänen hatapitk at cc.jyu.fi
Sun Aug 13 16:25:39 EEST 2006


On Sunday 13 August 2006 09:29, Teemu Likonen wrote:
> Tärkeyden puolesta nämä Unicode-jutut ovat järjestyksessä:
>
> 1) Ortografisesti oikea heittomerkki U+2019 (tärkeä)
> 2) Ligatuurit (melko tärkeä)
> 3) Unicoden yhdysmerkki U+2010
> 4) Yhdistävät tarkkeet
>
> Kolmas ja neljäs kohta kuulunevat osastolle "täydellisyyden tavoittelu",
> koska käytännön merkitys jää olemattomaksi. Kaksi ensimmäistä sen
> sijaan koskettavat jokaista, joka kirjoittaa painokelpoista jälkeä.

Ei kai nyt sentään ihan jokaista? Kysyin tuossa äsken kahvipöydässä ihmiseltä, 
joka on kirjoittanut ainakin omasta mielestään painokelpoista 
sanomalehtitekstiä yli 20 vuotta, ja hän kyllä käyttää ihan reilusti 
heittomerkkinä tuota yksinkertaista lainausmerkkiä ja kirjoittaa ligatuurit 
erillisinä kirjaimina. Ammattimaisessa tekstintuotannossa nämä asiat jäävät 
ilmeisesti ladontaohjelmiston huoleksi, eli ne korjataan ohjelmallisesti 
vasta kauan sen jälkeen kun oikoluku on jo tehty. Itsekin muistelen, että 
ainakin LaTeX luo ligatuurit automaattisesti.

Tietysti ne, jotka yrittävät saada aikaan painokelpoista jälkeä esimerkiksi 
OpenOfficella, joutuvat temppuilemaan näiden asioiden kanssa käsipelillä ja 
hyötyisivät tästä korjauksesta. Seuraavassa libvoikon versiossa näissä 
kaikissa neljässä kohdassa mainittujen merkkien pitäisi ainakin tunnistua. 
Korjausehdotukset ovat sitten vähän hankalampi asia ja tavutus kaikkein 
vaikein. Itse asiassa ligatuureja ja tavutusta ei edes voi saada toimimaan 
kunnolla yhteen nykyisen API:n kanssa, koska siinä ei ole mekanismia jolla 
libvoikko voisi kertoa kutsuvalle ohjelmalle, että tavutus on tehtävä "merkin 
sisällä" (eli rikkomalla ligatuuri erillisiksi kirjaimiksi ja laittamalla 
tavuraja niiden väliin).

Harri



More information about the devel mailing list