[voikko-devel] Unicode-asiaa
Harri Pitkänen
hatapitk at cc.jyu.fi
Sun Aug 13 16:25:39 EEST 2006
On Sunday 13 August 2006 09:29, Teemu Likonen wrote:
> Tärkeyden puolesta nämä Unicode-jutut ovat järjestyksessä:
>
> 1) Ortografisesti oikea heittomerkki U+2019 (tärkeä)
> 2) Ligatuurit (melko tärkeä)
> 3) Unicoden yhdysmerkki U+2010
> 4) Yhdistävät tarkkeet
>
> Kolmas ja neljäs kohta kuulunevat osastolle "täydellisyyden tavoittelu",
> koska käytännön merkitys jää olemattomaksi. Kaksi ensimmäistä sen
> sijaan koskettavat jokaista, joka kirjoittaa painokelpoista jälkeä.
Ei kai nyt sentään ihan jokaista? Kysyin tuossa äsken kahvipöydässä ihmiseltä,
joka on kirjoittanut ainakin omasta mielestään painokelpoista
sanomalehtitekstiä yli 20 vuotta, ja hän kyllä käyttää ihan reilusti
heittomerkkinä tuota yksinkertaista lainausmerkkiä ja kirjoittaa ligatuurit
erillisinä kirjaimina. Ammattimaisessa tekstintuotannossa nämä asiat jäävät
ilmeisesti ladontaohjelmiston huoleksi, eli ne korjataan ohjelmallisesti
vasta kauan sen jälkeen kun oikoluku on jo tehty. Itsekin muistelen, että
ainakin LaTeX luo ligatuurit automaattisesti.
Tietysti ne, jotka yrittävät saada aikaan painokelpoista jälkeä esimerkiksi
OpenOfficella, joutuvat temppuilemaan näiden asioiden kanssa käsipelillä ja
hyötyisivät tästä korjauksesta. Seuraavassa libvoikon versiossa näissä
kaikissa neljässä kohdassa mainittujen merkkien pitäisi ainakin tunnistua.
Korjausehdotukset ovat sitten vähän hankalampi asia ja tavutus kaikkein
vaikein. Itse asiassa ligatuureja ja tavutusta ei edes voi saada toimimaan
kunnolla yhteen nykyisen API:n kanssa, koska siinä ei ole mekanismia jolla
libvoikko voisi kertoa kutsuvalle ohjelmalle, että tavutus on tehtävä "merkin
sisällä" (eli rikkomalla ligatuuri erillisiksi kirjaimiksi ja laittamalla
tavuraja niiden väliin).
Harri
More information about the devel
mailing list