[voikko-devel] Tavutuksen testausta
Harri Pitkänen
hatapitk at cc.jyu.fi
Thu May 10 11:08:45 EEST 2007
On Wednesday 09 May 2007, Teemu Likonen wrote:
> Yhtä asiaa lukuun ottamatta tavutus mielestäni toimii niin kuin on
> tarkoitus. Ongelmana ovat ligatuurit ja ongelma on - nyt vasta
> huomasin - myös vanhemmissa versioissa. Tavutuksessa huomioidaan
> esimerkiksi kirjoitusasu "fenomeno=grafia" mutta vain silloin, kun ei
> ole käytetty ligatuureja. Jos sanaan laitetaan fi-ligatuuri, sana
> tavutetaan sääntöpohjaisesti, ja siten myös tilanne "fenomenog-rafia"
> on mahdollinen.
>
> Ongelman voi todentaa vaikka voikkohyphenate-ohjelmalla, mutta
> käytännössä ikävä se on OOo:ssa todellista tekstiä käsiteltäessä.
> Ligatuureja saatetaan lisätä tekstiin jälkikäteen etsi ja
> korvaa -toiminnolla. Sen aiheuttamat tavutusvirheet jäävät helposti
> huomaamatta.
Tämä on tosiaan vanha ongelma. Sanoisin, että toistaiseksi on parasta laittaa
manuaalisesti tavutusvihjeet sanoihin, joissa käytetään ligatuureja. Tämän
voisi jossain dokumentoidakin, vaikka tuossa meidän "Kielityökalut
OpenOffice.org-ohjelmistossa"-ohjeessa. Pieniä parannuksia nykyiseen olisi
toki mahdollista tehdä openoffice.org-voikossa, mutta koska kokonaan tätä
ongelmaa ei ole mahdollista korjata, taidan edelleen jättää tämän
myöhemmäksi. Ligatuureja sisältävien sanojen tavutushan ei ole OpenOfficessa
toiminut koskaan oikein, joten kiirettä tällä ei ole.
> Varmistettakoon vielä, että kuuluuko lyhenteiden päätteet ja liitteet
> jättää tavuttamatta? Mielestäni ne voi nykyiseen tapaan jättää
> tavuttamatta mutta järkevissä rajoissa oleva katkaisukohta olisi
> sijapäätteen ja liitteen välistä, esimerkiksi "USA:ssa-kaan". Missään
> nimessä ei kannata katkaista sijapäätettä ("USA:s-sa").
Päätteet on ollut tapana tavuttaa, joten nykyinen käyttäytyminen ei ole
varsinaisesti bugi. Mutta yhden kirjaimen jättäminen päätteen jälkeen näyttää
tosiaan aika pahalta. Koska sama korjaus tehtiin jo libvoikkoon heittomerkin
tapauksessa, voin tämän korjata myös kaksoispisteelle vielä tänään. Libvoikko
1.4.1rc2 on saatavilla viimeistään illalla. Tämähän ei siis välttämättä riitä
estämään tavutusta kaikissa sijapäätteissä, mutta tavallisimmissa kyllä.
> * * *
>
> Sitten pientä kitinää vanhasta ja tunnetusta mutta ehkä vähitellen
> entistä ajankohtaisemmaksi muuttuvasta asiasta. Ilmeisesti libvoikon
> tekemän merkistön normalisoinnin vuoksi
> (libvoikko/src/voikko_charset.c) Unicoden heittomerkki U+2019 muuttuu
> korjausehdotuksissa aina Ascii-heittomerkiksi. Normalisointi
> libvoikossa kuuluu asiaan, mutta OOo+ooo-voikossa sillä on ikäviä
> vaikutuksia.
>
> Tekstinkäsittelyohjelmat usein muuttavat näppäimistöltä tuotettavan
> heittomerkin suomen kielen oikeinkirjoituksen mukaiseksi heittomerkiksi
> U+2019:ksi, mutta virheellisen sanan korjausehdotuksissa se palautuu
> Ascii-heittomerkiksi. Merkin joutuu sitten käsin muuttamaan, mikä on
> vähän ikävää. Minulla on hämärä muistikuva, että jokin OOo 2.0.4:ää
> vanhempi versio olisi korjannut sen jälleen Unicoden heittomerkiksi.
> Saatan muistaa väärinkin.
En muista, mitä vanhat versiot tekivät. Tästä kyllä keskusteltiin jo viime
kesänä, joten vastaus saattaa löytyä postituslistojen arkistosta. Jos ehdin,
voin korjata tämän openoffice.org-voikon versioon 2.1, mutta versioon 2.0.1
muutos olisi liian suuri.
> Sama koskee toki muitakin merkkejä. Jatkossa esimerkiksi Unicoden
> yhdysmerkki ja sitova yhdysmerkki sekä ligatuurit voisi olla fiksua
> palauttaa korjausehdotuksissa samoina OOo:lle, jos näiden merkkien tuki
> muutenkin kehittyy ooo-voikossa. Se mitä tällainen osa-aikainen
> äikänope osaa Voikon sisäistä logiikkaa kommentoida, niin kai se
> logiikka kuuluisi ooo-voikkoon, mikäli on ylipäänsä mahdollista.
Nämä voidaan tehdä openoffice.org-voikossa, mutta myös "ylemmällä" tasolla
itse OpenOfficessa. Heittomerkit on varmasti parasta käsitellä
oikolukukomponenteissa, koska eri kielissä on eri sääntöjä niitä koskien.
Typografiset ligatuurit ovat rajatapaus. Ainakin saksan kielessä on niidenkin
käytössä rajoituksia, jotka voi tarkistaa vain oikoluvun yhteydessä. Sen
sijaan sitova yhdysmerkki taitaa vastata tavallista yhdysmerkkiä kaikissa
kielissä, joten sen voisi mielestäni käsitellä OpenOfficen puolella, jolloin
sitä ei tarvitsisi käsitellä jokaisessa oikolukukomponentissa erikseen. Mutta
jää OpenOfficen kehittäjien ratkaistavaksi, kuinka tässä toimitaan.
Openoffice.org-voikon testausta varten olen ajatellut lisätä
testidokumenttiimme makroja, joilla voisi automatisoida enemmänkin näitä
testejä. Silloin ne olisi helpompi suorittaa uudelleen ennen uusien
versioiden julkaisua. Mutta en ole vielä ehtinyt tehdä tälle asialle mitään.
Harri
More information about the devel
mailing list