[voikko-devel] Tavutuksen testausta

Harri Pitkänen hatapitk at cc.jyu.fi
Thu May 10 11:08:45 EEST 2007


On Wednesday 09 May 2007, Teemu Likonen wrote:
> Yhtä asiaa lukuun ottamatta tavutus mielestäni toimii niin kuin on
> tarkoitus. Ongelmana ovat ligatuurit ja ongelma on - nyt vasta
> huomasin - myös vanhemmissa versioissa. Tavutuksessa huomioidaan
> esimerkiksi kirjoitusasu "fenomeno=grafia" mutta vain silloin, kun ei
> ole käytetty ligatuureja. Jos sanaan laitetaan fi-ligatuuri, sana
> tavutetaan sääntöpohjaisesti, ja siten myös tilanne "fenomenog-rafia"
> on mahdollinen.
>
> Ongelman voi todentaa vaikka voikkohyphenate-ohjelmalla, mutta
> käytännössä ikävä se on OOo:ssa todellista tekstiä käsiteltäessä.
> Ligatuureja saatetaan lisätä tekstiin jälkikäteen etsi ja
> korvaa -toiminnolla. Sen aiheuttamat tavutusvirheet jäävät helposti
> huomaamatta.

Tämä on tosiaan vanha ongelma. Sanoisin, että toistaiseksi on parasta laittaa 
manuaalisesti tavutusvihjeet sanoihin, joissa käytetään ligatuureja. Tämän 
voisi jossain dokumentoidakin, vaikka tuossa meidän "Kielityökalut 
OpenOffice.org-ohjelmistossa"-ohjeessa. Pieniä parannuksia nykyiseen olisi 
toki mahdollista tehdä openoffice.org-voikossa, mutta koska kokonaan tätä 
ongelmaa ei ole mahdollista korjata, taidan edelleen jättää tämän 
myöhemmäksi. Ligatuureja sisältävien sanojen tavutushan ei ole OpenOfficessa 
toiminut koskaan oikein, joten kiirettä tällä ei ole.

> Varmistettakoon vielä, että kuuluuko lyhenteiden päätteet ja liitteet
> jättää tavuttamatta? Mielestäni ne voi nykyiseen tapaan jättää
> tavuttamatta mutta järkevissä rajoissa oleva katkaisukohta olisi
> sijapäätteen ja liitteen välistä, esimerkiksi "USA:ssa-kaan". Missään
> nimessä ei kannata katkaista sijapäätettä ("USA:s-sa").

Päätteet on ollut tapana tavuttaa, joten nykyinen käyttäytyminen ei ole 
varsinaisesti bugi. Mutta yhden kirjaimen jättäminen päätteen jälkeen näyttää 
tosiaan aika pahalta. Koska sama korjaus tehtiin jo libvoikkoon heittomerkin 
tapauksessa, voin tämän korjata myös kaksoispisteelle vielä tänään. Libvoikko 
1.4.1rc2 on saatavilla viimeistään illalla. Tämähän ei siis välttämättä riitä 
estämään tavutusta kaikissa sijapäätteissä, mutta tavallisimmissa kyllä.

> 				* * *
>
> Sitten pientä kitinää vanhasta ja tunnetusta mutta ehkä vähitellen
> entistä ajankohtaisemmaksi muuttuvasta asiasta. Ilmeisesti libvoikon
> tekemän merkistön normalisoinnin vuoksi
> (libvoikko/src/voikko_charset.c) Unicoden heittomerkki U+2019 muuttuu
> korjausehdotuksissa aina Ascii-heittomerkiksi. Normalisointi
> libvoikossa kuuluu asiaan, mutta OOo+ooo-voikossa sillä on ikäviä
> vaikutuksia.
>
> Tekstinkäsittelyohjelmat usein muuttavat näppäimistöltä tuotettavan
> heittomerkin suomen kielen oikeinkirjoituksen mukaiseksi heittomerkiksi
> U+2019:ksi, mutta virheellisen sanan korjausehdotuksissa se palautuu
> Ascii-heittomerkiksi. Merkin joutuu sitten käsin muuttamaan, mikä on
> vähän ikävää. Minulla on hämärä muistikuva, että jokin OOo 2.0.4:ää
> vanhempi versio olisi korjannut sen jälleen Unicoden heittomerkiksi.
> Saatan muistaa väärinkin.

En muista, mitä vanhat versiot tekivät. Tästä kyllä keskusteltiin jo viime 
kesänä, joten vastaus saattaa löytyä postituslistojen arkistosta. Jos ehdin, 
voin korjata tämän openoffice.org-voikon versioon 2.1, mutta versioon 2.0.1 
muutos olisi liian suuri.

> Sama koskee toki muitakin merkkejä. Jatkossa esimerkiksi Unicoden
> yhdysmerkki ja sitova yhdysmerkki sekä ligatuurit voisi olla fiksua
> palauttaa korjausehdotuksissa samoina OOo:lle, jos näiden merkkien tuki
> muutenkin kehittyy ooo-voikossa. Se mitä tällainen osa-aikainen
> äikänope osaa Voikon sisäistä logiikkaa kommentoida, niin kai se
> logiikka kuuluisi ooo-voikkoon, mikäli on ylipäänsä mahdollista.

Nämä voidaan tehdä openoffice.org-voikossa, mutta myös "ylemmällä" tasolla 
itse OpenOfficessa. Heittomerkit on varmasti parasta käsitellä 
oikolukukomponenteissa, koska eri kielissä on eri sääntöjä niitä koskien. 
Typografiset ligatuurit ovat rajatapaus. Ainakin saksan kielessä on niidenkin 
käytössä rajoituksia, jotka voi tarkistaa vain oikoluvun yhteydessä. Sen 
sijaan sitova yhdysmerkki taitaa vastata tavallista yhdysmerkkiä kaikissa 
kielissä, joten sen voisi mielestäni käsitellä OpenOfficen puolella, jolloin 
sitä ei tarvitsisi käsitellä jokaisessa oikolukukomponentissa erikseen. Mutta 
jää OpenOfficen kehittäjien ratkaistavaksi, kuinka tässä toimitaan.


Openoffice.org-voikon testausta varten olen ajatellut lisätä 
testidokumenttiimme makroja, joilla voisi automatisoida enemmänkin näitä 
testejä. Silloin ne olisi helpompi suorittaa uudelleen ennen uusien 
versioiden julkaisua. Mutta en ole vielä ehtinyt tehdä tälle asialle mitään.

Harri



More information about the devel mailing list