[voikko-devel] Voikko 1.1 ja Oo2-soikko 1.1.2 julkaistu

Harri Pitkänen hatapitk at cc.jyu.fi
Thu Sep 14 21:39:02 EEST 2006


Voikko 1.1 sisältää erinäisiä korjauksia kuukausi sitten julkaistuun versioon 
1.0. Tarkempia tietoja tehdyistä muutoksista voi käydä katsomassa sivulta
http://www.lemi.fi/voikko/versiohistoria.html

Voikon kehitystyön yhteydessä havaitsin vakavan ongelman, joka liittyi 
monikäsitteisten yhdyssanojen (esimerkiksi "kaivosaukko") käsittelyyn. Jos 
tällaisista yhdyssanoista muodosti uusia yhdyssanoja, yhdistelmän 
monikäsitteisyyden aste kasvoi eksponentaalisesti. Esimerkiksi kaksikymmentä 
kertaa peräkkäin toistettuna sana kaivosaukko tuottaa näennäisesti 
merkityksettömän sanan, jolle kone kuitenkin löytää toista miljoonaa 
eri "merkitystä". Käytännössä tämä johtaa siihen, että tuollaisen merkkijonon 
syöttäminen oikoluvulle jumiuttaa ohjelman täydellisesti. Koska Voikossa 
käsiteltävien sanojen pituudelle oli asetettu rajaksi 255 merkkiä, tätä 
ominaisuutta oli mahdollista käyttää hyväksi esimerkiksi lähettämällä 
OpenOfficen käyttäjälle asiakirjassa (tai vaikka tavallisessa 
tekstitiedostossa) tällainen merkkijono, jolloin OpenOffice jumiutuu eikä 
käyttäjä pysty esimerkiksi tallentamaan keskeneräisiä töitään. Vika on nyt 
korjattu Voikon versioon 1.1 kuuluvassa libvoikossa.

Sama ongelma koskee myös Soikkoa, ja se on korjattu Oo2-soikon versiossa 
1.1.2. Huomatkaa kuitenkin, että jos käytätte Soikkoa muissa ohjelmissa kuin 
OpenOffice.orgissa, korjauspäivitys on tehtävä erikseen näillekin ohjelmille, 
ellei niissä ole ollut jo valmiina pituusrajaa käsiteltäville sanoille. Olen 
jo tiistaina kertonut asiasta Soikon Mozilla-laajennusta tekevälle Andris 
Pavenikselle sekä Soikon Mac OS X:lle sovittaneelle Otto Räsäselle. En 
kuitenkaan pysty sanomaan, ovatko nämä ohjelmat haavoittuvia tälle bugille.

Sekä palvelimilla www.lemi.fi että dtw.silverentertainment.fi saatavilla 
olevat asennuspaketit Soikosta ja Voikosta on päivitetty näihin uusiin 
versioihin. Oo2-soikon Linux/gcc3.3-binääripaketti on tästä versiosta jätetty 
pois. Sille ei enää näyttänyt olevan juurikaan kysyntää: Tietääkseni yksikään 
merkittävä Linux-jakelu ei koskaan julkaissut vakaata versiota OOo 2.0:sta 
tuolla kääntäjällä, eikä OOo 2.0:n toista vuotta vanhoja beta-versioita juuri 
kukaan enää käytä.

Harri



More information about the devel mailing list