[hunspell-fi-devel] Malaga 7.2

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Mar 3 20:00:58 EET 2006


Malagan versio 7.2 näyttää myös toimivan moitteettomasti Suomi-Malagan kanssa. 
Tiedostot on vain koodattava UTF-8 -muotoon ennen make-komennon antamista. 
Riittää, että tiedostot päähakemistossa ja alihakemistossa "sanat" käsittelee 
esimerkiksi komennolla recode latin9..utf8

Tämä toimii siis hyvin ainakin UTF-8 -lokaaleita käyttävillä. Versio 7.2 on 
hiukan hitaampi, käyttää vähän enemmän muistia ja tekee suurempia tiedostoja 
kuin vanhemmat versiot. Mutta ero kaikissa kohdissa on vain noin 10 prosentin 
luokkaa tai vähemmän, ja tämän verran kai on pakko maksaa tehokkuudessa kun 
UTF-8:an siirrytään.

Oo2-voikon kanssa uusi versio ei oletettavasti toimi. En aio tätä asiaa 
erikseen korjata, koska toistaiseksi version 7.2 käyttämisestä ei ole mitään 
varsinaista hyötyä. Suunnittelen kuitenkin oikolukukirjaston (kutsutaan sitä 
nyt vaikka nimellä libvoikko) siten, että se käyttää pelkästään UTF-8:aa 
malagan kanssa keskustellessaan ja UTF-8:aa tai UCS4:ää oikolukua käyttävien 
sovellusten suuntaan (kirjaston sisällä käytetään UCS4:ää). Tämä mahdollistaa 
sitten aikanaan kaikenlaiset hienoudet, kun oikoluvun kaikissa vaiheissa on 
käytettävissä koko Unicode-merkistö. Ja seuraava versio Oo2-voikosta käyttää 
sitten libvoikkoa oikolukuun ja tavutukseen.

Tmispellistä voisi olla hyödyllistä tehdä libvoikkoa käyttävän version. Jätän 
tämän kuitenkin muille mietittäväksi, koska en saa mitään tolkkua kyseisen 
ohjelman lisenssistä. Lähdekoodipaketti sisältää GPL:n version 2. Pauli 
Virtasen sivulla (http://users.tkk.fi/~ptvirtan/programs/tmispell.html.en) 
sanotaan, että se on lisensöity GPL:n versiolla 2. Lähdekoodipaketissa on 
tiedosto debian/copyright, jossa sanotaan lisenssin olevan GPL:n versio 2 tai 
uudempi. Itse lähdekooditiedostoista puuttuu kokonaan vaadittavat 
lisenssimerkinnät. Lisäksi ohjelma on suunniteltu linkitettäväksi Soikkoon, 
mikä on täysin ristiriidassa sen kanssa että ohjelman lisenssi olisi mikään 
versio GPL:stä. Ja tmispellissä ei nähtävästi edes ole tukea UTF-8:lle.

Harri



More information about the devel mailing list