[hunspell-fi-devel] Malaga 7.2
Harri Pitkänen
hatapitk at cc.jyu.fi
Fri Mar 3 20:00:58 EET 2006
Malagan versio 7.2 näyttää myös toimivan moitteettomasti Suomi-Malagan kanssa.
Tiedostot on vain koodattava UTF-8 -muotoon ennen make-komennon antamista.
Riittää, että tiedostot päähakemistossa ja alihakemistossa "sanat" käsittelee
esimerkiksi komennolla recode latin9..utf8
Tämä toimii siis hyvin ainakin UTF-8 -lokaaleita käyttävillä. Versio 7.2 on
hiukan hitaampi, käyttää vähän enemmän muistia ja tekee suurempia tiedostoja
kuin vanhemmat versiot. Mutta ero kaikissa kohdissa on vain noin 10 prosentin
luokkaa tai vähemmän, ja tämän verran kai on pakko maksaa tehokkuudessa kun
UTF-8:an siirrytään.
Oo2-voikon kanssa uusi versio ei oletettavasti toimi. En aio tätä asiaa
erikseen korjata, koska toistaiseksi version 7.2 käyttämisestä ei ole mitään
varsinaista hyötyä. Suunnittelen kuitenkin oikolukukirjaston (kutsutaan sitä
nyt vaikka nimellä libvoikko) siten, että se käyttää pelkästään UTF-8:aa
malagan kanssa keskustellessaan ja UTF-8:aa tai UCS4:ää oikolukua käyttävien
sovellusten suuntaan (kirjaston sisällä käytetään UCS4:ää). Tämä mahdollistaa
sitten aikanaan kaikenlaiset hienoudet, kun oikoluvun kaikissa vaiheissa on
käytettävissä koko Unicode-merkistö. Ja seuraava versio Oo2-voikosta käyttää
sitten libvoikkoa oikolukuun ja tavutukseen.
Tmispellistä voisi olla hyödyllistä tehdä libvoikkoa käyttävän version. Jätän
tämän kuitenkin muille mietittäväksi, koska en saa mitään tolkkua kyseisen
ohjelman lisenssistä. Lähdekoodipaketti sisältää GPL:n version 2. Pauli
Virtasen sivulla (http://users.tkk.fi/~ptvirtan/programs/tmispell.html.en)
sanotaan, että se on lisensöity GPL:n versiolla 2. Lähdekoodipaketissa on
tiedosto debian/copyright, jossa sanotaan lisenssin olevan GPL:n versio 2 tai
uudempi. Itse lähdekooditiedostoista puuttuu kokonaan vaadittavat
lisenssimerkinnät. Lisäksi ohjelma on suunniteltu linkitettäväksi Soikkoon,
mikä on täysin ristiriidassa sen kanssa että ohjelman lisenssi olisi mikään
versio GPL:stä. Ja tmispellissä ei nähtävästi edes ole tukea UTF-8:lle.
Harri
More information about the devel
mailing list