[hunspell-fi-devel] Oo2-voikko: Suomi-malaga -pohjainen oikoluku OpenOfficelle

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Feb 22 22:23:40 EET 2006


Asennuspaketti löytyy osoitteesta
http://www.hunspell-fi.org/malaga/oo2-voikko-Linux_x86-dbg-0.1.tar.gz
ja lähdekoodipaketti samasta hakemistosta.

Asennusohje
===========

- Asenna malaga ja suomi-malaga-0.1, ohjeethan löytyivät siis Hannun sivulta 
osoitteesta http://joyds1.joensuu.fi/sukija/sukija.html . Debianissa (ja ehkä 
myös Ubuntussa) malagan voi asentaa myös asentamalla paketit libmalaga6 ja 
malaga-bin. Nämä paketit ovat vieläkin vanhempaa versiota kuin ohjeessa 
pyydetään käyttämään (6.13), mutta itse en ole huomannut niiden toiminnassa 
mitään ongelmia.

- Kopioi suomi-malagasta kaikki _l -päätteiset tiedostot sekä tiedosto 
suomi.pro hakemistoon /usr/local/suomi-malaga

- Linkitä malaga-kirjasto symbolisella linkillä tuohon hakemistoon nimelle 
libmalaga.so.6 jonka jälkeen hakemiston sisällön pitäisi näyttää suunnilleen 
seuraavanlaiselta:

c2:/usr/local/suomi-malaga# ls -l
total 9936
lrwxrwxrwx  1 root staff      23 2006-02-21 18:28 libmalaga.so.6 
-> /usr/lib/libmalaga.so.6
-rw-r--r--  1 root staff  146493 2006-02-21 18:27 suomi.all_l
-rw-r--r--  1 root staff 9955972 2006-02-21 18:27 suomi.lex_l
-rw-r--r--  1 root staff   27760 2006-02-21 18:27 suomi.mor_l
-rw-r--r--  1 root staff    2775 2006-02-21 18:27 suomi.pro
-rw-r--r--  1 root staff   15513 2006-02-21 18:27 suomi.sym_l

- Asenna oo2-voikko ja aktivoi se OpenOfficessa täsmälleen samalla tavalla 
kuin oo2-soikko asennetaan. Voit siis seurata ohjeita 
http://www.lemi.fi/oo2-soikko/linasennus.html , ainoa ero on tuo yksi kirjain 
ohjelman nimessä.

Tietoja ohjelmasta
==================

Ohjelman nimi tulee Hannun vastaavasta Voikko-ohjelmasta. Tämän ohjelman 
lähdekoodia tosin ei ole käytetty ollenkaan, ainoastaan toimintaperiaate on 
sama. Jos nimi katsotaan sekaannusta aiheuttavaksi, niin vaihdetaan.

Tämä on hyvin pikaisesti (parissa tunnissa) Hunspell-fi -projektin 
UNO-komponentin päälle rakennettu viritelmä. Väärin kirjoitettujen sanojen 
korjausehdotuksia ei ole toteutettu. Tai tavallaan on, mutta ehdotuksena on 
aina "hevonen". Tavutus toimii siten, että tavurajan oletetaan sijaitsevan 
aina konsonantti-vokaaliyhdistelmän edessä. Tämä on yksinkertaisin 
mahdollinen tavutusalgoritmi, joka tuottaa jotain edes vähän suomen 
tavutukselta näyttävää.

Mutta oikoluvun taso on häkellyttävän hyvä. Testasin kopioimalla etusivun 
projektimme www-sivulta, ja ohjelma tunnisti kaikki sanat! Tai ei aivan 
kaikkea, päivämäärien, ohjelman nimien ja kaksoispisteitä sisältävien sanojen 
kanssa on ongelmia. Tämä viimeinen näyttää taas kerran olevan bugi 
OpenOfficen breakiterator-säännöissä, mitenköhän se on voinut jäädä 
huomaamatta... Mutta kuitenkin, tämä on semmoinen ihme että kannattaa 
ehdottomasti se omin silmin todeta.

Lisenssinä tuolla UNO-komponentilla on muodollisesti LGPL, mutta koska se 
vaatii toimiakseen malagan, niin käytännössä lisenssi on GPL ellei joku tee 
Malagasta binääritasolla yhteensopivaa kloonia jollain toisella lisenssillä.

Paketti on käännetty asetuksella DEBUG=FULL, joten se kirjoittelee käytön 
aikana hiukan debug-informaatiota päätteelle ja tiedostokoko on 
harhaanjohtavan suuri.

Harri



More information about the devel mailing list