[hunspell-fi-devel] Oo2-voikko: Suomi-malaga -pohjainen oikoluku OpenOfficelle
Harri Pitkänen
hatapitk at cc.jyu.fi
Wed Feb 22 22:23:40 EET 2006
Asennuspaketti löytyy osoitteesta
http://www.hunspell-fi.org/malaga/oo2-voikko-Linux_x86-dbg-0.1.tar.gz
ja lähdekoodipaketti samasta hakemistosta.
Asennusohje
===========
- Asenna malaga ja suomi-malaga-0.1, ohjeethan löytyivät siis Hannun sivulta
osoitteesta http://joyds1.joensuu.fi/sukija/sukija.html . Debianissa (ja ehkä
myös Ubuntussa) malagan voi asentaa myös asentamalla paketit libmalaga6 ja
malaga-bin. Nämä paketit ovat vieläkin vanhempaa versiota kuin ohjeessa
pyydetään käyttämään (6.13), mutta itse en ole huomannut niiden toiminnassa
mitään ongelmia.
- Kopioi suomi-malagasta kaikki _l -päätteiset tiedostot sekä tiedosto
suomi.pro hakemistoon /usr/local/suomi-malaga
- Linkitä malaga-kirjasto symbolisella linkillä tuohon hakemistoon nimelle
libmalaga.so.6 jonka jälkeen hakemiston sisällön pitäisi näyttää suunnilleen
seuraavanlaiselta:
c2:/usr/local/suomi-malaga# ls -l
total 9936
lrwxrwxrwx 1 root staff 23 2006-02-21 18:28 libmalaga.so.6
-> /usr/lib/libmalaga.so.6
-rw-r--r-- 1 root staff 146493 2006-02-21 18:27 suomi.all_l
-rw-r--r-- 1 root staff 9955972 2006-02-21 18:27 suomi.lex_l
-rw-r--r-- 1 root staff 27760 2006-02-21 18:27 suomi.mor_l
-rw-r--r-- 1 root staff 2775 2006-02-21 18:27 suomi.pro
-rw-r--r-- 1 root staff 15513 2006-02-21 18:27 suomi.sym_l
- Asenna oo2-voikko ja aktivoi se OpenOfficessa täsmälleen samalla tavalla
kuin oo2-soikko asennetaan. Voit siis seurata ohjeita
http://www.lemi.fi/oo2-soikko/linasennus.html , ainoa ero on tuo yksi kirjain
ohjelman nimessä.
Tietoja ohjelmasta
==================
Ohjelman nimi tulee Hannun vastaavasta Voikko-ohjelmasta. Tämän ohjelman
lähdekoodia tosin ei ole käytetty ollenkaan, ainoastaan toimintaperiaate on
sama. Jos nimi katsotaan sekaannusta aiheuttavaksi, niin vaihdetaan.
Tämä on hyvin pikaisesti (parissa tunnissa) Hunspell-fi -projektin
UNO-komponentin päälle rakennettu viritelmä. Väärin kirjoitettujen sanojen
korjausehdotuksia ei ole toteutettu. Tai tavallaan on, mutta ehdotuksena on
aina "hevonen". Tavutus toimii siten, että tavurajan oletetaan sijaitsevan
aina konsonantti-vokaaliyhdistelmän edessä. Tämä on yksinkertaisin
mahdollinen tavutusalgoritmi, joka tuottaa jotain edes vähän suomen
tavutukselta näyttävää.
Mutta oikoluvun taso on häkellyttävän hyvä. Testasin kopioimalla etusivun
projektimme www-sivulta, ja ohjelma tunnisti kaikki sanat! Tai ei aivan
kaikkea, päivämäärien, ohjelman nimien ja kaksoispisteitä sisältävien sanojen
kanssa on ongelmia. Tämä viimeinen näyttää taas kerran olevan bugi
OpenOfficen breakiterator-säännöissä, mitenköhän se on voinut jäädä
huomaamatta... Mutta kuitenkin, tämä on semmoinen ihme että kannattaa
ehdottomasti se omin silmin todeta.
Lisenssinä tuolla UNO-komponentilla on muodollisesti LGPL, mutta koska se
vaatii toimiakseen malagan, niin käytännössä lisenssi on GPL ellei joku tee
Malagasta binääritasolla yhteensopivaa kloonia jollain toisella lisenssillä.
Paketti on käännetty asetuksella DEBUG=FULL, joten se kirjoittelee käytön
aikana hiukan debug-informaatiota päätteelle ja tiedostokoko on
harhaanjohtavan suuri.
Harri
More information about the devel
mailing list