[voikko] Voikon muistintarve (Oli: Soikko/Voikko ja N800)
Harri Pitkänen
hatapitk at iki.fi
Mon Dec 10 17:28:02 EET 2007
On Sunday 09 December 2007, Timo Jyrinki wrote:
> Jos kiinnostaa, niin minä käänsin Voikon N800:lle tuossa jokin aika
> sitten:
> http://losca.blogspot.com/2007/11/voikko-for-n800-internet-tablet.html
>
> Eli malaga, suomi-malaga, libvoikko ja tmispell-voikko. Yksistäänhän
> noilla ei tee mitään, ellei ole ohjelmaa joka ispelliä, libenchantia
> tai libvoikkoa käyttäisi. Testasin kuitenkin komentoriviltä että
> toimii. Käänsin myös Abiwordista koeluontoisen version jossa Voikko
> toimi (libenchantin ansiosta), mutta kääntämäni Abiword itse toimi
> niin huonosti että otin sen pakettivarastosta pois.
Osaatko arvioida, kuinka hyvin tuon N800:n resurssit (muisti ja
prosessoriteho) riittävät Voikon käyttöön nykyisellään? Eli jos laitteella on
vaikka selain ja/tai joku tekstieditori käytössä, niin voisiko Voikkoa
käyttää ilman, että sillä olisi näkyviä vaikutuksia ohjelmien vasteaikoihin?
Tätä voi tietysti olla vaikea arvioida jos Voikkoa ei noissa graafisissa
ohjelmissa pysty vielä käyttämään, mutta taustalla voisi ajaa jotain
suunnilleen yhtä paljon muistia vievää sovellusta ja tehdä arvion sen
perusteella.
Nykyisellään Voikon rss-muistinkäyttö on kirjaston alustuksen jälkeen noin
yksi megatavu, mutta käytön aikana se voi kasvaa noin 9,5 megatavuun sitä
mukaan kun tiedostoa voikko-fi_FI.lex_l sivutetaan sisään. Tuo yksi mega ei
vielä varmasti missään tunnu, mutta 9,5 megaa saattaa jo jonkin verran noissa
laitteissa.
Muistin tarpeeseen voidaan siis aika paljon vaikuttaa juuri tiedoston
voikko-fi_FI.lex_l koon kautta. Se puolestaan on lähes suoraan verrannollinen
sanaston laajuuteen. Voikon perussanasto (yleisyysluokat luokat 1-9) on
valittu lähinnä työpöytäkäyttöä ajatellen. Lisäsin juuri Suomi-malagan
SVN-versioon käännösoption, jolla käytettävän sanaston laajuuden voi valita.
Eli jos Suomi-malagan kääntää komennolla
make voikko MIN_FREQUENCY=8
niin sanastoon otetaan vain ne sanat, joiden yleisyysluokka on 1-8. Lisäksi
luokan 8 sanoista jätetään pois ne, joissa on lippu "sekoittuu helposti
yleisempään sanaan".
Toistaiseksi tämä asetus ei kovin paljon sanastotiedoston kokoon vaikuta.
Säästöä näyttäisi tulevan vain 86 kilotavua. Tämä johtuu siitä, että
valtaosalle sanoista ei ole vielä yleisyysluokkaa asetettu. Tuo luokitus on
kuitenkin suunniteltu logaritmiseksi siten, että luokan n koko olisi
verrannollinen luokkien 1..n-1 yhteiskokoon kaikille n > 1. Uusille
harvinaisille sanoille yleisyysluokka on ollut tapana asettaa, ja ne menevät
lähes aina luokkiin 8, 9 tai 10. Luokan 9 sanojen jättäminen pois ei
käytännössä paljon oikoluvun laadussa tunnu, mutta muistin käytössä sen
vaikutus voi tulevaisuudessa olla useita megatavuja. Tämä vaan vinkkinä
teille jotka Voikkoa paketoitte resurssirajoitteisille laitteille.
Harri
More information about the voikko
mailing list