[voikko] Voikon muistintarve (Oli: Soikko/Voikko ja N800)

Harri Pitkänen hatapitk at iki.fi
Mon Dec 10 17:28:02 EET 2007


On Sunday 09 December 2007, Timo Jyrinki wrote:
> Jos kiinnostaa, niin minä käänsin Voikon N800:lle tuossa jokin aika
> sitten:
> http://losca.blogspot.com/2007/11/voikko-for-n800-internet-tablet.html
>
> Eli malaga, suomi-malaga, libvoikko ja tmispell-voikko. Yksistäänhän
> noilla ei tee mitään, ellei ole ohjelmaa joka ispelliä, libenchantia
> tai libvoikkoa käyttäisi. Testasin kuitenkin komentoriviltä että
> toimii. Käänsin myös Abiwordista koeluontoisen version jossa Voikko
> toimi (libenchantin ansiosta), mutta kääntämäni Abiword itse toimi
> niin huonosti että otin sen pakettivarastosta pois.

Osaatko arvioida, kuinka hyvin tuon N800:n resurssit (muisti ja 
prosessoriteho) riittävät Voikon käyttöön nykyisellään? Eli jos laitteella on 
vaikka selain ja/tai joku tekstieditori käytössä, niin voisiko Voikkoa 
käyttää ilman, että sillä olisi näkyviä vaikutuksia ohjelmien vasteaikoihin? 
Tätä voi tietysti olla vaikea arvioida jos Voikkoa ei noissa graafisissa 
ohjelmissa pysty vielä käyttämään, mutta taustalla voisi ajaa jotain 
suunnilleen yhtä paljon muistia vievää sovellusta ja tehdä arvion sen 
perusteella.

Nykyisellään Voikon rss-muistinkäyttö on kirjaston alustuksen jälkeen noin 
yksi megatavu, mutta käytön aikana se voi kasvaa noin 9,5 megatavuun sitä 
mukaan kun tiedostoa voikko-fi_FI.lex_l sivutetaan sisään. Tuo yksi mega ei 
vielä varmasti missään tunnu, mutta 9,5 megaa saattaa jo jonkin verran noissa 
laitteissa.

Muistin tarpeeseen voidaan siis aika paljon vaikuttaa juuri tiedoston 
voikko-fi_FI.lex_l koon kautta. Se puolestaan on lähes suoraan verrannollinen 
sanaston laajuuteen. Voikon perussanasto (yleisyysluokat luokat 1-9) on 
valittu lähinnä työpöytäkäyttöä ajatellen. Lisäsin juuri Suomi-malagan 
SVN-versioon käännösoption, jolla käytettävän sanaston laajuuden voi valita. 
Eli jos Suomi-malagan kääntää komennolla
  make voikko MIN_FREQUENCY=8
niin sanastoon otetaan vain ne sanat, joiden yleisyysluokka on 1-8. Lisäksi 
luokan 8 sanoista jätetään pois ne, joissa on lippu "sekoittuu helposti 
yleisempään sanaan".

Toistaiseksi tämä asetus ei kovin paljon sanastotiedoston kokoon vaikuta. 
Säästöä näyttäisi tulevan vain 86 kilotavua. Tämä johtuu siitä, että 
valtaosalle sanoista ei ole vielä yleisyysluokkaa asetettu. Tuo luokitus on 
kuitenkin suunniteltu logaritmiseksi siten, että luokan n koko olisi 
verrannollinen luokkien 1..n-1 yhteiskokoon kaikille n > 1. Uusille 
harvinaisille sanoille yleisyysluokka on ollut tapana asettaa, ja ne menevät 
lähes aina luokkiin 8, 9 tai 10. Luokan 9 sanojen jättäminen pois ei 
käytännössä paljon oikoluvun laadussa tunnu, mutta muistin käytössä sen 
vaikutus voi tulevaisuudessa olla useita megatavuja. Tämä vaan vinkkinä 
teille jotka Voikkoa paketoitte resurssirajoitteisille laitteille.

Harri



More information about the voikko mailing list