[voikko] Malaga-tiedostojen sijainti ja uusi libvoikko

Harri Pitkänen hatapitk at iki.fi
Fri Jan 30 16:58:49 EET 2009


On Thursday 29 January 2009, Teemu Likonen wrote:
> Näyttäisi toimivan. Ilmeisesti Suomi-Malagan Makefileen pitää muuttaa
> DESTDIR-muuttuja jotenkin toisin (?). Tai kuinka eri sanastojen luominen
> ja varsinkin asentaminen sujuu (tai on tarkoitus sujua) käytännössä?

En ole tätä vielä ehtinyt kovin paljon miettiä. Toistaiseksi ei kannata 
Suomi-malagan puolella tehdä mitään muutoksia, sillä on varmaankin syytä 
julkaista siitä uusi versio lähiaikoina, ja libvoikon versioon 2.1 on vielä 
enemmän aikaa. Eli seuraava Suomi-malaga saa vielä asentaa itsensä 
oletusarvoisesti vanhan libvoikon tuntemaan hakemistoon.

Mutta järkevintä taitaa olla toimia niin, että aikanaan Suomi-malagaa 
muokataan niin, että asennusvaiheessa DESTDIR-muuttujan perään lisätään 
automaattisesti /$(VOIKKO_DICTIONARY_VERSION)/mor-$(VOIKKO_VARIANT), jossa 
VOIKKO_DICTIONARY_VERSION lisätään Makefileen, arvoksi 1. VOIKKO_VARIANT 
siellä jo onkin. Silloin nykyisiin paketointiskripteihin ei välttämättä 
tarvita muutoksia.

> Minulla on tässä taustalla vähän epäselvyys siitä, osaako libvoikko
> samanaikaisesti lukea useampaa sanastoa. Onko esimerkiksi mahdollista
> rakentaa pelkkä perussanasto ja sen lisäksi pelkkiä ATK-sanoja sisältävä
> sanasto, asentaa ne eri hakemistoihin (mor-*) ja libvoikko osaa käyttää
> molempia? Vai pitääkö "ATK-sanaston" todellisuudessa sisältää sekä
> perussanasto että ATK-sanasto?

Sen täytyy sisältää koko sanasto, eli useaa sanastoa ei voi käyttää samaan 
aikaan. Tätä asiaan olen mietiskellyt jonkin verran, ja tulin siihen 
tulokseen, että osasanastojen tukeminen vaikeuttaisi kehitystä liikaa, 
eivätkä ne kaikissa tilanteissa edes toimisi. Esimerkiksi tekemästäni 
openoffice.org-voikon Windows-lisäosasta on kolme versiota. 
Näistä "tieteellinen versio" voitaisiin teknisesti toteuttaa osasanastona 
perusversion päällä, mutta "murreversiota" ei tällä tavalla saisi toimimaan. 
Siinä kun on uusien sanojen lisäksi lisätty perussanaston sanoille uusia (tai 
siis vanhoja) taivutusmuotoja.

Ratkaisuksi niitä varten, jotka haluavat koota itselleen monimutkaisia 
sanastoyhdistelmiä, olen kaavaillut www-palvelua, jossa voisi itse valita 
mieleisensä sisällön ja asetukset sanastolle, kenties myös lisätä siihen ihan 
omia sanoja jossain muodossa. Palvelu sitten tuottaisi automaattisesti näiden 
valintojen mukaisen sanaston sopivassa formaatissa (tar.gz, zip, deb, rpm, 
msi, mitä-lie-OS-X:ssä-käytetään, ...).

Tämä nyt libvoikkoon kehitetty sanastohakemistojen rakenne varmistaa sen, että 
kunhan sanasto vain asennetaan sopivasti nimettyyn hakemistoon (esim. 
mor-pertin_potkukelkkailusanasto_2009), niin ei ole kovin todennäköistä, että 
tällaisen paketin asentaminen aiheuttaisi tiedostokonflikteja 
käyttöjärjestelmän tai jakelun virallisten Voikko-pakettien kanssa.

Mainostanpa tässä nyt samalla, että haku Kesäkoodi-haku on taas käynnissä:
  http://avautuma.blogspot.com/2009/01/kesakoodareita-haetaan-jalleen.html
Koska itse en todennäköisesti ehdi tuota edellä mainittua www-palvelua 
kehittämään, niin tämä (ainakin omasta mielestäni) erittäin mielenkiintoinen, 
ainutlaatuinen (oletteko nähneet kilpailijoilla vastaava?) ja varmasti alle 
kolmessa kuukaudessa toteutettavissa oleva (kokenut koodari saa viikossakin 
toimivaa aikaiseksi) projekti on täysin tekijää vailla. Tässä ei tarvitsisi 
edes tietää Voikosta kovin paljon, ja lopputuotteella olisi todennäköisesti 
kohtuullisen paljon kysyntää. Esimerkiksi pelkästään openoffice.org-voikon 
Windows-version "tieteellistä" sanastoa on tällä viikolla ladattu keskimäärin 
yli 90 kertaa vuorokaudessa.

Harri



More information about the voikko mailing list