[hunspell-fi-devel] Aikataulua

Harri Pitkänen hatapitk at cc.jyu.fi
Sun May 7 18:16:39 EEST 2006


Osoitteesta http://www.hunspell-fi.org/voikkotmp/libvoikko-060507.tar.gz 
löytyy libvoikon viimeisin työversio, joka oikolukee pitkiä tekstejä 
merkittävästi (yli 20 prosenttia) nopeammin kuin aikaisemmat versiot. Tämä 
onnistuu siten, että pieni joukko oikeaksi todettuja sanoja pidetään 
muistissa eikä siis joka sanan kohdalla kutsuta Malagaa.

Mutta sitten alustava aikataulu Voikon 1.0 -version julkaisemiseksi:

21.5.  * libvoikko 0.3: ohjelmointirajapinnat (voikko.h) lopullisessa
         muodossaan.
       * Debian-pakettien päivitys aloitettu uudelleen, Oo2-voikko
         amd64-arkkitehtuurille paketoitu mikäli mahdollista.
4.6.   * libvoikko 0.9: kaikki ominaisuudet toteutettu, tästä lähtien
         korjataan vain bugeja.
25.6.  * sananmuodostussäännöstön kehittäminen lopetetaan. Tämä tarkoittaa
         sitä, että Suomi-Malagan tuolloisesta uusimmasta versiosta otetaan
         Voikkoa varten kopio (itse sanastoa lukuun ottamatta) ja tähän
         kopioon tehdään enää korkeintaan pieniä korjauksia.
       * sanastonhallintasovellus Joukahainen on siinä vaiheessa, että sitä
         voi käyttää nominien taivutusluokituksen tarkistamiseen (korjaukset
         tehdään edelleen käsin).
       * ennen joulua koottu Hunspell-sanasto on soveltuvin osin siirretty
         Joukahaiseen, ja vertailu vastaavaan Suomi-Malagan sanaston osaan on
         tehty.
9.7.   * Joukahainen: käyttäjien tunnistus toimii ja sanaston korjaaminen
         ja lisääminen sovelluksen kautta on mahdollista.
30.7.  * Joukahainen: verbit mukana tietokannassa ja niiden
         taivutusluokituksen oikoluku ja korjaaminen onnistuu.
13.8.  * Voikko: versio 1.0 julkaistaan.
27.8.  * Joukahainen: versio 1.0 julkaistaan.


Yllä oleva aikataulu näyttää tiukalta, mutta tässä on muistettava kaksi 
seikkaa. Ensinnäkin suuri osa tuosta työstä on sellaista, jota aion tehdä 
täyspäiväisesti eli aikaa työhön on olemassa. Ja toisaalta ne osat, jotka 
eivät omaan projektiini kuulu, alkavat jo nyt olla melko hyvällä mallilla. 
Parannuksen viime viikkoina ovat olleet merkittäviä ja lisää on luvassa 
tulevalla viikolla kun isojen kirjainten käsittely saadaan toimimaan. 
Varsinaisen ohjelman kehittäminen kannattaa mielestäni tehdä loppuun ennen 
kuin aletaan aktiivisesti korjailemaan sanastoa, koska tällä tavalla 
vältytään turhalta ja päällekkäiseltä työltä. Sanaston kehittäminen kun 
muutenkin tehdään toivon mukaan ryhmätyönä ja se onnistuu tietysti paljon 
mukavammin jos itse oikolukuohjelmaa voi käyttää pääasiallisena tai ainoana 
oikolukuohjelmanaan luottaen siihen ettei se tuhoa käsiteltäviä asiakirjoja 
tai tee muuta outoa.

Se, mitä tapahtuu Voikon 1.0 -version julkaisemisen jälkeen, on vielä avoinna. 
Varmaa on se, että sanastoa kehitetään ja Voikkoa yritetään sovittaa 
sellaisiin ohjelmiin, joissa se ei vielä toimi. En vielä tiedä, onko 
järkevämpää julkaista sanastopäivityksiä korjausversioiden yhteydessä, 
tarjota automaattisesti päivitettyjä sanastoja vaikka kerran vuorokaudessa 
vai tehdä molempia. Jos intoa ja tarvetta on, voidaan 1.0 -version 
julkaisemisen jälkeen palata jälleen itse ohjelman kehittämiseen esimerkiksi 
Suomi-Malagaa parantamalla tai yrittämällä SFST-pohjaista ratkaisua, jos 
tästä vielä ollaan kiinnostuneita. libvoikkohan on suunniteltu niin, että 
taustalla oleva ohjelmisto voidaan vaihtaa vaikka kokonaan ilman että muutos 
näkyy käyttäjälle oikeastaan mitenkään.

Jos joku ihmettelee, miksi Joukahainen julkaistaan omana ohjelmanaan vaikka se 
vaikuttaa vain projektin sisäiseltä työkalulta, niin vastaus on se että 
vaikutelma on väärä. Joukahaisesta on todella tarkoitus tehdä yleiskäyttöinen 
ohjelma, jota on mahdollista käyttää myös muiden kielten sanastojen 
ylläpidossa. Tästä on jo ollut puhetta muutamien kielten (mm. zulu ja 
afrikaans) sanastojen kehittäjien kanssa.

Harri



More information about the devel mailing list