[hunspell-fi-devel] Aikataulua
Harri Pitkänen
hatapitk at cc.jyu.fi
Sun May 7 18:16:39 EEST 2006
Osoitteesta http://www.hunspell-fi.org/voikkotmp/libvoikko-060507.tar.gz
löytyy libvoikon viimeisin työversio, joka oikolukee pitkiä tekstejä
merkittävästi (yli 20 prosenttia) nopeammin kuin aikaisemmat versiot. Tämä
onnistuu siten, että pieni joukko oikeaksi todettuja sanoja pidetään
muistissa eikä siis joka sanan kohdalla kutsuta Malagaa.
Mutta sitten alustava aikataulu Voikon 1.0 -version julkaisemiseksi:
21.5. * libvoikko 0.3: ohjelmointirajapinnat (voikko.h) lopullisessa
muodossaan.
* Debian-pakettien päivitys aloitettu uudelleen, Oo2-voikko
amd64-arkkitehtuurille paketoitu mikäli mahdollista.
4.6. * libvoikko 0.9: kaikki ominaisuudet toteutettu, tästä lähtien
korjataan vain bugeja.
25.6. * sananmuodostussäännöstön kehittäminen lopetetaan. Tämä tarkoittaa
sitä, että Suomi-Malagan tuolloisesta uusimmasta versiosta otetaan
Voikkoa varten kopio (itse sanastoa lukuun ottamatta) ja tähän
kopioon tehdään enää korkeintaan pieniä korjauksia.
* sanastonhallintasovellus Joukahainen on siinä vaiheessa, että sitä
voi käyttää nominien taivutusluokituksen tarkistamiseen (korjaukset
tehdään edelleen käsin).
* ennen joulua koottu Hunspell-sanasto on soveltuvin osin siirretty
Joukahaiseen, ja vertailu vastaavaan Suomi-Malagan sanaston osaan on
tehty.
9.7. * Joukahainen: käyttäjien tunnistus toimii ja sanaston korjaaminen
ja lisääminen sovelluksen kautta on mahdollista.
30.7. * Joukahainen: verbit mukana tietokannassa ja niiden
taivutusluokituksen oikoluku ja korjaaminen onnistuu.
13.8. * Voikko: versio 1.0 julkaistaan.
27.8. * Joukahainen: versio 1.0 julkaistaan.
Yllä oleva aikataulu näyttää tiukalta, mutta tässä on muistettava kaksi
seikkaa. Ensinnäkin suuri osa tuosta työstä on sellaista, jota aion tehdä
täyspäiväisesti eli aikaa työhön on olemassa. Ja toisaalta ne osat, jotka
eivät omaan projektiini kuulu, alkavat jo nyt olla melko hyvällä mallilla.
Parannuksen viime viikkoina ovat olleet merkittäviä ja lisää on luvassa
tulevalla viikolla kun isojen kirjainten käsittely saadaan toimimaan.
Varsinaisen ohjelman kehittäminen kannattaa mielestäni tehdä loppuun ennen
kuin aletaan aktiivisesti korjailemaan sanastoa, koska tällä tavalla
vältytään turhalta ja päällekkäiseltä työltä. Sanaston kehittäminen kun
muutenkin tehdään toivon mukaan ryhmätyönä ja se onnistuu tietysti paljon
mukavammin jos itse oikolukuohjelmaa voi käyttää pääasiallisena tai ainoana
oikolukuohjelmanaan luottaen siihen ettei se tuhoa käsiteltäviä asiakirjoja
tai tee muuta outoa.
Se, mitä tapahtuu Voikon 1.0 -version julkaisemisen jälkeen, on vielä avoinna.
Varmaa on se, että sanastoa kehitetään ja Voikkoa yritetään sovittaa
sellaisiin ohjelmiin, joissa se ei vielä toimi. En vielä tiedä, onko
järkevämpää julkaista sanastopäivityksiä korjausversioiden yhteydessä,
tarjota automaattisesti päivitettyjä sanastoja vaikka kerran vuorokaudessa
vai tehdä molempia. Jos intoa ja tarvetta on, voidaan 1.0 -version
julkaisemisen jälkeen palata jälleen itse ohjelman kehittämiseen esimerkiksi
Suomi-Malagaa parantamalla tai yrittämällä SFST-pohjaista ratkaisua, jos
tästä vielä ollaan kiinnostuneita. libvoikkohan on suunniteltu niin, että
taustalla oleva ohjelmisto voidaan vaihtaa vaikka kokonaan ilman että muutos
näkyy käyttäjälle oikeastaan mitenkään.
Jos joku ihmettelee, miksi Joukahainen julkaistaan omana ohjelmanaan vaikka se
vaikuttaa vain projektin sisäiseltä työkalulta, niin vastaus on se että
vaikutelma on väärä. Joukahaisesta on todella tarkoitus tehdä yleiskäyttöinen
ohjelma, jota on mahdollista käyttää myös muiden kielten sanastojen
ylläpidossa. Tästä on jo ollut puhetta muutamien kielten (mm. zulu ja
afrikaans) sanastojen kehittäjien kanssa.
Harri
More information about the devel
mailing list