[hunspell-fi-devel] Suunnitelmia kevääksi ja kesäksi

Harri Pitkänen hatapitk at cc.jyu.fi
Mon Mar 13 13:55:28 EET 2006


Viimeisen viikon ajan on ollut niin paljon muita kiireitä etten ole ehtinyt 
oikolukukirjastoa kehittelemään, eivätkä nämä kiireet hellitä ennen ensi 
viikkoa. Haluan kuitenkin pikaisesti tuoda tiedoksenne, että olen saanut 
rahoituksen COSSin Kesäkoodi-ohjelmassa Hunspell-fi -projektissa työskentelyä 
varten ensi kesäksi. Tämän turvin pystyn kesällä tekemään kolmen kuukauden 
kokopäivätyötä vastaavan työmäärän projektiimme liittyviä 
ohjelmointitehtäviä, minkä pitäisi riittää aika pitkälle. Tarkkaan ottaen 
projektisuunnitelmaani kuuluu kolme osatehtävää, jotka olen sitoutunut 
tekemään:
- Algoritmi korjausehdotusten tuottamiseksi väärin kirjoitetuille sanoille. Ei 
siis mikään kopio esimerkiksi Hunspellin käyttämästä algoritmista vaan 
parannettu versio jonka pitäisi ottaa huomioon erityisesti suomen kielessä 
tyypillisiä virheitä.
- Apuohjelma verbien taivuttamiseen (sanaston oikoluvun avuksi koska Malaga ei 
tähän suoraan pysty ainakaan millään yksinkertaisella tavalla)
- WWW-pohjainen sanastotietokantasovellus. Tämä on siis eri asia kuin nykyinen 
Reijon tekemä sanastonkeruusovellus, molempia tullaan jatkossa tarvitsemaan. 
Reijon sovellus on tarkoitettu "kaikelle kansalle" ja sinne voi lisätä 
sanastosta puuttuvia sanoja jatkokäsittelyä varten kuten tähänkin asti. Tämä 
uusi sovellus sisältää varsinaisen sanaston ja tarjoaa työkaluja sanaston 
luokitteluun, luokituksen systemaattiseen oikolukuun ja laadun arviointiin, 
sekä myös jatkossa mahdollisesti muuhunkin kuten synonyymisanastojen 
luomiseen. Se korvaa aikaisemmin käytössä olleen tiedostojen lähettelyn 
postituslistan kautta ja sanastotiedostojen manuaalisen editoinnin ja 
tarkastuksen.

Mainitsin hakemuksessani että työni edistymistä saavat valvoa kaikki tällä 
postituslistalla olijat, eli teillä on sitten kesällä oikeus suorastaan 
vaatia minulta tuloksia, tämä ei enää ole minulle pelkkää vapaaehtoistyötä :)

Kuitenkin jo ennen tämän työn aloittamista pitää Malaga-pohjainen 
oikolukukirjasto saada tehtyä, ja sen pohjalle komentorivityökalu ja 
OpenOfficessa toimiva oikolukukomponentti jonka asentaminen ei olisi aivan 
niin mutkikasta kuin nykyisen testiversion. Ehdin tekemään tämän luultavasti 
muutaman viikon päästä. Windows-version kääntämiseen minulle on jo 
alustavasti luvattu apua. Siellä OpenOffice-integrointi edellyttää 
edelleenkin ei-vapaiden (ja kalliiden) Microsoftin työkalujen käyttöä, mutta 
komentorivipohjainen versio olisi mahdollista tehdä myös vapaiden ohjelmien 
avulla. Mac-käyttäjille olisi myös tärkeää saada toimiva oikoluku, tätä on 
aika paljon toivottu. Eli jos omistat Mac OS X:llä toimivan koneen tai tiedät 
henkilön, joka voisi auttaa niin kuulisin asiasta mielelläni. Paremman 
puutteessa saattaisi riittää sekin, että joku tarjoaisi minulle ssh-yhteyden 
sopivaan Mac-koneeseen.

Onko joku jo ehtinyt olla yhteydessä tmispellin tekijöihin ohjelman lisenssin 
johdosta? Jos ei, niin yritän kirjoitella sinnekin päin jotain jossain 
välissä ja varmistaa mikä osa ohjelmasta tarkalleen ottaen on GPL:ää ja mitä 
GPL:n versiota.

Harri



More information about the devel mailing list