[hunspell-fi-devel] Suunnitelmia kevääksi ja kesäksi
Harri Pitkänen
hatapitk at cc.jyu.fi
Mon Mar 13 13:55:28 EET 2006
Viimeisen viikon ajan on ollut niin paljon muita kiireitä etten ole ehtinyt
oikolukukirjastoa kehittelemään, eivätkä nämä kiireet hellitä ennen ensi
viikkoa. Haluan kuitenkin pikaisesti tuoda tiedoksenne, että olen saanut
rahoituksen COSSin Kesäkoodi-ohjelmassa Hunspell-fi -projektissa työskentelyä
varten ensi kesäksi. Tämän turvin pystyn kesällä tekemään kolmen kuukauden
kokopäivätyötä vastaavan työmäärän projektiimme liittyviä
ohjelmointitehtäviä, minkä pitäisi riittää aika pitkälle. Tarkkaan ottaen
projektisuunnitelmaani kuuluu kolme osatehtävää, jotka olen sitoutunut
tekemään:
- Algoritmi korjausehdotusten tuottamiseksi väärin kirjoitetuille sanoille. Ei
siis mikään kopio esimerkiksi Hunspellin käyttämästä algoritmista vaan
parannettu versio jonka pitäisi ottaa huomioon erityisesti suomen kielessä
tyypillisiä virheitä.
- Apuohjelma verbien taivuttamiseen (sanaston oikoluvun avuksi koska Malaga ei
tähän suoraan pysty ainakaan millään yksinkertaisella tavalla)
- WWW-pohjainen sanastotietokantasovellus. Tämä on siis eri asia kuin nykyinen
Reijon tekemä sanastonkeruusovellus, molempia tullaan jatkossa tarvitsemaan.
Reijon sovellus on tarkoitettu "kaikelle kansalle" ja sinne voi lisätä
sanastosta puuttuvia sanoja jatkokäsittelyä varten kuten tähänkin asti. Tämä
uusi sovellus sisältää varsinaisen sanaston ja tarjoaa työkaluja sanaston
luokitteluun, luokituksen systemaattiseen oikolukuun ja laadun arviointiin,
sekä myös jatkossa mahdollisesti muuhunkin kuten synonyymisanastojen
luomiseen. Se korvaa aikaisemmin käytössä olleen tiedostojen lähettelyn
postituslistan kautta ja sanastotiedostojen manuaalisen editoinnin ja
tarkastuksen.
Mainitsin hakemuksessani että työni edistymistä saavat valvoa kaikki tällä
postituslistalla olijat, eli teillä on sitten kesällä oikeus suorastaan
vaatia minulta tuloksia, tämä ei enää ole minulle pelkkää vapaaehtoistyötä :)
Kuitenkin jo ennen tämän työn aloittamista pitää Malaga-pohjainen
oikolukukirjasto saada tehtyä, ja sen pohjalle komentorivityökalu ja
OpenOfficessa toimiva oikolukukomponentti jonka asentaminen ei olisi aivan
niin mutkikasta kuin nykyisen testiversion. Ehdin tekemään tämän luultavasti
muutaman viikon päästä. Windows-version kääntämiseen minulle on jo
alustavasti luvattu apua. Siellä OpenOffice-integrointi edellyttää
edelleenkin ei-vapaiden (ja kalliiden) Microsoftin työkalujen käyttöä, mutta
komentorivipohjainen versio olisi mahdollista tehdä myös vapaiden ohjelmien
avulla. Mac-käyttäjille olisi myös tärkeää saada toimiva oikoluku, tätä on
aika paljon toivottu. Eli jos omistat Mac OS X:llä toimivan koneen tai tiedät
henkilön, joka voisi auttaa niin kuulisin asiasta mielelläni. Paremman
puutteessa saattaisi riittää sekin, että joku tarjoaisi minulle ssh-yhteyden
sopivaan Mac-koneeseen.
Onko joku jo ehtinyt olla yhteydessä tmispellin tekijöihin ohjelman lisenssin
johdosta? Jos ei, niin yritän kirjoitella sinnekin päin jotain jossain
välissä ja varmistaa mikä osa ohjelmasta tarkalleen ottaen on GPL:ää ja mitä
GPL:n versiota.
Harri
More information about the devel
mailing list