[hunspell-fi-devel] Käyttäjätunnusta

Harri Pitkänen hatapitk at cc.jyu.fi
Fri Feb 3 12:03:46 EET 2006


Hei!

On Thursday 02 February 2006 17:02, Jukka Jalava wrote:
> Hei,
>
> Kuulin Hunspell-fi:stä eilen Open Source 2006 -tapahtumassa ja haluan
> kantaa korteni kekoon.
> Loisitteko minulle siis tunnuksen, että pääsen kartuttamaan sanastoa.

Luon tunnuksen ja lähetän sen sinulle erillisessä viestissä.

Tuon sanaston keräämisen suhteen on kuitenkin viime aikoina tapahtunut 
tiettyjä asioita, joista teidän kaikkien olisi hyvä tietää. Olin itsekin 
keskiviikkona tuolla Open Source 2006 -tapahtumassa ja osallistuin siellä 
muutamaan keskusteluun joiden perusteella uskaltaisin tässä vaiheessa sanoa, 
että meillä on erittäinkin hyvä mahdollisuus saada käyttöömme jonkinasteinen 
valmis, laaja sanalista. Se on vielä epäselvää, olisiko tuo sanalista 
sellainen että se sisältäisi jo valmiiksi tiedot sanojen 
taivutusluokituksesta vai olisiko kyseessä vain puhdas lista sanoja 
perusmuodossaan ja kenties jonkinlainen "arvattu" taivutusluokitus. Toivon, 
että asia saadaan selvitettyä mahdollisimman nopeasti mutta en osaa sanoa 
tähän mitään aikataulua, sillä jotkin näistä kysymyksistä ovat melkoisen 
mutkikkaita. Teen kuitenkin kaikkeni prosessin nopeuttamiseksi, ja pidän 
teidät ajan tasalla siinä määrin kuin pystyn. Kuitenkin tämä asia kannattaa 
huomioida jo nyt, eli ihan tavallista perussanastoa ei tuonne 
sanastonkeruusovellukseen ehkä kannata syöttää. Hyödyllisempää on sen sijaan 
erikoisalojen sanaston kokoaminen, näitä emme todennäköisesti kuitenkaan saa 
mistään valmiina ja ne ovat hyödyllisiä jo nyt, joko Soikon rinnalla 
käytettynä tai yhdistettynä vanhoihin Myspell-sanastoihin. Kannattaa katsoa 
viime viikkoiset viestit tämän listan arkistosta tähän liittyen, mutta 
kertauksena sen verran että erikoisalojen sanastot pitää lähettää suoraan 
tälle listalle, niitä ei kerätä tuon www-sovelluksen avulla.

Toinen huomion arvoinen asia on se, että Jukka Nikulainen on julkaissut oman 
Myspell-yhteensopivan oikolukusanastonsa GPL-lisenssillä. Sanasto löytyy 
osoitteesta http://www.mv.helsinki.fi/home/jnikulai/projects/index.html
Tuo ei sinällään sovi oikolukusanastoksi koska sen avulla ei voi tunnistaa 
taivutettuja sanoja (affiksitiedosto puuttuu kokonaan) ja sanasto koostuu 
pääasiassa yhdyssanoista. Mutta sanaston keruun pohjana tuota voi käyttää 
vanhan Ispell-sanaston rinnalla. Lisäksi aion liittää tuon sanaston mukaan 
yhdistelmäsanastoon OpenOfficen Hunspell-oikolukukomponenttia varten niihin 
aikoihin kun OpenOfficen versio 2.0.2 julkaistaan, eli tämän kuun 
loppupuolella. Tuo versiohan sisältää Hunspellin, tosin ilman mitään suomen 
kielelle vaadittavia lisäominaisuuksia.

Palatakseni vielä tämän viestin alkuperäiseen aiheeseen, mielestäni tällä 
hetkellä hyödyllisintä tämän projektin edistämisen kannalta olisi tutustua 
sivuun http://www.hunspell-fi.org/johtimet.html ja täydentää sitä. Tähän 
löytyy vinkkejä viestiarkistosta viime marraskuulta. Itse pyrin tällä 
hetkellä kirjoittamaan uudelleen suuren osan syksyn aikana tekemistäni 
apuohjelmista jotta ne toimisivat vähän joustavammin johtimien käsittelyn 
kanssa. Kirjoitan edistymisestäni lisää ensi viikolla, mutta viime 
viikonlopun ja alkuviikon aikana olen muuntanut yli puolet vanhasta 
substantiiviluokituksesta toisenlaiseen muotoon (löytyy CVS:stä) ja loput 
valmistuvat ensi viikon aikana.

Lopuksi kiitokset kaikille, jotka ovat olleet mukana tässä projektissa. Tuolla 
Open Source 2006 -tapahtumassa OpenOffice.orgin suomennostiimille myönnettiin 
vuoden 2005 Linux-tekijä -palkinto, ja teidän työnne oli sielläkin vahvasti 
esillä useissa yhteyksissä.

Harri



More information about the devel mailing list