[hunspell-fi-devel] Käyttäjätunnusta
Harri Pitkänen
hatapitk at cc.jyu.fi
Fri Feb 3 12:03:46 EET 2006
Hei!
On Thursday 02 February 2006 17:02, Jukka Jalava wrote:
> Hei,
>
> Kuulin Hunspell-fi:stä eilen Open Source 2006 -tapahtumassa ja haluan
> kantaa korteni kekoon.
> Loisitteko minulle siis tunnuksen, että pääsen kartuttamaan sanastoa.
Luon tunnuksen ja lähetän sen sinulle erillisessä viestissä.
Tuon sanaston keräämisen suhteen on kuitenkin viime aikoina tapahtunut
tiettyjä asioita, joista teidän kaikkien olisi hyvä tietää. Olin itsekin
keskiviikkona tuolla Open Source 2006 -tapahtumassa ja osallistuin siellä
muutamaan keskusteluun joiden perusteella uskaltaisin tässä vaiheessa sanoa,
että meillä on erittäinkin hyvä mahdollisuus saada käyttöömme jonkinasteinen
valmis, laaja sanalista. Se on vielä epäselvää, olisiko tuo sanalista
sellainen että se sisältäisi jo valmiiksi tiedot sanojen
taivutusluokituksesta vai olisiko kyseessä vain puhdas lista sanoja
perusmuodossaan ja kenties jonkinlainen "arvattu" taivutusluokitus. Toivon,
että asia saadaan selvitettyä mahdollisimman nopeasti mutta en osaa sanoa
tähän mitään aikataulua, sillä jotkin näistä kysymyksistä ovat melkoisen
mutkikkaita. Teen kuitenkin kaikkeni prosessin nopeuttamiseksi, ja pidän
teidät ajan tasalla siinä määrin kuin pystyn. Kuitenkin tämä asia kannattaa
huomioida jo nyt, eli ihan tavallista perussanastoa ei tuonne
sanastonkeruusovellukseen ehkä kannata syöttää. Hyödyllisempää on sen sijaan
erikoisalojen sanaston kokoaminen, näitä emme todennäköisesti kuitenkaan saa
mistään valmiina ja ne ovat hyödyllisiä jo nyt, joko Soikon rinnalla
käytettynä tai yhdistettynä vanhoihin Myspell-sanastoihin. Kannattaa katsoa
viime viikkoiset viestit tämän listan arkistosta tähän liittyen, mutta
kertauksena sen verran että erikoisalojen sanastot pitää lähettää suoraan
tälle listalle, niitä ei kerätä tuon www-sovelluksen avulla.
Toinen huomion arvoinen asia on se, että Jukka Nikulainen on julkaissut oman
Myspell-yhteensopivan oikolukusanastonsa GPL-lisenssillä. Sanasto löytyy
osoitteesta http://www.mv.helsinki.fi/home/jnikulai/projects/index.html
Tuo ei sinällään sovi oikolukusanastoksi koska sen avulla ei voi tunnistaa
taivutettuja sanoja (affiksitiedosto puuttuu kokonaan) ja sanasto koostuu
pääasiassa yhdyssanoista. Mutta sanaston keruun pohjana tuota voi käyttää
vanhan Ispell-sanaston rinnalla. Lisäksi aion liittää tuon sanaston mukaan
yhdistelmäsanastoon OpenOfficen Hunspell-oikolukukomponenttia varten niihin
aikoihin kun OpenOfficen versio 2.0.2 julkaistaan, eli tämän kuun
loppupuolella. Tuo versiohan sisältää Hunspellin, tosin ilman mitään suomen
kielelle vaadittavia lisäominaisuuksia.
Palatakseni vielä tämän viestin alkuperäiseen aiheeseen, mielestäni tällä
hetkellä hyödyllisintä tämän projektin edistämisen kannalta olisi tutustua
sivuun http://www.hunspell-fi.org/johtimet.html ja täydentää sitä. Tähän
löytyy vinkkejä viestiarkistosta viime marraskuulta. Itse pyrin tällä
hetkellä kirjoittamaan uudelleen suuren osan syksyn aikana tekemistäni
apuohjelmista jotta ne toimisivat vähän joustavammin johtimien käsittelyn
kanssa. Kirjoitan edistymisestäni lisää ensi viikolla, mutta viime
viikonlopun ja alkuviikon aikana olen muuntanut yli puolet vanhasta
substantiiviluokituksesta toisenlaiseen muotoon (löytyy CVS:stä) ja loput
valmistuvat ensi viikon aikana.
Lopuksi kiitokset kaikille, jotka ovat olleet mukana tässä projektissa. Tuolla
Open Source 2006 -tapahtumassa OpenOffice.orgin suomennostiimille myönnettiin
vuoden 2005 Linux-tekijä -palkinto, ja teidän työnne oli sielläkin vahvasti
esillä useissa yhteyksissä.
Harri
More information about the devel
mailing list