[hunspell-fi-devel] Perusmuodossa olevien sanojen kerääminen

Reijo Tomperi reijo.tomperi at pp2.inet.fi
Sun Oct 30 01:42:32 EEST 2005


Tuli mieleen tälläinen idea sanojen keräämiseksi:

Idea lyhyesti:
Pistetään pystyyn yksinkertainen php-sivu, joka ottaa käyttäjältä 
vastaan sanoja perusmuodossa. Jos sanaa ei vielä ole olemassa 
kannassa/sanalistassa, se lisätään kantaan/sanalistaan. Tästä kerätystä 
listasta kehittäjät voivat sitten katsoa ja varata itselleen pätkän 
sanoja ja alkaa sitten pohtimaan niille taivutusluokitusta ja lähettää 
nämä sitten vaikka perinteistä reittiä eteenpäin.

Etuja tästä järjestelmästä:
- Varsin helppo ja nopea pystyttää (minä voin esim. tehdä sellaisen)
- Myös kielitaidottomat pystyisivät osallistumaan, koska lähes jokainen 
osaa kertoa sanan perusmuodon, joten kehittäjien määrä voisi kasvaa.
- Kielitaitoisilla ei kuluisi aikaa puuttuvien sanojen metsästykseen, 
jos joku toinen etsisi ne valmiiksi.
- Päällekkäisen työn vaara vähenisi, koska listoja päivitettäisiin 
reaaliajassa ja jokainen työstäisi vain varaamiaan sanoja.
- Jos kaikki uudet sanat viedään tuota kautta, ohjelma voi toimia täysin 
itsenäisesti omassa kannassaan/tiedostossaan ja pysyä silti aina 
ajantasalla (koska sillehän riittää että se tietää perusmuodot sanoista).
- Työ porrastuisi tämän lisävaiheen myötä ja siten työtä voisi tehdä 
projektin eteen entistä pienemmän ajan puutteissa ja entistä pienemmällä 
vaivalla -> ihmiset saattaisivat käyttää enemmän aikaa työskentelyyn.

Huonoja puolia:
- Mahdolliset häiriköt/taidottomat voisivat iskeä järjestelmään ja 
lisäillä epävalideja sanoja. (tallennuksen yhteydessä ehkä aihetta 
tallettaa jokin tieto myös lisääjästä ja lisäysajankohdasta, jotta 
tälläiset voi helposti poistaa).
- Nyt en taas tiedä näistä lakiasioista. Eli pitäisikö tuo 
sisäänkirjautuminen vaatia joka tapauksessa, että käyttäjiltä voi 
paremmin vaatia copyrightien kunnioittamista ja samalla täsmentää 
ohjeita sen suhteen minkälaisia sanoja sopii lisäillä. Tällöinhän 
samalla mahdollinen häirikköongelma poistuisi todennäköisesti kokonaan. 
Sisäänkirjautumisen kanssakin uusia käyttäjiä saattaisi löytyä, koska 
moni saattaa epäröidä projektiin liittymistä kielitaidottomuuteensa 
vedoten (itse ainakin epäröin pitkään juuri siksi).

Päätettäviä asioita:
- Pystytetäänkö ollenkaan vai ei.
- Sisäänkirjautuminen vai ei.
- Tietokanta vai tiedosto (tietokanta tietty parempi, jos palvelin 
sellaista tukee).


Kommentteja?



More information about the devel mailing list