[hunspell-fi-devel] Perusmuodossa olevien sanojen kerääminen
Reijo Tomperi
reijo.tomperi at pp2.inet.fi
Sun Oct 30 01:42:32 EEST 2005
Tuli mieleen tälläinen idea sanojen keräämiseksi:
Idea lyhyesti:
Pistetään pystyyn yksinkertainen php-sivu, joka ottaa käyttäjältä
vastaan sanoja perusmuodossa. Jos sanaa ei vielä ole olemassa
kannassa/sanalistassa, se lisätään kantaan/sanalistaan. Tästä kerätystä
listasta kehittäjät voivat sitten katsoa ja varata itselleen pätkän
sanoja ja alkaa sitten pohtimaan niille taivutusluokitusta ja lähettää
nämä sitten vaikka perinteistä reittiä eteenpäin.
Etuja tästä järjestelmästä:
- Varsin helppo ja nopea pystyttää (minä voin esim. tehdä sellaisen)
- Myös kielitaidottomat pystyisivät osallistumaan, koska lähes jokainen
osaa kertoa sanan perusmuodon, joten kehittäjien määrä voisi kasvaa.
- Kielitaitoisilla ei kuluisi aikaa puuttuvien sanojen metsästykseen,
jos joku toinen etsisi ne valmiiksi.
- Päällekkäisen työn vaara vähenisi, koska listoja päivitettäisiin
reaaliajassa ja jokainen työstäisi vain varaamiaan sanoja.
- Jos kaikki uudet sanat viedään tuota kautta, ohjelma voi toimia täysin
itsenäisesti omassa kannassaan/tiedostossaan ja pysyä silti aina
ajantasalla (koska sillehän riittää että se tietää perusmuodot sanoista).
- Työ porrastuisi tämän lisävaiheen myötä ja siten työtä voisi tehdä
projektin eteen entistä pienemmän ajan puutteissa ja entistä pienemmällä
vaivalla -> ihmiset saattaisivat käyttää enemmän aikaa työskentelyyn.
Huonoja puolia:
- Mahdolliset häiriköt/taidottomat voisivat iskeä järjestelmään ja
lisäillä epävalideja sanoja. (tallennuksen yhteydessä ehkä aihetta
tallettaa jokin tieto myös lisääjästä ja lisäysajankohdasta, jotta
tälläiset voi helposti poistaa).
- Nyt en taas tiedä näistä lakiasioista. Eli pitäisikö tuo
sisäänkirjautuminen vaatia joka tapauksessa, että käyttäjiltä voi
paremmin vaatia copyrightien kunnioittamista ja samalla täsmentää
ohjeita sen suhteen minkälaisia sanoja sopii lisäillä. Tällöinhän
samalla mahdollinen häirikköongelma poistuisi todennäköisesti kokonaan.
Sisäänkirjautumisen kanssakin uusia käyttäjiä saattaisi löytyä, koska
moni saattaa epäröidä projektiin liittymistä kielitaidottomuuteensa
vedoten (itse ainakin epäröin pitkään juuri siksi).
Päätettäviä asioita:
- Pystytetäänkö ollenkaan vai ei.
- Sisäänkirjautuminen vai ei.
- Tietokanta vai tiedosto (tietokanta tietty parempi, jos palvelin
sellaista tukee).
Kommentteja?
More information about the devel
mailing list