Re: [hunspell-fi-devel] Perusmuodossa olevien sanojen kerääminen
Reijo Tomperi
reijo.tomperi at pp2.inet.fi
Fri Nov 4 17:39:58 EET 2005
Jori Mantysalo wrote:
>Ja toistan tässä kaikille erään ehdotukseni: tehdään WWW-sivun
>oikolukuautomaatti ja siihen mahdollisuus lisätä sanoja. Parhaimmillaan
>homma toimisi käyttäjälle hyvin helposti. Syötä 'http://www.foo.example',
>kone vastaa "sanat omenat ja kissatt ovat virheitä", jossa kunkin sanan
>
>
IMHO pelkkä textarea riittää hyvin syöttökentäksi. Turhaa kikkailua
lähteä lataamaan tekstejä webbisivuilta kun käyttäjä voi hyvin ne
copy-pastettaakin, ilman html-tageja ja mahdollisia ylimääräisiä sanoja.
Uskoisin että käyttäjille riittää hyvin tuollainen syöttömahdollisuus,
koska suurin kynnys on yleensä ohjelmien asentelussa omalle koneelle.
Mutta käyttäjä voi tuntea liian vaivalloiseksi sen, että joutuu sanan
perusmuodon lisäksi keksimään sanalle vielä oikean luokan
monivalintatehtävän avulla. Etenkin jos sanoja puuttuu useita. Ja
lisäksi tuossa liittymässäsi on se ongelma, että entä jos sana on jo
sanastossa, mutta jokin sen taivutusmuodoista ei mene läpi? Olisiko
parempi tehdä loppuvaiheessa liittymä jossa voi syöttää ihan vain sanat
jotka eivät mene läpi. Kehittäjät sitten katsovat onko sanaa ollenkaan,
ja jos on, miksi se ei taivu oikein.
Joka tapauksessa hajauttaisin tuon sanojen keräämisen, ehkä jopa viiteen
vaiheeseen:
1. Tunnistamattomien sanojen kerääminen
2. Perusmuodossa olevien sanojen kerääminen ja sanan ryhmitys
subst/adj/verbi/...
3. Sanan luokittelu
4. Sanan testaus
1. vaiheen jättäisin erilleen, koska se olisi hyvä laiskoille tai
osaamattomille käyttäjille, jotka silti mielellään haluaisivat
oikoluvusta paremman. Nämä voisivat käyttää esittelemääsi
käyttöliittymää johon syötetään teksti ja se listaa siinä olevat
virheelliset sanat. Näitä voisi sitten lisätä tietokantaan. Mitä
vähemmän työtä vaiheessa on, sitä helpompi siihen on saada tekijöitä.
2. vaiheen käyttäjät voisivat joko kirjoittaa sanoja omasta päästään tai
käyttää 1. vaiheen käyttäjien syöttämiä sanoja hyväkseen.
3. Oppineemmat käyttäjät + minä, voisivat sitten luokitella sanat joiden
perusmuoto löytyy jo. (tai käydä läpi 1. vaiheen listaa jos 2. vaiheen
listaus on tyhjä tai keksiä sanoja itse)
4. ... ja toimittaa ne Harrille tai mahdolliselle toiselle mestarille
testattavaksi.
Yksi kiva käyttöliittymä voisi olla sellainen missä valitaan vaikka
pudotuslistasta substantiivit ja tekstikenttään voi sitten syötellä
sanoja perusmuodossaan. Ohjelma sitten kertoo mitä sanoja ei tunnistettu
ja käyttäjä voi varmistaa että kirjoitti ne oikein ja lisätä sitten
tietokantaan tai korjata virheet ja testata uudestaan.
More information about the devel
mailing list