Re: [hunspell-fi-devel] Perusmuodossa olevien sanojen kerääminen

Reijo Tomperi reijo.tomperi at pp2.inet.fi
Fri Nov 4 17:39:58 EET 2005


Jori Mantysalo wrote:

>Ja toistan tässä kaikille erään ehdotukseni: tehdään WWW-sivun
>oikolukuautomaatti ja siihen mahdollisuus lisätä sanoja. Parhaimmillaan
>homma toimisi käyttäjälle hyvin helposti. Syötä 'http://www.foo.example',
>kone vastaa "sanat omenat ja kissatt ovat virheitä", jossa kunkin sanan
>  
>
IMHO pelkkä textarea riittää hyvin syöttökentäksi. Turhaa kikkailua 
lähteä lataamaan tekstejä webbisivuilta kun käyttäjä voi hyvin ne 
copy-pastettaakin, ilman html-tageja ja mahdollisia ylimääräisiä sanoja. 
Uskoisin että käyttäjille riittää hyvin tuollainen syöttömahdollisuus, 
koska suurin kynnys on yleensä ohjelmien asentelussa omalle koneelle.

Mutta käyttäjä voi tuntea liian vaivalloiseksi sen, että joutuu sanan 
perusmuodon lisäksi keksimään sanalle vielä oikean luokan 
monivalintatehtävän avulla. Etenkin jos sanoja puuttuu useita. Ja 
lisäksi tuossa liittymässäsi on se ongelma, että entä jos sana on jo 
sanastossa, mutta jokin sen taivutusmuodoista ei mene läpi? Olisiko 
parempi tehdä loppuvaiheessa liittymä jossa voi syöttää ihan vain sanat 
jotka eivät mene läpi. Kehittäjät sitten katsovat onko sanaa ollenkaan, 
ja jos on, miksi se ei taivu oikein.

Joka tapauksessa hajauttaisin tuon sanojen keräämisen, ehkä jopa viiteen 
vaiheeseen:
1. Tunnistamattomien sanojen kerääminen
2. Perusmuodossa olevien sanojen kerääminen ja sanan ryhmitys 
subst/adj/verbi/...
3. Sanan luokittelu
4. Sanan testaus

1. vaiheen jättäisin erilleen, koska se olisi hyvä laiskoille tai 
osaamattomille käyttäjille, jotka silti mielellään haluaisivat 
oikoluvusta paremman. Nämä voisivat käyttää esittelemääsi 
käyttöliittymää johon syötetään teksti ja se listaa siinä olevat 
virheelliset sanat. Näitä voisi sitten lisätä tietokantaan. Mitä 
vähemmän työtä vaiheessa on, sitä helpompi siihen on saada tekijöitä.
2. vaiheen käyttäjät voisivat joko kirjoittaa sanoja omasta päästään tai 
käyttää 1. vaiheen käyttäjien syöttämiä sanoja hyväkseen.
3. Oppineemmat käyttäjät + minä, voisivat sitten luokitella sanat joiden 
perusmuoto löytyy jo. (tai käydä läpi 1. vaiheen listaa jos 2. vaiheen 
listaus on tyhjä tai keksiä sanoja itse)
4. ... ja toimittaa ne Harrille tai mahdolliselle toiselle mestarille 
testattavaksi.

Yksi kiva käyttöliittymä voisi olla sellainen missä valitaan vaikka 
pudotuslistasta substantiivit ja tekstikenttään voi sitten syötellä 
sanoja perusmuodossaan. Ohjelma sitten kertoo mitä sanoja ei tunnistettu 
ja käyttäjä voi varmistaa että kirjoitti ne oikein ja lisätä sitten 
tietokantaan tai korjata virheet ja testata uudestaan.



More information about the devel mailing list