[voikko] tmispell, kyselen tyhmiä
Harri Pitkänen
hatapitk at iki.fi
Fri Sep 4 16:47:17 EEST 2009
On Friday 04 September 2009, Tuomas Salo wrote:
> Voisikohan, noin ainakin periaatteessa, sanojen lisäämiseen olla
> käyttöliittymä, jossa käyttäjää ensin pyydetään syöttämään lisättävä
> sana perusmuodossaan (esimerkit nominille ja verbille) ja ehkä
> sanaluokka jos tarpeen, minkä jälkeen käyttöliittymä pyytäisi
> valitsemaan taivutusluokan näyttämällä sana oleellisimmissa muodoissa
> valmiiksi taivutettuna. Taivutusluokkia ehdotettaisiin syötetyn sanan
> muotoon perustuen (esim. nen-loppuisuus rajaa aika vahvasti) ja
> taivutusluokkien yleisyysjärjestyksessä.
Sanojen lisääminen Joukahaiseen toimii lähes täsmälleen tuolla tavalla, joten
tämä käyttöliittymä on siis jo olemassa. Vastaavan lokaalisti toimivan GUI-
työkalun liittäminen suoraan oikolukuohjelmaan olisi toki mielenkiintoista,
mutta käytännössä hirvittävän työlästä.
Täysin mahdollista olisi kyllä toteuttaa Joukahaiseen www-pohjainen
sanastoautomaatti, jonne kuka tahansa voisi luoda käyttäjätunnuksen. Noilla
tunnuksilla pääsisi sitten käyttämään Joukahaisessa nykyäänkin olevia
työkaluja sanojen lisäämiseen, mutta sanat eivät päätyisi (ainakaan
normaalissa tapauksessa) julkiseen sanastoon, vaan ne näytettäisiin vain sanan
lisänneelle henkilölle. Valmiin sanaston generointikin voidaan tällöin tehdä
palvelimella.
> Lisäksi voisi tietysti olla
> rasti "ehdota yleiseen sanastoon", joka lähettäisi ehdotuksen
> Joukahaiseen, ehkä vapaavalintaisen kommenttikentän saattelemana.
Käytännössä nämä vapaavalintaiset kommentit ovat tässä tapauksessa
oleellisemmat, sillä lisättäessä sanaa yleiseen sanastoon ei käyttäjien
tekemään luokitteluun juurikaan kannata luottaa (tästä meillä on kokemusta
muutaman vuoden takaa).
> Ylipäänsä olisi sanaston kehittämisen kannalta mielenkiintoista, jos
> oikoluku voisi käyttäjän suostumuksella lähettää myös jotain
> statistiikkatietoja Joukahaiseen, esim. yleisimmät hylätyt sanat.
> Mutta tämä on kyllä aika vaikea juttu, koska hylkäyslista sisältää
> erisnimiä ja kaikkea muuta potentiaalisesti hyvin yksityisluontoista.
> Ei siis ehkä toimisi.
Tämä pitäisi luultavasti toteuttaa sovelluskohtaisesti, jotta saataisiin ulos
järkevää tietoa. Jotain tämän suuntaista on jo OpenOffice.orgille tehtykin:
http://extensions.services.openoffice.org/project/Linguist
Harri
More information about the voikko
mailing list