[voikko] tmispell, kyselen tyhmiä

Harri Pitkänen hatapitk at iki.fi
Fri Sep 4 16:47:17 EEST 2009


On Friday 04 September 2009, Tuomas Salo wrote:
> Voisikohan, noin ainakin periaatteessa, sanojen lisäämiseen olla
> käyttöliittymä, jossa käyttäjää ensin pyydetään syöttämään lisättävä
> sana perusmuodossaan (esimerkit nominille ja verbille) ja ehkä
> sanaluokka jos tarpeen, minkä jälkeen käyttöliittymä pyytäisi
> valitsemaan taivutusluokan näyttämällä sana oleellisimmissa muodoissa
> valmiiksi taivutettuna. Taivutusluokkia ehdotettaisiin syötetyn sanan
> muotoon perustuen (esim. nen-loppuisuus rajaa aika vahvasti) ja
> taivutusluokkien yleisyysjärjestyksessä.

Sanojen lisääminen Joukahaiseen toimii lähes täsmälleen tuolla tavalla, joten 
tämä käyttöliittymä on siis jo olemassa. Vastaavan lokaalisti toimivan GUI-
työkalun liittäminen suoraan oikolukuohjelmaan olisi toki mielenkiintoista, 
mutta käytännössä hirvittävän työlästä.

Täysin mahdollista olisi kyllä toteuttaa Joukahaiseen www-pohjainen 
sanastoautomaatti, jonne kuka tahansa voisi luoda käyttäjätunnuksen. Noilla 
tunnuksilla pääsisi sitten käyttämään Joukahaisessa nykyäänkin olevia 
työkaluja sanojen lisäämiseen, mutta sanat eivät päätyisi (ainakaan 
normaalissa tapauksessa) julkiseen sanastoon, vaan ne näytettäisiin vain sanan 
lisänneelle henkilölle. Valmiin sanaston generointikin voidaan tällöin tehdä 
palvelimella.

> Lisäksi voisi tietysti olla
> rasti "ehdota yleiseen sanastoon", joka lähettäisi ehdotuksen
> Joukahaiseen, ehkä vapaavalintaisen kommenttikentän saattelemana.

Käytännössä nämä vapaavalintaiset kommentit ovat tässä tapauksessa 
oleellisemmat, sillä lisättäessä sanaa yleiseen sanastoon ei käyttäjien 
tekemään luokitteluun juurikaan kannata luottaa (tästä meillä on kokemusta 
muutaman vuoden takaa).

> Ylipäänsä olisi sanaston kehittämisen kannalta mielenkiintoista, jos
> oikoluku voisi käyttäjän suostumuksella lähettää myös jotain
> statistiikkatietoja Joukahaiseen, esim. yleisimmät hylätyt sanat.
> Mutta tämä on kyllä aika vaikea juttu, koska hylkäyslista sisältää
> erisnimiä ja kaikkea muuta potentiaalisesti hyvin yksityisluontoista.
> Ei siis ehkä toimisi.

Tämä pitäisi luultavasti toteuttaa sovelluskohtaisesti, jotta saataisiin ulos 
järkevää tietoa. Jotain tämän suuntaista on jo OpenOffice.orgille tehtykin:
  http://extensions.services.openoffice.org/project/Linguist

Harri



More information about the voikko mailing list