[hunspell-fi-devel] Sanoja webbisivilta, joku on käynyt hedelmäosastolla

Harri Pitkänen hatapitk at cc.jyu.fi
Thu Dec 1 22:09:30 EET 2005


On Thursday 01 December 2005 20:23, Reijo Tomperi wrote:
> Harri Pitkänen wrote:
> >Tähän kyllä voisi ajatella sellaistakin
> >automatiikkaa, että hf-testaa (tai mahdollisesti jokin uusi työkalu)
> >poistaisi nuo kyseiset sanat listatiedostosta, ja http-protokollan avulla
> >pyytäisi www-sovellusta myös merkitsemään samat sanat virheellisiksi. Jos
> >Reijo haluaa koodata tällaisen toiminnon www-sovellukseen, niin minä voin
> >kyllä vastaavan apuohjelman tehdä Pythonilla.
>
> Tarkoitat ilmeisesti, että python ohjelma ottaisi tuohon
> www-sovellukseen yhteyttä, ilmoittaisi sanat mitkä pitää poistaa ja
> sovellus sitten poistaisi sanat? Sinäkö sitä ajelisit sitten esim.
> sanaston päivityksen yhteydessä vai miten?
>
> Jos ymmärsin oikein, niin mitä tietoja tuo Python-sovellus
> www-sovellukselle lähettäisi ja mistä se nämä saisi?

Suunnilleen noin, paitsi että se skripti tulisi sinun ja Jarnon käyttöön. Eli 
homma toimisi jotenkin tällä tavalla: teen skriptin, vaikkapa nimellä 
hf-luokittele. Sitä käytettäisiin niin, että kun olette hakeneet 
www-liittymästä sanalistan, ja tallentaneet sen vaikkapa 
nimellä /tmp/fi_FI-oma.dic, annatte komennon

hf-luokittele /tmp/fi_FI-oma.dic

Tuo skripti kävisi ensin tiedoston läpi ja poistaisi sieltä kaikki sellaiset 
sanat, jotka Hunspell jo tunnistaa ja samalla kerää muistiin listan näistä 
sanoista. Tämän jälkeen se ottaisi yhteyttä palvelimen sovellukseen 
lähettämällä POST-pyynnön, jonka tietosisältönä olisi esimerkiksi 
ensimmäisellä rivillä käyttäjätunnus, toisella salasana (nämä voisivat olla 
vaikkapa jossain tiedostossa tallessa) ja lopuille riveille tulee yksi 
kerrallaan nämä poistettavat sanat. Palvelimen puolella sovellus tarkistaisi, 
että käyttäjätunnus ja salasana kelpaavat, ja sitten merkitsisi 
virheelliseksi kaikki lähetetyt sanat, kuitenkin vain jos ne olivat 
varattuina kyseisellä käyttäjällä.
Sitten tuo hf-luokittele avaisi suosikkieditorinne, jossa saisitte lisätä 
luokitukset lopuille sanoille. Jos tässä vaiheessa törmäisitte vielä 
virheellisiin sanoihin, niin voitte laittaa niille luokaksi "virhe". Kun 
olette tallentaneet muutokset ja sulkeneet editorin, hf-luokittele ajaisi 
sanalistanne hf-luolistat -ohjelman läpi, ja mikäli tulee virheitä, näyttää 
ne ja palauttaa teidät takaisin editoriin. Tätä sitten toistetaan siihen asti 
kunnes lista hyväksytään. Sitten hf-luokittele etsii ja poistaa sieltä kaikki 
sanat, joiden luokituksena on "virhe". Jos näitä löytyy, seuraa uusi 
yhteydenotto palvelimeen, ja nämäkin sanat merkitään siellä virheelliseksi. 
Ja tähän hf-luokittele sitten lopettaakin, ja teillä on käsissä valmis 
sanalista lähetettäväksi postituslistalle. Tietysti on mahdollista jopa 
lisätä tuohon hf-luokittele-skriptiin tämä sähköpostin lähetystoimintokin, 
mutta ehkäpä mieluummin käytätte itse tavallista sähköpostiohjelmaa.

Tämä idea pohjautuu itse asiassa omaan skriptiini hf-lisaasanoja, jota en ole 
missään julkaissut mutta jota käytän noiden sanalistojenne käsittelyssä 
apuna. Se toimii oikeastaan aika lailla samalla tavalla, eli voin käyttää 
sitä pohjana tuota uutta skriptiä tehdessä. Tämä minun skriptini poikkeaa 
tuosta edellisestä oikeastaan vain sillä tavalla, että kun sanalista on 
todettu kelvolliseksi, niin se antaa minulle mahdollisuuden tulostaa diffi 
alkuperäisen ja lopullisen sanalistan välillä, huolehtii sanojen 
tallentamisesta tietokantaan ja esittää lopuksi listan sanoista, jotka olivat 
tietokannassa jo ennestään, jolloin voin vielä käydä poistamassa 
virheellisesti kahteen kertaan lisätyt sanat. Minulla tämä skripti on todella 
nopeuttanut sanalistojen käsittelyä (melkein 5 minuuttia vähemmän työtä 
jokaista listaa kohti) joten ajattelin, että jos haluatte jotain tuontapaista 
apuvälinettä itsellenne, niin voin kyllä sellaisen teille tehdä.

Voisi muuten olla myös hyödyllistä, että admin-oikeuksilla pystyisi 
merkitsemään virheelliseksi muidenkin varaamia sanoja. Silloin voisin 
sanalistoja tarkistaessa merkitä suoraan virheellisiksi sellaiset johdetut 
sanat, joita ei kuuluisi sanastoon lisätä eikä teidän tarvitsisi niitä itse 
enää poistella sieltä www-sovelluksesta.

Miten on, kuulostaako tämä sellaiselta, että se helpottaisi teidän työtänne?

Harri



More information about the devel mailing list