[hunspell-fi-devel] Sanoja webbisivilta, joku on käynyt hedelmäosastolla
Harri Pitkänen
hatapitk at cc.jyu.fi
Thu Dec 1 22:09:30 EET 2005
On Thursday 01 December 2005 20:23, Reijo Tomperi wrote:
> Harri Pitkänen wrote:
> >Tähän kyllä voisi ajatella sellaistakin
> >automatiikkaa, että hf-testaa (tai mahdollisesti jokin uusi työkalu)
> >poistaisi nuo kyseiset sanat listatiedostosta, ja http-protokollan avulla
> >pyytäisi www-sovellusta myös merkitsemään samat sanat virheellisiksi. Jos
> >Reijo haluaa koodata tällaisen toiminnon www-sovellukseen, niin minä voin
> >kyllä vastaavan apuohjelman tehdä Pythonilla.
>
> Tarkoitat ilmeisesti, että python ohjelma ottaisi tuohon
> www-sovellukseen yhteyttä, ilmoittaisi sanat mitkä pitää poistaa ja
> sovellus sitten poistaisi sanat? Sinäkö sitä ajelisit sitten esim.
> sanaston päivityksen yhteydessä vai miten?
>
> Jos ymmärsin oikein, niin mitä tietoja tuo Python-sovellus
> www-sovellukselle lähettäisi ja mistä se nämä saisi?
Suunnilleen noin, paitsi että se skripti tulisi sinun ja Jarnon käyttöön. Eli
homma toimisi jotenkin tällä tavalla: teen skriptin, vaikkapa nimellä
hf-luokittele. Sitä käytettäisiin niin, että kun olette hakeneet
www-liittymästä sanalistan, ja tallentaneet sen vaikkapa
nimellä /tmp/fi_FI-oma.dic, annatte komennon
hf-luokittele /tmp/fi_FI-oma.dic
Tuo skripti kävisi ensin tiedoston läpi ja poistaisi sieltä kaikki sellaiset
sanat, jotka Hunspell jo tunnistaa ja samalla kerää muistiin listan näistä
sanoista. Tämän jälkeen se ottaisi yhteyttä palvelimen sovellukseen
lähettämällä POST-pyynnön, jonka tietosisältönä olisi esimerkiksi
ensimmäisellä rivillä käyttäjätunnus, toisella salasana (nämä voisivat olla
vaikkapa jossain tiedostossa tallessa) ja lopuille riveille tulee yksi
kerrallaan nämä poistettavat sanat. Palvelimen puolella sovellus tarkistaisi,
että käyttäjätunnus ja salasana kelpaavat, ja sitten merkitsisi
virheelliseksi kaikki lähetetyt sanat, kuitenkin vain jos ne olivat
varattuina kyseisellä käyttäjällä.
Sitten tuo hf-luokittele avaisi suosikkieditorinne, jossa saisitte lisätä
luokitukset lopuille sanoille. Jos tässä vaiheessa törmäisitte vielä
virheellisiin sanoihin, niin voitte laittaa niille luokaksi "virhe". Kun
olette tallentaneet muutokset ja sulkeneet editorin, hf-luokittele ajaisi
sanalistanne hf-luolistat -ohjelman läpi, ja mikäli tulee virheitä, näyttää
ne ja palauttaa teidät takaisin editoriin. Tätä sitten toistetaan siihen asti
kunnes lista hyväksytään. Sitten hf-luokittele etsii ja poistaa sieltä kaikki
sanat, joiden luokituksena on "virhe". Jos näitä löytyy, seuraa uusi
yhteydenotto palvelimeen, ja nämäkin sanat merkitään siellä virheelliseksi.
Ja tähän hf-luokittele sitten lopettaakin, ja teillä on käsissä valmis
sanalista lähetettäväksi postituslistalle. Tietysti on mahdollista jopa
lisätä tuohon hf-luokittele-skriptiin tämä sähköpostin lähetystoimintokin,
mutta ehkäpä mieluummin käytätte itse tavallista sähköpostiohjelmaa.
Tämä idea pohjautuu itse asiassa omaan skriptiini hf-lisaasanoja, jota en ole
missään julkaissut mutta jota käytän noiden sanalistojenne käsittelyssä
apuna. Se toimii oikeastaan aika lailla samalla tavalla, eli voin käyttää
sitä pohjana tuota uutta skriptiä tehdessä. Tämä minun skriptini poikkeaa
tuosta edellisestä oikeastaan vain sillä tavalla, että kun sanalista on
todettu kelvolliseksi, niin se antaa minulle mahdollisuuden tulostaa diffi
alkuperäisen ja lopullisen sanalistan välillä, huolehtii sanojen
tallentamisesta tietokantaan ja esittää lopuksi listan sanoista, jotka olivat
tietokannassa jo ennestään, jolloin voin vielä käydä poistamassa
virheellisesti kahteen kertaan lisätyt sanat. Minulla tämä skripti on todella
nopeuttanut sanalistojen käsittelyä (melkein 5 minuuttia vähemmän työtä
jokaista listaa kohti) joten ajattelin, että jos haluatte jotain tuontapaista
apuvälinettä itsellenne, niin voin kyllä sellaisen teille tehdä.
Voisi muuten olla myös hyödyllistä, että admin-oikeuksilla pystyisi
merkitsemään virheelliseksi muidenkin varaamia sanoja. Silloin voisin
sanalistoja tarkistaessa merkitä suoraan virheellisiksi sellaiset johdetut
sanat, joita ei kuuluisi sanastoon lisätä eikä teidän tarvitsisi niitä itse
enää poistella sieltä www-sovelluksesta.
Miten on, kuulostaako tämä sellaiselta, että se helpottaisi teidän työtänne?
Harri
More information about the devel
mailing list