[voikko] Ufo / kotus-diff

Harri Pitkänen hatapitk at iki.fi
Thu Jan 10 14:21:17 EET 2008


On Thursday 10 January 2008, Teemu Likonen wrote:
> Olisi vielä pyyntö kaikille. Harri on tehnyt hienon kotus-diff-ohjelman,
> joka tarkistaa mahdolliset taivutusluokkien ja astevaihtelun erot
> Kotuksen sanaston ja Voikon sanaston välillä. Se jättää kuitenkin
> tarkistuksen tekemättä, jos Joukahaiseen on laitettu sanalle selitys
> tai yleisyysluokka. Tästä seuraa, että jos uusille sanoilla
> automaattisesti heittää suoraan jommankumman edellisistä kentistä, ei
> taivutusluokka voida koskaan tarkistaa ja verrata kotus-diffillä. Olisi
> mukavaa, jos sanan lisääjä itse varmistaisi, että taivutusluokka on
> todella oikein.
>
> En minä ongelmia ole havainnut tässä asiassa, kunhan muistutan
> kotus-diffin luonteesta. :)

Oikeastaan kotus-diffiä voisi tässä vaiheessa korjatakin niin, että selityksen 
tai yleisyysluokan laittaminen estäisi pelkästään 'Vain 
Joukahaisessa'-virheen näyttämisen, ei taivutusluokkien erojen näyttämistä.

En enää muista varmasti, miten olin tämän asian alunperin ajatellut. Mutta 
taisi olla niin, että tämä toiminto tehtiin sen takia, että jos Joukahaiseen 
lisäsi jonkun modernin tai muuten erikoisemman sanan, sen saattoi "vahvistaa" 
oikeaksi pelkästään lisäämällä sille selityksen. Tällä hetkellä en keksi 
syytä, miksi sen tarvitsisi vaikuttaa taivutusluokkien vertailuun (muuten 
kuin siksi, että toteutus Python-koodissa on tällä tavalla yksinkertaisempi).

Lisäksi voisi olla hyvä erotella jatkossa tiedostossa kotus-diff-ignore.txt 
erilliseen kappaleeseen ne sanat, joissa taivutusluokka poikkeaa Kotuksen ja 
Joukahaisen välillä. Tai vaihtoehtoisesti sanan loppuun voi laittaa kommentin 
kertomaan, miksi kyseinen sana on listalle laitettu. Tästä tiedosta voi 
myöhemmin olla apua, jos haluamme muuttaa kotus-diffin toimintaa.

Harri



More information about the voikko mailing list