[voikko-devel] Oikoluvun laatu: tuotemerkit, yritysten nimet ja harvinaiset sanat

Harri Pitkänen hatapitk at cc.jyu.fi
Wed Nov 1 14:52:11 EET 2006


On Wednesday 01 November 2006 14:22, Harri Pitkänen wrote:
> Siksipä aion tänään muuttaa sääntöjä niin, että erisnimiä ei enää käsitellä
> säännössä "combi_rule nimisana". Seikkasanat, lukusanat ja suhdessanat
> kokevat saman muutoksen joskus tulevaisuudessa. Käytännössä tämä tietysti
> johtaa siihen, että koska suomi.mor ei sisällä omaa sääntöä erisnimien
> käsittelyyn, erisnimiä ei hyväksytä SVN-versiossa ollenkaan ennen kuin
> niille on rakennettu omat sääntönsä. Tämä voi viedä tovin aikaa, en osaa
> vielä sanoa miten kauan koska en aikaisemmin ole näin suuria muutoksia
> säännöstöön tehnyt.

Korjaus tuli jo tehtyä, ja myös erisnimet näyttävät tunnistuvan oikein. Oman 
testimateriaalini avulla en tuosta löytänyt virheitä, mutta niitä saattaa 
olla. Jos huomaatte jotain outoa niin kertokaa. Ensisijalla ovat sellaiset 
asiat, jotka toimivat oikein Voikon versiossa 1.1 mutta eivät toimi enää.

Mitä taas tulee harvinaisiin sanoihin, joista tämä keskustelu sai alkuna: 
Jättäkää ne toistaiseksi laittamatta (Suomen kyliä ei esimerkiksi kannata 
ryhtyä listaamaan). Voikon version 1.2 jälkeen voin lisätä Joukahaiseen 
ominaisuuden, jolla sanoja voi luokitella niiden yleisyyden mukaan. Tätä 
tietoa voi sitten eri tavoin hyödyntää oikolukusanastoa rakennettaessa.

Yhdistelmän erisnimi+genetiivi+{"tie", "katu"} hyväksyminen on kyllä hyvä 
ajatus. Se on kuitenkin aivan uusi ominaisuus, enkä yritäkään saada sitä 
vielä versioon 1.2 jota kohta pitäisi jo alkaa valmistelemaan julkaistavaksi.

Harri



More information about the devel mailing list