[voikko-devel] Oikoluvun laatu: tuotemerkit, yritysten nimet ja harvinaiset sanat
Harri Pitkänen
hatapitk at cc.jyu.fi
Wed Nov 1 14:52:11 EET 2006
On Wednesday 01 November 2006 14:22, Harri Pitkänen wrote:
> Siksipä aion tänään muuttaa sääntöjä niin, että erisnimiä ei enää käsitellä
> säännössä "combi_rule nimisana". Seikkasanat, lukusanat ja suhdessanat
> kokevat saman muutoksen joskus tulevaisuudessa. Käytännössä tämä tietysti
> johtaa siihen, että koska suomi.mor ei sisällä omaa sääntöä erisnimien
> käsittelyyn, erisnimiä ei hyväksytä SVN-versiossa ollenkaan ennen kuin
> niille on rakennettu omat sääntönsä. Tämä voi viedä tovin aikaa, en osaa
> vielä sanoa miten kauan koska en aikaisemmin ole näin suuria muutoksia
> säännöstöön tehnyt.
Korjaus tuli jo tehtyä, ja myös erisnimet näyttävät tunnistuvan oikein. Oman
testimateriaalini avulla en tuosta löytänyt virheitä, mutta niitä saattaa
olla. Jos huomaatte jotain outoa niin kertokaa. Ensisijalla ovat sellaiset
asiat, jotka toimivat oikein Voikon versiossa 1.1 mutta eivät toimi enää.
Mitä taas tulee harvinaisiin sanoihin, joista tämä keskustelu sai alkuna:
Jättäkää ne toistaiseksi laittamatta (Suomen kyliä ei esimerkiksi kannata
ryhtyä listaamaan). Voikon version 1.2 jälkeen voin lisätä Joukahaiseen
ominaisuuden, jolla sanoja voi luokitella niiden yleisyyden mukaan. Tätä
tietoa voi sitten eri tavoin hyödyntää oikolukusanastoa rakennettaessa.
Yhdistelmän erisnimi+genetiivi+{"tie", "katu"} hyväksyminen on kyllä hyvä
ajatus. Se on kuitenkin aivan uusi ominaisuus, enkä yritäkään saada sitä
vielä versioon 1.2 jota kohta pitäisi jo alkaa valmistelemaan julkaistavaksi.
Harri
More information about the devel
mailing list