[voikko] toistakymmentä , kolmattasataa
Harri Pitkänen
hatapitk at iki.fi
Wed Feb 24 21:03:19 EET 2010
On Wednesday 24 February 2010, Teemu Likonen wrote:
> Sellainen merkittävä puute oikolukusanastossa vielä on, että
> "toistakymmentä" (10 - 20) ja "kolmattasataa" (200 - 300) -tyyliset
> sanat eivät tunnistu. Muoto-opillisesti kyseessä on järjestysluvun
> partitiivin (kolma/t/ta) ja perusluvun partitiivin yhdistelmä
> (kymmen/tä). Näitä ei ole käytössä kovin paljon, joten ne voi varsin
> pienellä vaivalla lisätä vaikka erillisinä sanoina.
>
> Minä voin sanat lisätä, mutta sitä ennen kysyn, saatko Harri tai Hannu
> lisättyä näitä jollakin ns. älykkäämmällä tavalla eli Malagan kieliopin
> säädöllä?
Sanoisin, että jos lisättäviä sanoja on alle 50, voi olla helpompaa (ja
tehokkuuden kannalta parempi) lisätä ne sanastoon erillisinä sanoina.
Lisäykset kannattaa laittaa omana ryhmänään tiedostoon lukusanat.lex, jotta ne
voi helposti jättää pois, jos ominaisuus saadaan toteutettua tulevaisuudessa
järkevämmin esim. HFST:n avulla.
Jos lisäyksiä tulisi enemmän kuin 50 riviä, niin sitten tutkisin mieluusti
vaihtoehtoista toteutustapaa ennen kuin lähdemme lisäämään erillisiä sanoja.
Harri
More information about the voikko
mailing list