[voikko-devel] [hunspell-fi-devel] Monikon -in-genetiivi / m:einä

Hannu Väisänen hvaisane at joyx.joensuu.fi
Mon Aug 14 07:23:35 EEST 2006


On Fri, Aug 11, 2006 at 09:16:12PM +0300, Teemu Likonen wrote:
> Palautui taas mieleen tämä hieman liian väljä -in-genetiivin tunnistus. 
> Esimerkiksi
>   luku : lukuin
>   suku : sukuin
>   harppu : harppuin
> -muodot tunnistetaan, vaikka moiset taitavat olla ns. mahdottomia. 

Suomi-malagan taivutuskaavat on tehty Nykysuomen sanakirjan mukaan, ja
niissä on tällainen muoto monessa taivutustyypissä. Ratkaisu voisi
olla se, että Suomi-malagan Voikko-version taivutuskaavat otetaan
Suomen kielen perussanakirjasta eli jätetään monikon omanto -in pois
niistä taivutuskaavoista, joissa sitä ei ole Perussanakirjassa. (Tuo
ei ole ainoa sanakirjojen taivutuskaavojen ero.) Panenko työn alle?
Ratkaisu on tietysti taivutustyypeittäinen eikä sanoittainen. Jotkut
sanat kuuluvat eri sanakirjoissa eri taivutustyyppeihin, esim. tällä
listalla aiemmin mainittu abortti.


> Metrin lyhenne toimii samalla tavalla yksikössä, mutta monikossa täytyy 
> lisätä vielä "e", koska metri-sana loppuu i:hin:
> 
> m:eissä   "metreissä"
> m:eineen  "metreineen"
> m:einä    "metreinä"

Tämä ratkeaa sillä, että sanastoon lisätään päätteet "eissä",
"eineen", "einä" jne, ja lisätään sääntö, että tällaiset päätteet
voivat olla vain kaksoispisteen jäljessä. Indeksoinnissa asia on
hoidettu niin, että kaksoispiste ja sen jäljessä olevat kirjaimet
poistetaan ja indeksoidaan vain kaksoispisteen edellä oleva merkkijono
"sanan" "perusmuotona" eli indeksointiohjelma ei tarkista, onko
lyhenteessä mitään järkeä. Tämä on tarpeeksi hyvä indeksointiin....



More information about the devel mailing list