[voikko-devel] Historiallisen taivutusluokan selitys; Kotuksen sanalista
Hannu Väisänen
hvaisane at joyx.joensuu.fi
Mon Dec 18 07:32:31 EET 2006
On Fri, Dec 15, 2006 at 05:36:39PM +0200, Harri Pitkänen wrote:
> Tämä on vähän ongelmallinen. Ainakaan määritelmäksi se ei kelpaa, koska
> historiallista suomea ei puhuttu Nykysuomen sanakirjaa lukien :)
Entä jos kentän nimeksi vaihdetaan Nykysuomen sanakirjan mukainen
taivutus? (-: Sukija-version taivutus on sitten tämän ja nykyisen
taivutuksen unioni.
Mutta asiaan.
Me nähtävästi ajatellaan taivutusta eri tavalla. Minun mielestä
Nykysuomen sanakirjan taivutus on lähtökohta, josta tehdään muutokset
oikolukua varten, kun taas sinun mielestäsi sanojen nykyinen taivutus
on perusta, ja siitä tehdään muutokset tiedostojen indeksointia
varten.
Tuli muuten mieleen, että teen ohjelman, joka kääntää Kotuksen
sanalistan Suomi"-malagaksi ja katson, miten indeksointi sujuu sillä.
Yleisimpien kirjoitusvirheiden (esim. ammo(i)ttaa, kirjo(i)ttaa,
nuola(i)sta) tunnistamisen voisi ehkä hoitaa muutenkin kuin Malagan
koodissa. Vanhentuneet taivutusmuodot (kuollehitten) pitää kyllä
edelleen käsitellä Malagassa.
More information about the devel
mailing list