[hunspell-fi-devel] Sukija, suomen kielt ymmrtv indeksointi- ja oikolukuohjelma, versio 0.2
Hannu Väisänen
hvaisane at joyx.joensuu.fi
Tue Feb 28 07:48:12 EET 2006
On Mon, Feb 27, 2006 at 04:40:56PM +0200, Harri Pitkänen wrote:
> Voisi muuten olla parempi linkittää suoraan osoitteeseen
> http://www.hunspell-fi.org/malaga/
Muutetaan seuraavaan versioon.
> Tuossahan oli kyse vain väärästä vokaalityypistä taivutuspäätteissä.
> Hunspell-fi -sanastossa nämä päätellään koneellisesti algoritmilla, jonka
> kirjoitin Nykysuomen käsikirjassa esitettyjen sääntöjen pohjalta.
Ai, onko semmoinen algoritmi olemassa? (-:
> Ehkäpä kannattaisi joskus ajaa sanaston sanat läpi tästä
> algoritmista ja katsoa, löytyykö eroavaisuuksia. Tämä olisi hyvä testi sekä
> algoritmille että sanastolle, ideaalitapauksessa eroja ei saisi löytyä.
Hyvä idea.
> Mietin myös, että voisiko tuon alku-kentän sisällön myös generoida
> automaattisesti jollakin tavalla vai sisältääkö se jotain informaatiota joka
> on pääteltävä tapauskohtaisesti?
Malagassa? Malaga käsittelee merkkijonoja vasemmalta oikealle...
tak i n
tak ke ja mme
<alku> + <astevaihtelu> + <sijapääte> + <omistusliite>
=======================
Vartalo, joka generoidaan suomi.all -tiedostossa.
Malagan astevaihtelu ei siis ole ihan sama asia kuin suomen kieliopin
astevaihtelu.
More information about the devel
mailing list