[hunspell-fi-devel] Sukija, suomen kielt ymmrtv indeksointi- ja oikolukuohjelma, versio 0.2

Hannu Väisänen hvaisane at joyx.joensuu.fi
Tue Feb 28 07:48:12 EET 2006


On Mon, Feb 27, 2006 at 04:40:56PM +0200, Harri Pitkänen wrote:
> Voisi muuten olla parempi linkittää suoraan osoitteeseen 
> http://www.hunspell-fi.org/malaga/

Muutetaan seuraavaan versioon.


> Tuossahan oli kyse vain väärästä vokaalityypistä taivutuspäätteissä. 
> Hunspell-fi -sanastossa nämä päätellään koneellisesti algoritmilla, jonka 
> kirjoitin Nykysuomen käsikirjassa esitettyjen sääntöjen pohjalta. 

Ai, onko semmoinen algoritmi olemassa? (-:


> Ehkäpä kannattaisi joskus ajaa sanaston sanat läpi tästä 
> algoritmista ja katsoa, löytyykö eroavaisuuksia. Tämä olisi hyvä testi sekä 
> algoritmille että sanastolle, ideaalitapauksessa eroja ei saisi löytyä.

Hyvä idea.



> Mietin myös, että voisiko tuon alku-kentän sisällön myös generoida 
> automaattisesti jollakin tavalla vai sisältääkö se jotain informaatiota joka 
> on pääteltävä tapauskohtaisesti?

Malagassa? Malaga käsittelee merkkijonoja vasemmalta oikealle...

tak      i                n
tak      ke               ja            mme
<alku> + <astevaihtelu> + <sijapääte> + <omistusliite>
=======================
Vartalo, joka generoidaan suomi.all -tiedostossa.

Malagan astevaihtelu ei siis ole ihan sama asia kuin suomen kieliopin
astevaihtelu.



More information about the devel mailing list