[hunspell-fi-devel] Sukija - suomen kieltä ymmärtävä indeksointiohjelma, versio 0.1

Hannu Väisänen hvaisane at joyx.joensuu.fi
Mon Feb 20 07:20:58 EET 2006


On aika paljastaa suomen kielen taidottomuutensa kaikelle kansalle. (-:


Sukija on C++:lla kirjoitettu tekstitiedostojen indeksointiohjelma
(ymmärtää myös LaTeX-tiedostoja), joka löytää sanat
taivutusmuotoineen.

Jos esimerkiksi etsii sanaa ''antaa'', ohjelma löytää taivutusmuodot:

anna annamme annan annapa annat annatte anneta annetaan annettaisiin
annettava annettavaa annettavana annettiin annettu annettuaan annetun
annetut annoimme annoin annoit annoitte antaa antaako antaakseen
antaessaan antaessani antaessanne antaisi antaisimme antaisin
antaisivat antakaa antakaamme antako antakoon antakoot antama antamaan
antamaani antamaansa antamalla antamansa antamasi antamatta antaneet
antanut antava antavat antoi antoivat

Mitä taivutusmuotoja löytyy, riippuu tietenkin siitä, mitä
taivutusmuotoja on ollut indeksoiduissa tiedostoissa.

Testiaineistona on ollut Uusi Testamentti, sillä se löytyi kätevästi
verkosta.


Lisätietoja on sivulla http://joyds1.joensuu.fi/sukija/sukija.html



More information about the devel mailing list