[voikko-devel] Sukija-0.9 ja Suomi-malaga-0.9.8 julkaistu

Hannu =?utf-8?Q?V=E4is=E4nen?= hvaisane at joyx.joensuu.fi
Tue Feb 20 07:13:48 EET 2007


Sukija on C++:lla kirjoitettu vapaa tiedostojen indeksointiohjelma
(ymmärtää myös LaTeX-tiedostoja), joka löytää sanat
taivutusmuotoineen.

Jos esimerkiksi etsii sanaa "antaa" ohjelma löytää taivutusmuodot:

anna annamme annan annapa annat annatte anneta annetaan annettaisiin
annettava annettavaa annettavana annettiin annettu annettuaan annetun
annetut annoimme annoin annoit annoitte antaa antaako antaakseen
antaessaan antaessani antaessanne antaisi antaisimme antaisin
antaisivat antakaa antakaamme antako antakoon antakoot antama antamaan
antamaani antamaansa antamalla antamansa antamasi antamatta antaneet
antanut antava antavat antoi antoivat


Mitä taivutusmuotoja löytyy, riippuu tietenkin siitä, mitä
taivutusmuotoja on ollut indeksoiduissa tiedostoissa.

Testiaineistona on ollut Uusi Testamentti, sillä se löytyi kätevästi
verkosta.


Suomi-malaga on Malaga-nimisellä ohjelmointikielellä kirjoitettu vapaa
suomen kielen muoto-opin kuvaus. Sitä käytetään myös suomen kielen
oikolukuohjelmassa Voikko.


http://joyds1.joensuu.fi/sukija/sukija.html
http://joyds1.joensuu.fi/suomi-malaga/suomi.html


Suorat linkit lähdekoodeihin:

http://joyds1.joensuu.fi/sukija/sukija-0.9.tar.bz2
http://joyds1.joensuu.fi/suomi-malaga/suomi-malaga-0.9.8.tar.bz2


Molemmat on julkaistu GNU General Public Licence -lisenssillä.



More information about the devel mailing list