[hunspell-fi-devel] Eräs esimerkki kielen käsittelystä

Harri Pitkänen hatapitk at cc.jyu.fi
Thu Apr 20 18:10:38 EEST 2006


On Thursday 20 April 2006 17:35, Hannu Väisänen wrote:
> > Sen sijaan muunnos takaisin perusmuodosta taivutettuun muotoon ei taida
> > Malagalla onnistua, vaikkakaan en vielä tarkalleen ymmärrä miksi ja voiko
> > tämän jollakin tavalla korjata.
>
> Ei onnistu siksi, että malaga *jäsentää* sanoja, eikä generoi niitä.

Mietin lähinnä sitä, olisiko malagan ja suomi-malagan muuttamisessa siten, 
että ne kykenisivät myös tähän (ainakin yksinkertaisissa tapauksissa) enemmän 
vai vähemmän työtä kuin rakentaa vastaava ohjelma jotenkin muuten, kuten 
vaikka alla ehdottamallasi tavalla. Luultavasti siinä voi olla aika paljon 
työtä.

> > Periaatteessahan muunnos tähän suuntaan on
> > jopa yksinkertaisempi
>
> Joo, mutta jos haluat malagan generoivan sanoja, haluat itse
> asiassa ohjelmaa, joka sekä jäsentää että generoi sanoja.

Aivan näin.

> SFST osaisi, jos vain joku tekisi sille joutessaan Koskenniemen mallin. (-:
>
> SFST = Stuttgart Finite State Transducer.

Tiedän, että SFST kykenisi (ainakin teoriassa) tähän, asiaa on pohdittu jo 
viime syksynä:
http://hunspell-fi.org/pipermail/devel_hunspell-fi.org/2005-November/000148.html

Mahdollisuus käyttää SFST:tä oli yksi syy muiden joukossa siihen, miksi 
lopetin Hunspellin affiksitiedoston kirjoittamisen käsin ja kirjoittelin 
tammi-helmikuussa skriptejä jotka loivat affiksitiedoston järjellisemmästä 
lähtöformaatista. Nämä skriptit ja "taivutusmuototiedostot" ovat edelleen 
toki olemassa jos joku tosiaan haluaa tuolla SFST:llä jotain puuhastella. 
Keskeneräisiksihän ne jäivät, mutta kyllä niillä jotain pystyy tekemään.

Harri



More information about the devel mailing list