[hunspell-fi-devel] Eräs esimerkki kielen käsittelystä
Harri Pitkänen
hatapitk at cc.jyu.fi
Thu Apr 20 18:10:38 EEST 2006
On Thursday 20 April 2006 17:35, Hannu Väisänen wrote:
> > Sen sijaan muunnos takaisin perusmuodosta taivutettuun muotoon ei taida
> > Malagalla onnistua, vaikkakaan en vielä tarkalleen ymmärrä miksi ja voiko
> > tämän jollakin tavalla korjata.
>
> Ei onnistu siksi, että malaga *jäsentää* sanoja, eikä generoi niitä.
Mietin lähinnä sitä, olisiko malagan ja suomi-malagan muuttamisessa siten,
että ne kykenisivät myös tähän (ainakin yksinkertaisissa tapauksissa) enemmän
vai vähemmän työtä kuin rakentaa vastaava ohjelma jotenkin muuten, kuten
vaikka alla ehdottamallasi tavalla. Luultavasti siinä voi olla aika paljon
työtä.
> > Periaatteessahan muunnos tähän suuntaan on
> > jopa yksinkertaisempi
>
> Joo, mutta jos haluat malagan generoivan sanoja, haluat itse
> asiassa ohjelmaa, joka sekä jäsentää että generoi sanoja.
Aivan näin.
> SFST osaisi, jos vain joku tekisi sille joutessaan Koskenniemen mallin. (-:
>
> SFST = Stuttgart Finite State Transducer.
Tiedän, että SFST kykenisi (ainakin teoriassa) tähän, asiaa on pohdittu jo
viime syksynä:
http://hunspell-fi.org/pipermail/devel_hunspell-fi.org/2005-November/000148.html
Mahdollisuus käyttää SFST:tä oli yksi syy muiden joukossa siihen, miksi
lopetin Hunspellin affiksitiedoston kirjoittamisen käsin ja kirjoittelin
tammi-helmikuussa skriptejä jotka loivat affiksitiedoston järjellisemmästä
lähtöformaatista. Nämä skriptit ja "taivutusmuototiedostot" ovat edelleen
toki olemassa jos joku tosiaan haluaa tuolla SFST:llä jotain puuhastella.
Keskeneräisiksihän ne jäivät, mutta kyllä niillä jotain pystyy tekemään.
Harri
More information about the devel
mailing list