[hunspell-fi-devel] Suomi-Malaga: muutamia testituloksia
Hannu Väisänen
hvaisane at joyx.joensuu.fi
Tue Feb 28 08:10:47 EET 2006
On Mon, Feb 27, 2006 at 05:10:00PM +0200, Harri Pitkänen wrote:
> > Indeksoitavissa tiedostoissa kirjoitetaan "hevos mies", "lois nainen",
> > "nais asia nainen", mutta tällaisia sanoja (hevos, lois, nais) on
> > luultavasti niin vähän, että niitten siirtämisestä eri tiedostoon ei
> > ole paljon vaivaa.
> Ei ehkä niinkään vähän...
Tarkoitin sanoja, jotka ovat väärin kirjoitettujen "yhdys sanojen" osina
niissä tiedostoissa, joita minä indeksoin. Niitä ei tule mieleen kuin
"hevos", "lois" ja "nais".
> > Miten siis kerromme malagalle, että "ohjelmalistata" on väärin, mutta
> > esim. "ohjelmalistaus" ja "tietokoneohjelmalistauksenikin" ja
> > "valokuvata" ja "valokuvaus" ovat oikein?
>
> Jos tämä on vaikeaa Malagassa, niin sen voi varmaan toteuttaa Malagan
> ulkopuolella oikolukukirjastossa tutkimalla Malagasta saatuja analyysejä.
> Tämäntapaista temppua olin valmistautunut Hunspellinkin kanssa käyttämään.
> Graafisten esitysten perusteellahan Malagan pitäisi pysytä tulostamaan
> sanalle "ohjelmalistata"
>
> 1: "ohjelma[nimisana]+listata[teonsana]+ta[tekijämuodot]"
> 2: "ohjelma[nimisana]+listata[teonsana]+ta[nimitavat]"
>
> ja sanalle "ohjelmalistaus"
>
> 1: "ohjelma[nimisana]+lista[teonsana]+us[teonsanan_johdos]"
>
> Ulkopuoliseen kirjastoon sitten koodataan säännöt, joiden perusteella
> nimisana+teonsana (mahdollisesti taivutettuna) on väärin, mutta
> nimisana+teonsana johdettuna on oikein.
Nyt pitää perua puheitaan homman vaikeudesta. Se on helppoa, jos
hylätään kaikki nimisana+teonsana = teonsana -yhdistelmät ja lisätään
sanastoon kaikki lailliset yhdistelmät (valokuvata). Tämän muutoksen
jälkeenkin voidaan hyväksyä kaikki nimisana+teonsana+teonsanan_johdos
-yhdistelmät.
More information about the devel
mailing list