[hunspell-fi-devel] Suomi-Malaga: muutamia testituloksia

Hannu Väisänen hvaisane at joyx.joensuu.fi
Tue Feb 28 08:10:47 EET 2006


On Mon, Feb 27, 2006 at 05:10:00PM +0200, Harri Pitkänen wrote:
> > Indeksoitavissa tiedostoissa kirjoitetaan "hevos mies", "lois nainen",
> > "nais asia nainen", mutta tällaisia sanoja (hevos, lois, nais) on
> > luultavasti niin vähän, että niitten siirtämisestä eri tiedostoon ei
> > ole paljon vaivaa.
> Ei ehkä niinkään vähän...

Tarkoitin sanoja, jotka ovat väärin kirjoitettujen "yhdys sanojen" osina
niissä tiedostoissa, joita minä indeksoin. Niitä ei tule mieleen kuin
"hevos", "lois" ja "nais".



> > Miten siis kerromme malagalle, että "ohjelmalistata" on väärin, mutta
> > esim. "ohjelmalistaus" ja "tietokoneohjelmalistauksenikin" ja
> > "valokuvata" ja "valokuvaus" ovat oikein?
> 
> Jos tämä on vaikeaa Malagassa, niin sen voi varmaan toteuttaa Malagan 
> ulkopuolella oikolukukirjastossa tutkimalla Malagasta saatuja analyysejä. 
> Tämäntapaista temppua olin valmistautunut Hunspellinkin kanssa käyttämään. 
> Graafisten esitysten perusteellahan Malagan pitäisi pysytä tulostamaan 
> sanalle "ohjelmalistata"
> 
> 1: "ohjelma[nimisana]+listata[teonsana]+ta[tekijämuodot]"
> 2: "ohjelma[nimisana]+listata[teonsana]+ta[nimitavat]"
> 
> ja sanalle "ohjelmalistaus"
> 
> 1: "ohjelma[nimisana]+lista[teonsana]+us[teonsanan_johdos]"
> 
> Ulkopuoliseen kirjastoon sitten koodataan säännöt, joiden perusteella 
> nimisana+teonsana (mahdollisesti taivutettuna) on väärin, mutta 
> nimisana+teonsana johdettuna on oikein.

Nyt pitää perua puheitaan homman vaikeudesta. Se on helppoa, jos
hylätään kaikki nimisana+teonsana = teonsana -yhdistelmät ja lisätään
sanastoon kaikki lailliset yhdistelmät (valokuvata). Tämän muutoksen
jälkeenkin voidaan hyväksyä kaikki nimisana+teonsana+teonsanan_johdos
-yhdistelmät.



More information about the devel mailing list