[voikko-devel] *allaoleva, *ylläoleva , *mukanaoleva

Harri Pitkänen hatapitk at cc.jyu.fi
Thu Oct 5 23:37:29 EEST 2006


On Monday 02 October 2006 23:36, Teemu Likonen wrote:
> Harri Pitkänen kirjoitti:
> > Ylläoleva luultavasti poistuu, jos poistat sanan
> > [perusmuoto: "yllä", alku: "yllä", luokka: etuliite, jatko: @sana2,
> > äs: aä];
> >
> > Mutta tämä poistaa käytännössä kaikki yllä-alkuiset etuliitteellä
> > muodostettavat sanat. Onko selvää, ettei näitä ole? Tosin
> > alla-etuliitettä ei ole ollut käytössä ennenkään, joten ehkä tämän
> > voi tehdä.
>
> Ainakin "ylläpito" ja "ylläpitää" jäävät tällöin pois. En keksi muita.
> Olisipa joku hieno korpustietokanta käsillä...

Unohdin mainita, että joissakin tilanteissa käyttökelpoisen 
tee-se-itse -korpuksen voi rakentaa esimerkiksi käyttämällä suomenkielisen 
Wikipedian materiaalia
http://download.wikimedia.org/fiwiki/latest/
tai European Parliament Proceedings Parallel Corpus 1996-2003 sisältöä
http://people.csail.mit.edu/koehn/publications/europarl/

Itse olen noista käyttänyt ainoastaan Wikipediaa, enkä mitenkään erityisen 
jalostetussa muodossa vaan pelkästään xml-dumpista tr-komennoilla 
suodattamalla. Mutta oikoluvun testaamiseen juuri sellaisissa tilanteissa, 
kun ei ole aivan varma jonkin muutoksen vaikutuksesta, se on toiminut ihan 
hyvin.

Harri



More information about the devel mailing list