[hunspell-fi-devel] Suomi-Malagan optimointia

Hannu Väisänen hvaisane at joyx.joensuu.fi
Fri May 5 07:05:57 EEST 2006


On Sat, Apr 29, 2006 at 07:56:56PM +0300, Harri Pitkänen wrote:
> - Poistettu pari ei-kirjakielistä sanaa ja sana "iätä" (josta en tiedä mitä se 
> tarkoittaa).

Määrittää ikä.


> Hannu kysyi myös, miksi sanastoon ei voi saman tien laittaa kaikkia sanoja. 

> Tietysti tästä laajemmasta sanalistasta sitten valitsemme 
> tiettyjen hakuehtojen mukaan ne sanat, jotka otamme oletusarvoisesti mukaan 
> oikolukusanastoon, mutta käyttäjille (ja tässä tapauksessa käyttäjällä ei 
> tarkoiteta tavallista tekstinkäsittelyohjelman käyttäjää) pitää jättää 
> mahdollisuus tehdä muita valintoja ilman, että heidä tarvitsee itse koota 
> alusta lähtien koko sanastoa.

Tarkoitukseni oli sanoa, että tällainen valinta voidaan tehdä
suomi-malagassa. Siis suomi-malagan lähdekoodiin kerätään "kaikki"
suomen kielen sanat ja luokitellaan ne eri tavoin (esim. voi/ei voi
olla yhdyssanan jälkiosana, harvinainen sana, LaTeX-komento, jonkin
erikoisalan sana jne) ja binaariversioitten (esim. voikon) tekijä voi
sitten valita, mitkä sanat ottaa mukaan. Esimerkin vuoksi
suomi-malagan seuraavaassa versiossa voikkobinaariin ei oteta LaTeXin
komentoja eikä murteelliseksi merkittyjä sanoja eikä taivutuksia
tyyppiä talos (talosi), tulis (tulisi).

Sanat voidaan valita muullakin tavalla esim. niin, että ei oteta
mukaan sanoja, joiden alku-kenttä on yhden merkin mittainen.



More information about the devel mailing list