[hunspell-fi-devel] Heittomerkit ja hattu-s:t
Harri Pitkänen
hatapitk at cc.jyu.fi
Thu Jan 19 09:06:51 EET 2006
On Thursday 19 January 2006 08:46, Tuomo Koistinen wrote:
> > Hmm. Tuohan muuten tarkoittaa sitä, että on vaihdettava iso-8859-1
> > -merkistöstä iso-8859-15 -merkistöön Hunspellin sisällä. No joo, ei ole
> > iso muutos. Korjailen tuon huomenna.
>
> Kaikkein paras olisi tietysti siirtyä Unicodeen.
Me käytämmekin UTF-8 -merkistöä kaikissa niissä tiedostoissa, joita editoidaan
suoraan, sekä myös tietokannoissa. Tämä on ollut ihan tietoinen valinta
tulevaisuuden tarpeita ajatellen. Mutta Hunspellin sisällä se olisi
äärimmäisen epäkäytännöllistä, koska vaihtuva merkin pituus tekee
hakualgoritmeista mutkikkaampia ja hitaampia. Siispä niin kauan kun me vain
mitenkään pysytmme käyttämään tavallista kahdeksanbittistä merkistöä, siitä
ei kannata luopua.
Harri
More information about the devel
mailing list