[voikko-devel] Unicode-asiaa
Teemu Likonen
tlikonen at iki.fi
Sun Aug 13 07:31:49 EEST 2006
Teemu Likonen kirjoitti:
> Sen sijaan mitä sanoisit siitä, että heittomerkin sisältävälle
> sanalle annettaisiin samasta sanasta aina molemmat ehdotukset?
> Esimerkkisi mukaan siis virhe "vaaan" tuottaisi ehdotukset "vaa'an"
> ja "vaa’an" (plus muut mahdolliset ehdotukset).
Edellisen heittomerkkitilanteen lisäksi tekisi kyllä sittenkin mieli
ehdottaa jonkinlaista tilalippua näissä tapauksissa. Pseudokoodilla
siis jotenkin näin:
SANA=tarkistettava_sana
HYPHEN=U+2010
HYPHEN_MINUS=U+002D
UNICODE_APOSTROPHE=U+2019
ASCII_APOSTROPHE=U+0027
if (SANA sisältää ligatuureja) then ON_LIGATUURI=kyllä
if (SANA sisältää HYPHEN) then ON_HYPHEN=kyllä
if (SANA sisältää UNICODE_APOSTROPHE) then ON_UNICODE_APOSTROPHE=kyllä
# Muutetaan SANA Suomi-Malagan ymmärtämään muotoon
normalisoi(SANA)
# Lähetetään Suomi-Malagalle ja otetaan vastaus
EHDOTUKSET=suomi_malaga(SANA)
if (EHDOTUKSET sisältää {ff,fi,fl,ffi,ffl}) and \
(ON_LIGATUURI) then palauta_ligatuurit(EHDOTUKSET)
# Edellinen komento automaattisesti korjaisi sen typografisen
# virheen, että sanan yhdessä kohdassa on käytetty ligatuuria mutta
# toisessa ei.
if (EHDOTUKSET sisältää HYPHEN_MINUS) and \
(ON_HYPHEN) then palauta_hyphen(EHDOTUKSET)
if (EHDOTUKSET sisältää ASCII_APOSTROPHE) and \
(ON_UNICODE_APOSTROPHE) then \
palauta_unicode-heittokomerkki(EHDOTUKSET)
Jos alun perin ei ole käytetty ligatuureja tai HYPHENiä, niin ei niitä
myöskään käyttäjälle tarjota. Jos niitä on käytetty, niin ehdotuksissa
käytetään sitten jokaisessa kohdassa. Pitäisiköhän tämä ulottaa myös
ääkkösiin (?).
More information about the devel
mailing list