[voikko-devel] Unicode-asiaa

Teemu Likonen tlikonen at iki.fi
Sun Aug 13 07:31:49 EEST 2006


Teemu Likonen kirjoitti:

> Sen sijaan mitä sanoisit siitä, että heittomerkin sisältävälle
> sanalle annettaisiin samasta sanasta aina molemmat ehdotukset?
> Esimerkkisi mukaan siis virhe "vaaan" tuottaisi ehdotukset "vaa'an"
> ja "vaa’an" (plus muut mahdolliset ehdotukset).

Edellisen heittomerkkitilanteen lisäksi tekisi kyllä sittenkin mieli 
ehdottaa jonkinlaista tilalippua näissä tapauksissa. Pseudokoodilla 
siis jotenkin näin:


SANA=tarkistettava_sana
HYPHEN=U+2010
HYPHEN_MINUS=U+002D
UNICODE_APOSTROPHE=U+2019
ASCII_APOSTROPHE=U+0027

if (SANA sisältää ligatuureja) then ON_LIGATUURI=kyllä
if (SANA sisältää HYPHEN) then ON_HYPHEN=kyllä
if (SANA sisältää UNICODE_APOSTROPHE) then ON_UNICODE_APOSTROPHE=kyllä

# Muutetaan SANA Suomi-Malagan ymmärtämään muotoon
normalisoi(SANA)

# Lähetetään Suomi-Malagalle ja otetaan vastaus
EHDOTUKSET=suomi_malaga(SANA)

if (EHDOTUKSET sisältää {ff,fi,fl,ffi,ffl}) and \
  (ON_LIGATUURI) then palauta_ligatuurit(EHDOTUKSET)
# Edellinen komento automaattisesti korjaisi sen typografisen
# virheen, että sanan yhdessä kohdassa on käytetty ligatuuria mutta
# toisessa ei.

if (EHDOTUKSET sisältää HYPHEN_MINUS) and \
  (ON_HYPHEN) then palauta_hyphen(EHDOTUKSET)

if (EHDOTUKSET sisältää ASCII_APOSTROPHE) and \
  (ON_UNICODE_APOSTROPHE) then \
  palauta_unicode-heittokomerkki(EHDOTUKSET)


Jos alun perin ei ole käytetty ligatuureja tai HYPHENiä, niin ei niitä 
myöskään käyttäjälle tarjota. Jos niitä on käytetty, niin ehdotuksissa 
käytetään sitten jokaisessa kohdassa. Pitäisiköhän tämä ulottaa myös 
ääkkösiin (?).



More information about the devel mailing list