[voikko] ocr_suggestions=n

Ismo Raitanen ismo.raitanen at iki.fi
Tue Dec 20 19:51:15 EET 2011


Ok! Ja kaikki korvautuvat merkit näkee ilmeisesti tiedostosta
src/spellchecker/suggestion/SuggestionStrategyOcr.cpp? Kaikki lienevät
yksi-yhteen-korvauksia?

Ja jos jostain syystä haluaisi muuttaa tai lisätä ocr-merkkimuutoksia,
niin tuo tiedosto lienee oikea paikka tehdä se? (Muutosten tekeminen
tulee mieleen ainakin siinä tapauksessa, että ocr-luenta on tehty
fraktuura-tekstistä. Siinähän esimerkiksi w-kirjain voi sekoittua
m-kirjaimeen.)

/Ismo

2011/12/20 Harri Pitkänen <hatapitk at iki.fi>:
> On Tuesday 20 December 2011, Ismo Raitanen wrote:
>> Miten optiota ocr_suggestions=n käytetään ja mitä sen tulisi tehdä?
>> Miten se eroaa s-optiosta?
>
> Se on tarkoitettu tekstin optisessa luvussa (optical character recognition)
> tapahtuvien virheiden korjaamiseen. Eli käytännössä se ehdottaa korjauksia,
> joissa kirjaimet muistuttavat toisiaan, tai jossa kirjain on korvautunut
> alaviivalla:
>
> $ echo kcira | voikkospell -s ocr_suggestions=1
> W: kcira
> S: koira
>
> $ echo k_ira | voikkospell -s ocr_suggestions=1
> W: k_ira
> S: kaira
> S: koira
> S: Kiira



More information about the voikko mailing list