[voikko] ocr_suggestions=n

Ismo Raitanen ismo.raitanen at iki.fi
Wed Feb 8 20:52:01 EET 2012


Hei,

Onko niin, että ocr-ehdottaja yrittää korjata ainoastaan yhden merkin
sanasta? Ja yhden silloinkin, vaikka korjattavat merkit olisivat
samoja?

$ echo tas_u | voikkospell -s ocr_suggestions=1
W: tas_u
S: tasku
S: tassu

$ echo ta__u | voikkospell -s ocr_suggestions=1
W: ta__u

Miten algoritmi tarkemmin ottaen toimii? "Normaalin" ehdottajan
mainion kuvauksen jo löysinkin Kesäkoodi-raportista.

/Ismo

2011/12/20 Harri Pitkänen <hatapitk at iki.fi>:
> On Tuesday 20 December 2011, Ismo Raitanen wrote:
>> Miten optiota ocr_suggestions=n käytetään ja mitä sen tulisi tehdä?
>> Miten se eroaa s-optiosta?
>
> Se on tarkoitettu tekstin optisessa luvussa (optical character recognition)
> tapahtuvien virheiden korjaamiseen. Eli käytännössä se ehdottaa korjauksia,
> joissa kirjaimet muistuttavat toisiaan, tai jossa kirjain on korvautunut
> alaviivalla:
>
> $ echo kcira | voikkospell -s ocr_suggestions=1
> W: kcira
> S: koira
>
> $ echo k_ira | voikkospell -s ocr_suggestions=1
> W: k_ira
> S: kaira
> S: koira
> S: Kiira



More information about the voikko mailing list