[voikko-devel] Voikko ja ocr-ohjelmat

Asmo Koskinen asmo.koskinen at arkki.info
Mon Aug 21 09:56:30 EEST 2006


Harri Pitkänen kirjoitti:
> Ajatus on kiinnostava, ja varmasti täysin toteuttamiskelpoinen.
> Joka tapauksessa on mahdollista saada aikaan paljon parempaa tulosta jos 
> OCR-ohjelma on liitetty suoraan oikolukuun, kuin oikolukemalla ohjelman 
> tuottamaa tekstiä jälkikäteen.
Kookan manuaali on näköjään vanhentunut. Kooka käyttää gorc-ohjelmaa. 
Orcad on myös tuettu, mutta sen kanssa ei tapahtunut mitään, ainakaan en 
jaksanut odottaa mahdollista prosess.  Voikko toimii tmispellin kautta 
juuri niin kuin pitääkin ilman Katea.

En tiedä kuinka, paljon gorcia voi opettaa, mutta ongelmia riittää. 
Tietenkin skannattavan paperin pitää olla mahdollisimman hyvälaatuinen.

Testissä käytin vedenkeittimen manuaalia.

Kuvakaappaus:

http://www.arkki.info/howto/Kooka_Voikko_Gorc.png

Ocre voisi olla mielenkiintoisempi, koska se on niin alkutekijöissään ja 
sen kehittäjä vaikuttaa varsin orientoituneelta.

"ocre  recognises  characters from the images in the files nfImage ... 
.  The input files must be in pgm(raw) format (256 gray levels) or in 
pbm(raw) format.  At the standard output we get the recognised text.

[--]

Does not recognise well large characters, very little ones, italic, two 
columns, ..., I am working in it .  This is a small model. :-).

June 19, 2006  ocre(1)"


Laitan s.a.l-nyysseihin tästä, jos joku vaikka ottaisi onkeensa.

Ystävällisin terveisin Asmo Koskinen.



More information about the devel mailing list