[voikko-devel] Voikko ja ocr-ohjelmat
Asmo Koskinen
asmo.koskinen at arkki.info
Mon Aug 21 09:56:30 EEST 2006
Harri Pitkänen kirjoitti:
> Ajatus on kiinnostava, ja varmasti täysin toteuttamiskelpoinen.
> Joka tapauksessa on mahdollista saada aikaan paljon parempaa tulosta jos
> OCR-ohjelma on liitetty suoraan oikolukuun, kuin oikolukemalla ohjelman
> tuottamaa tekstiä jälkikäteen.
Kookan manuaali on näköjään vanhentunut. Kooka käyttää gorc-ohjelmaa.
Orcad on myös tuettu, mutta sen kanssa ei tapahtunut mitään, ainakaan en
jaksanut odottaa mahdollista prosess. Voikko toimii tmispellin kautta
juuri niin kuin pitääkin ilman Katea.
En tiedä kuinka, paljon gorcia voi opettaa, mutta ongelmia riittää.
Tietenkin skannattavan paperin pitää olla mahdollisimman hyvälaatuinen.
Testissä käytin vedenkeittimen manuaalia.
Kuvakaappaus:
http://www.arkki.info/howto/Kooka_Voikko_Gorc.png
Ocre voisi olla mielenkiintoisempi, koska se on niin alkutekijöissään ja
sen kehittäjä vaikuttaa varsin orientoituneelta.
"ocre recognises characters from the images in the files nfImage ...
. The input files must be in pgm(raw) format (256 gray levels) or in
pbm(raw) format. At the standard output we get the recognised text.
[--]
Does not recognise well large characters, very little ones, italic, two
columns, ..., I am working in it . This is a small model. :-).
June 19, 2006 ocre(1)"
Laitan s.a.l-nyysseihin tästä, jos joku vaikka ottaisi onkeensa.
Ystävällisin terveisin Asmo Koskinen.
More information about the devel
mailing list