Caputo's blog

Informatica, tecnologia, programmazione, fai da te, papercraft e papertoy

Programmi OCR open source

agosto 25th, 2008 by Giovanni Caputo

Da Wikipedia: I sistemi di Optical Character Recognition (riconoscimento ottico dei caratteri detti anche OCR) sono programmi dedicati alla conversione di un’immagine contenente testo in testo modificabile con un normale programma di videoscrittura. Solitamente le immagini sono acquisite da uno scanner d’immagini o da un sistema di digitalizzazione che si avvale di una telecamera o di una webcam. Il testo viene convertito in testo ASCII, Unicode o nel caso dei sistemi più avanzati in un formato in grado di contenere anche l’impaginazione del documento. I programmi di OCR si avvalgono dei progressi dell’intelligenza artificiale e dell’evoluzione degli algoritmi legati al riconoscimento delle immagini.

Quindi se abbiamo un’immagine con del testo è possibile far riconoscere le singole lettere da un programma apposito che lo converte in formato di testo che è quindi modificabile.

Esistono diversi programmi a pagamento com OmniPage, oppure FineReader, entrambi a pagamento.

Se preferiamo utilizzare dei software gratuiti, un’ottima alternativa (che sfrutta un motore di lettura createo da Google) è FreeOCR.net, scaricabile dal sito http://softi.co.uk/freeocr.htm.

Potete anche scaricare il language pack in Italiano.

E’ necessario inoltre avere installato FrameWork .NET 2.0.

Esiste anche JOCR che richiede Microsoft Office 2003 o superiore installato.
Se non dovesse funzionare si può provare ad installare manualmente “Micorosoft Office Document Imaging” (MODI) incluso in Microsoft Office sotto “Office Tools”.

Questo post è stato postato lunedì, agosto 25th, 2008 at 15:30 nella categoria Open Source, programmi. Tags:, .
Puoi seguire tutti i commenti di questo articolo attraverso RSS 2.0 feed. Puoi lasciare un commento, o trackback dal nostro sito.

Lascia un commento

You must be loggati to post a comment.