OCR per PDF

Se si dispone di un file PDF contenente il risultato della scansione di un documento, come si può recuperare il testo del documento originale? Basta sottoporre il file PDF ad una applicazione di OCR, che traduca l’immagine dei caratteri in caratteri veri e propri. Una applicazione gratuita che ho provato e funziona abbastanza bene è

Advanced OCR Free

L’utilizzo è piuttosto semplice. Lavora pagina per pagina e non è velocissima, ma comunque svolge il suo compito. Pare che la qualità della estrazione dei caratteri dipenda dallo zoom con cui si osserva la pagina, perciò raccomando di procedere nel seguente modo:

  1. andare sulla pagina che si intende recuperare
  2. zoomare su di essa (comando Zoom In); attenzione che questa operazione è un po’ lenta e non sempre mostra la pagina zoomata; per quanto sembri strano, cliccando in sequenza su Zoom In e Zoom Out si ottiene di vedere la pagina zoomata
  3. mentre la pagina è zoomata, cliccare su OCR: nella finestra a destra appare il testo letto, che consiglio di copiare al volo in un file testo o word o libreoffice
  4. ripetere i passi per la pagina successiva

 

 

 

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...