PDFpen logo PDFpen logo

Aiuto: OCR (= ROC - Riconoscimento ottico dei caratteri)

OCR (Riconoscimento Ottico dei Caratteri) è il processo di conversione da un'immagine bitmap contenente testo (come la fotocopia di un vecchio libro) ad un testo che può essere selezionato, copiato e ricercato da PDFpen o da altri editor di testo. Una volta che il testo viene riconosciuto dall'OCR, viene messo su un livello invisibile sopra l'immagine analizzata. Quando viene copiato del testo, la sorgente è sempre questo livello OCR invisibile. La Tecnologia OCR non produce un rendering perfetto del testo dall'immagine. Sarà necessario controllare e correggere il testo analizzato dall'OCR.


Usare l'OCR in PDFpen

  1. Apri un file scannerizzato in PDFpen.
  2. Apparirà un messaggio di avvertimento
    "Questo documento sembra essere scannerizzato. Vuoi eseguire l'operazione di OCR (optical character recognition)? L'OCR ti permetterà di selezionare il testo."
    Ci sono tre opzioni:
    • Annulla:
      Non verrà eseguito l'OCR
    • Pagina OCR:
      Verrà eseguito l'OCR sulla pagina corrente.
    • Documento OCR:
      Se il tuo documento è composto da più pagine, verrà eseguito l'OCR su tutte le pagine.

    Scegli le lingue che dovranno essere riconosciute dall'OCR in Preferenze > OCR.

Durante il processo di OCR apparirà una barra di progressione. L'operazione potrebbe richiedere alcuni secondi o più tempo, dipende dalla dimensione e dal contenuto del documento scannerizzato.
Per eseguire l'OCR manualmente, seleziona Composizione > OCR Pagina. PDFpen inizierà il processo di OCR ed apparirà la barra di progressione.

Selezionare, Copiare e Correggere Testo

Una volta che il processo di Riconoscimento Ottico dei Caratteri è finito, il testo del documento può essere modificato come ogni altro testo. Per rendere visibili le correzioni al testo, utilizzare Correggi Testo. Maggiori dettagli in Lavorare con il Testo..

Cercare il testo OCR

Il testo generato dall'operazione di OCR può essere cercato come un testo normale. Vedi Cercare dentro un PDF.

Consigli per migliorare i risultati dell'OCR nei tuoi documenti:

  • La qualità del tuo documento originale influenzerà la qualità delle performance dell'OCR. Testo pulito e nitido produrrà risultati migliori piuttosto che fotocopie stropicciate e sbiadite.
  • Inserisci il tuo documento nello scanner il più dritto possibile. Se hai un documento già scannerizzato ruotato, puoi "equalizzare", ossia raddrizzare, l'immagine in PDFpen mediante il comando del menu Composizione > Equalizza ed Imposta Immagine
  • Aumenta il contrasto del tuo documento scannerizzato in modo da rendere lo sfondo il più bianco possibile. Puoi impostare il contrasto dell'immagine mediante il comando del menu Composizione > Equalizza ed Imposta Immagine

Forza OCR

PDFpen analizza il documento e se rileva un'immagine della stessa dimensione della pagina, suppone che il documento sia uan scansione ed automaticamente chiede di effettuare un OCR. In alcuni casi, PDFpen potrebbe non riconoscere un documento scansionato. Nel menu Modifica, Pagina OCR sarà grigio e non selezionabile.

  1. Tieni premuti i tasti Comando ed Opzione insieme.
  2. Scegli Modifica > Pagina OCR dal menu.

Visualizzare il Livello di Testo OCR

Una volta che il testo è stato riconosciuto dall'OCR, viene messo su un livello invisibile posto sopra l'immagine analizzata. Quando viene copiato del testo, la sorgente è sempre questo livello OCR invisibile.

Il testo risultante dal processo di OCR risulta da un rendering molto preciso, ma non perfetto, del testo presente nell'immagine. Potrebbe essere necessario ricontrollare e correggere il testo dopo l'analisi OCR. Copiando ed incollando il testo OCR, si potrebbero notare delle imprecisioni opportunamente correggibili.

Mostra il livello di testo OCR:

  1. Dal menu Visualizza, scegliere Livello OCR. Un livello di testo apparirà sul documento mostrando il testo OCR normalmente nascosto.

Rimuovi il livello OCR

Per rimuovere completamente il livello OCR da una pagina:

  1. Apri il menu Modifica e scegli Rimuovi Livello OCR… (Cmd+Opt+O).

A questo punto, potresti rifare l'OCR, oppure utilizzare il documento nello stato corrente. Se vuoi rimuovere l'OCR da un documento per rifarlo, è possibile utilizzare Forza OCR.

Modificare il Livello di Testo OCR (PDFpenPro Only)

Effettuare correzioni al Livello di Testo OCR.

  1. Dal menu Visualizza, "scegliere visualizza informazioni OCR". Un livello di testo apparirà sul documento, mostrando il testo OCR normalmente nascosto.
  2. Selezionando una porzione di testo apparirà una finestra di popup con opzioni per modificare il testo una parola o riga per volta.

I cambiamenti effettuati al Livello di Testo OCR non sono gli stessi effettuati utilizzando lo strumento Correggi Testo dal momento che i cambiamenti al Livello di Testo OCR non avvengono anche al testo visibile.

Inoltre, lo strumento Correggi Testo è adatto alla correzione di piccoli errori, e non per la riformattazione di un documento. Per fare ciò, bisogna esportare il documento in formato Word, ed effettuare i cambiamenti in un word processor.




© 2003-2017 SmileOnMyMac, LLC dba Smile. All rights reserved.
PDFpen and PDFpenPro are registered trademarks of Smile. The Smile logo is a trademark of Smile.