Aiuto:Gestione file pdf

Da Wikisource.
Jump to navigation Jump to search
Aiuto: Gestione dei file pdf

Nuvola filesystems folder blue open.png Categoria: Guida alla digitalizzazioneManuale  Nuvola apps noatun.png Guida alla digitalizzazione  Nuvola apps noatun.png Gestione file pdf 

Nuvola apps khelpcenter.png - Aiuto

icona simbolo del formato

Il PDF (Portable Document Format) è il secondo tipo di file multipagina utilizzabile per la procedura proofread di wikisource; il secondo formato, che presenta vari vantaggi, è il djvu.

Opportunità per wikisource[modifica]

E' probabile che in varie circostanze sia opportuna una manipolazione automatica di due tipi di pdf:

  • i pdf che costituiscono un semplice "raccoglitore di immagini", spesso prodotti direttamente dallo scanner come formato di output (es. pdf di Opal Libri Antichi);
  • i pdf "ricercabili", in cui oltre all'immagine esiste uno "strato testo" mappato, che permette di ricercare e evidenziare il testo nelle immagini (es. pdf prodotti da FineReader e da Internet Archive). Questi pdf sono utilizzabili come file per il prooofread, il testo viene recuperato come "ocr", ma al momento non sono adatti al Match & Split, che funziona solo con i file djvu


+++