Aiuto:Gestione file djvu

Da Wikisource.
Aiuto: Gestione dei file djvu

Nuvola filesystems folder blue open.png Categoria: Guida alla digitalizzazioneManuale  Nuvola apps noatun.png Guida alla digitalizzazione  Nuvola apps noatun.png Gestione file djvu 

Nuvola apps khelpcenter.png - Aiuto

icona simbolo del formato

File DjVu[modifica]

La tecnologia DjVu permette di creare immagini compresse ma di alta qualità pensate per la lettura di testi.

È stata concepita espressamente per la digitalizzazione in un solo file DjVu di molteplici pagine cartacee con testi e grafica, i cui requisiti sono:

  • file leggeri (elevato numero di scansioni delle pagine)
  • alta risoluzione (leggibilità della scansione)
  • eventuale layer di testo a integrazione dell'immagine

La tecnologia DjVuè dunque fortemente consigliata per l'utilizzo dei testi con immagini delle pagine a fronte (proofread extension), ed è diventata uno standard de facto nei progetti Wikisource.

Siti come Internet Archive forniscono direttamente il DjVu dei libri digitalizzati.

Struttura dei file DjVu[modifica]

Per un approfondimento sulla storia e sulle caratteristiche tecniche dei file DjVu leggi la voce relativa su Wikipedia.

I file DjVu presentano qualche analogia con i file PDF, che possono contenere anch'essi sia testo che immagini, ma hanno il vantaggio di ottenere una compressione delle immagini più efficiente e di essere stati sviluppati in ambiente open source.

File DjVu nei namespace Indice: e Pagina:[modifica]

Con un file DjVu, l'inserimento di testi con le immagini a fronte è molto più semplice e lineare.

Una volta caricato su Commons il file DjVu

NOMEFILE.Djvu

viene creata una pagina speciale File:NOMEFILE.djvu che comprende un sistema di visualizzazione delle diverse pagine del file. Creando su wikisource una pagina indice Indice:NOMEFILE.djvu (o semplicemente Indice:NOMEFILE) la pagina automaticamente aggancia il file DjVu su Commons, e il gioco è fatto.

Il tag nel campo Sezione indice delle pagine genera automaticamente la tabella dei link a tutte le pagine del file NOMEFILE.djvu.


Conversione da pdf a DjVu[modifica]

La conversione può essere attuata dal service web Any2Djvu. Il servizio (curato da volontari) accetta in entrata vari tipi di files, e li converte in un file djvu.

Sono accettati sia file locali che file presenti sul web, identificati da un URL.

Esiste inoltre l'opzione di una interpretazione OCR delle immagini, ma funziona decentemente solo per testi in inglese, come precisato nel sito; se convertite testi in altre lingue, o di cattiva qualità grafica, è consigliabile non utilizzarlo, dato che l'elaborazione sarebbe semplicemente molto più lunga ed la trascrizione fornita sarebbe comunque inutilizzabile. Il servizio fornisce in anticipo l'indirizzo del file DjVu di output; siccome l'elaborazione può essere molto lunga, anche alcune ore, è una buona idea salvarlo e verificare, di quando in quando, se il file è stato generato e quindi scaricarlo.

Modifica dei file DjVu[modifica]

Approfondimento: Gestione file djVu per esperti

Esistono programmi e accessori pensati per elaborare i file DjVu. Essi presuppongono una base di competenze necessaria a non rovinare o rendere inutilizzabili tali file.

Il tag [[File]] e i file DjVu[modifica]

Il tag File accetta, come parametro opzionale, page=xxx, e tratta la pagina "xxx" indicata dal parametro come un'immagine qualsiasi fra quelle accettate. Purtroppo, il tag <gallery> non accetta tale parametro e quindi non è possibile visualizzare una galleria di immagini delle pagine del file DjVu; l'effetto del tag <gallery> può essere simulato con una tabella di miniature, di cui però occorre scrivere il relativo codice.

Qui un esempio di "pseudo-galleria" da un file DjVu , in cui le immagini sono richiamate con seguente sintassi (da notare il parametro page=):

{|
|-
|[[File:Il cavallarizzo.djvu|page=1|thumb|200px|Pagina 1]]
|[[File:Il cavallarizzo.djvu|page=2|thumb|200px|Pagina 2]]
|[[File:Il cavallarizzo.djvu|page=3|thumb|200px|Pagina 3]]
|[[File:Il cavallarizzo.djvu|page=4|thumb|200px|Pagina 4]]
|-
|[[File:Il cavallarizzo.djvu|page=5|thumb|200px|Pagina 5]]
|[[File:Il cavallarizzo.djvu|page=6|thumb|200px|Pagina 6]]
|[[File:Il cavallarizzo.djvu|page=7|thumb|200px|Pagina 7]]
|[[File:Il cavallarizzo.djvu|page=8|thumb|200px|Pagina 8]]
|}
Pagina 1
Pagina 2
Pagina 3
Pagina 4
Pagina 5
Pagina 6
Pagina 7
Pagina 8

Ritaglio automatico dei margini[modifica]

Avviene talora che le immagini delle pagine sono circondate da un ampio margine bianco, che è opportuno eliminare per renderne più agevole la lettura durante la procedura proofread.

Un ottimo programma gratuito che – fra le moltissime funzioni disponibili – è anche in grado di eseguire in modo completamente automatico il (detto anche "crop") ritaglio dei margini bianchi di singole immagini, o di tutte le immagini contenute in una cartella, è XnView.

Estrazione di immagini[modifica]

Nonostante sia semplice ritagliare le immagini direttamente dai file DjVu, questi sono fortemente compressi e ottimizzati per il testo. Se estrai immagini da un file DjVu, queste risulteranno sfocate e danneggiata dalla compressione. Se non vi è un'altra fonte, estrai l'immagine dal DjVu e applica il template {{bad extraction}} su Commons, in modo da segnalare la bassa qualità del file. Altrimenti, utilizza se riesci una fonte migliore, come delle scansioni del testo in JPG,PNG e TIFF.

Internet Archive[modifica]

Se il file DjVu viene da Internet Archive, sono spesso presenti file JPG di ottima qualità che sono visibili online (vai su Archive.org nella pagina dei dettagli, e scegli "Read online"). Inoltre questo metodo è più semplice che ritagliare l'immagine dal DjVu, dato che non devi fare screenshot e ritagli dell'immagine, e inoltre la qualità è decisamente migliore.

Google Books[modifica]

Se il file DjVu viene da uno scan di Google books, il suo PDF ha qualità sufficiente. Si vedano ad esempio queste due immagini:

Crainquebille, Putois, Riquet - Illuminated Initial - W (from DJVU).png Crainquebille, Putois, Riquet - Illuminated Initial - W.png
Tratta dal DjVu Tratta dal PDF su cui è stato fatto il DjVu