Indice |
- Aiuto
[modifica] File djvu
La tecnologia Djvu permette di creare immagini compresse ma di alta qualità pensate per la lettura di testi.
È stata concepita espressamente per la digitalizzazione in un solo file djvu di molteplici pagine cartacee con testi e grafica, i cui requisiti sono:
- file leggeri (elevato numero di scansioni delle pagine)
- alta risoluzione (leggibilità della scansione)
- eventuale layer di testo a integrazione dell'immagine
La tecnologia Djvu è dunque fortemente consigliata per l'utilizzo dei testi con immagini delle pagine a fronte (proofread extension), ed è diventata uno standard de facto nei progetti Wikisource.
Siti come Internet Archive forniscono direttamente il djvu dei libri digitalizzati.
[modifica] Struttura dei file djvu
Per un approfondimento sulla storia e sulle caratteristiche tecniche dei file DjVu leggi la voce relativa su Wikipedia.
I file djvu presentano qualche analogia con i file PDF, che possono contenere anch'essi sia testo che immagini, ma hanno il vantaggio di ottenere una compressione delle immagini più efficiente e di essere stati sviluppati in ambiente open source.
[modifica] File djvu nei namespace Indice: e Pagina:
Con un file djvu, l'inserimento di testi con le immagini a fronte è molto più semplice e lineare.
Una volta caricato su Commons il file djvu
NOMEFILE.djvu
viene creata una pagina speciale File:NOMEFILE.djvu che comprende un sistema di visualizzazione delle diverse pagine del file. Creando su wikisource una pagina indice Indice:NOMEFILE.djvu (o semplicemente Indice:NOMEFILE) la pagina automaticamente aggancia il file djvu su Commons, e il gioco è fatto.
Il tag nel campo Sezione indice delle pagine genera automaticamente la tabella dei link a tutte le pagine del file NOMEFILE.djvu.
[modifica] Conversione da pdf a djvu
La conversione può essere attuata dal service web Any2Djvu. Il servizio (curato da volontari) accetta in entrata vari tipi di files, e li converte in un file djvu.
Sono accettati sia file locali che file presenti sul web, identificati da un URL.
Esiste inoltre l'opzione di una interpretazione OCR delle immagini, ma funziona decentemente solo per testi in inglese, come precisato nel sito; se convertite testi in altre lingue, o di cattiva qualità grafica, è consigliabile non utilizzarlo, dato che l'elaborazione sarebbe semplicemente molto più lunga ed la trascrizione fornita sarebbe comunque inutilizzabile. Il servizio fornisce in anticipo l'indirizzo del file djvu di output; siccome l'elaborazione può essere molto lunga, anche alcune ore, è una buona idea salvarlo e verificare, di quando in quando, se il file è stato generato e quindi scaricarlo.
[modifica] Modifica dei file djvu
- Approfondimento: Gestione file djVu per espertiApprofondimenti: {{{3}}} e [[{{{4}}}|{{{5}}}]]
Esistono programmi e accessori pensati per elaborare i file djvu. Essi presuppongono una base di competenze necessaria a non rovinare o rendere inutilizzabili tali file.
[modifica] Il tag [[File]] e i file djvu
Il tag File accetta, come parametro opzionale, page=xxx, e tratta la pagina "xxx" indicata dal parametro come un'immagine qualsiasi fra quelle accettate. Purtroppo, il tag <gallery> non accetta tale parametro e quindi non è possibile visualizzare una galleria di immagini delle pagine del file djvu; l'effetto del tag <gallery> può essere simulato con una tabella di miniature, di cui però occorre scrivere il relativo codice.
Qui un esempio di "pseudo-galleria" da un file djvu, in cui le immagini sono richiamate con seguente sintassi (da notare il parametro page=):
{|
|-
|[[File:Il cavallarizzo.djvu|page=1|thumb|200px|Pagina 1]]
|[[File:Il cavallarizzo.djvu|page=2|thumb|200px|Pagina 2]]
|[[File:Il cavallarizzo.djvu|page=3|thumb|200px|Pagina 3]]
|[[File:Il cavallarizzo.djvu|page=4|thumb|200px|Pagina 4]]
|-
|[[File:Il cavallarizzo.djvu|page=5|thumb|200px|Pagina 5]]
|[[File:Il cavallarizzo.djvu|page=6|thumb|200px|Pagina 6]]
|[[File:Il cavallarizzo.djvu|page=7|thumb|200px|Pagina 7]]
|[[File:Il cavallarizzo.djvu|page=8|thumb|200px|Pagina 8]]
|}
[modifica] Ritaglio automatico dei margini
Avviene talora che le immagini delle pagine sono circondate da un ampio margine bianco, che è opportuno eliminare per renderne più agevole la lettura durante la procedura proofread.
Un ottimo programma gratuito che – fra le moltissime funzioni disponibili – è anche in grado di eseguire in modo completamente automatico il (detto anche "crop") ritaglio dei margini bianchi di singole immagini, o di tutte le immagini contenute in una cartella, è XnView.
[modifica] Estrazione di immagini
Nonostante sia semplice ritagliare le immagini direttamente dai file DjVu, questi sono fortemente compressi e ottimizzati per il testo. Se estrai immagini da un file DjVu, queste risulteranno sfocate e danneggiata dalla compressione. Se non vi è un'altra fonte, estrai l'immagine dal DJVU e applica il template {{bad extraction}} su Commons, in modo da segnalare la bassa qualità del file. Altrimenti, utilizza se riesci una fonte migliore, come delle scansioni del testo in JPG,PNG e TIFF.
[modifica] Internet Archive
Se il file DJVU viene da Internet Archive, sono spesso presenti file JPG di ottima qualità che sono visibili online (vai su Archive.org nella pagina dei dettagli, e scegli "Read online"). Inoltre questo metodo è più semplice che ritagliare l'immagine dal DjVu, dato che non devi fare screenshot e ritagli dell'immagine, e inoltre la qualità è decisamente migliore.
[modifica] Google Books
Se il file DJVU viene da uno scan di Google books, il suo PDF ha qualità sufficiente. Si vedano ad esempio queste due immagini:
| Tratta dal DJVU | Tratta dal PDF su cui è stato fatto il DJVU |