Aiuto:Gestione file djvu: differenze tra le versioni

Da Wikisource.
Contenuto cancellato Contenuto aggiunto
555.bot (discussione | contributi)
Riga 53: Riga 53:
== Domande? ==
== Domande? ==
Se hai domande, dubbi, proposte o necessiti di chiarimenti su ''come effettuare la rilettura di un testo'' <span class="plainlinks">[http://it.wikisource.org/w/index.php?title=Discussioni_aiuto:Gestione_del_file_djvu&action=edit&section=new premi qui] e lascia un messaggio nella pagina di discussione.</span>
Se hai domande, dubbi, proposte o necessiti di chiarimenti su ''come effettuare la rilettura di un testo'' <span class="plainlinks">[http://it.wikisource.org/w/index.php?title=Discussioni_aiuto:Gestione_del_file_djvu&action=edit&section=new premi qui] e lascia un messaggio nella pagina di discussione.</span>

[[en:Help:DjVu files]]
[[fr:Aide:Créer un fichier DjVu]]

Versione delle 21:41, 26 dic 2008

File djvu

Djvu è una tecnologia di compressione d'immagine che permette di creare immagini di alta qualità ma leggere. E' stato concepito espressamente per la digitalizzazione di opere cartacee, operazione che necessita di:

  • file leggeri (elevato numero di scansioni delle pagine)
  • alta risoluzione (leggibilità della scansione)

Immagini Djvu sono dunque fortemente consigliate per l'utilizzo dei [[Wikisource:|libri con testo a fronte]] (proofread extension).


Struttura dei file djvu

Un buon articolo sulla storia e sulle caratteristiche tecniche dei file djvu è presente su wikipedia. In breve, i file djvu presentano qualche analogia con i file PDF, con il vantaggio di essere stati sviluppati in ambiente OpenSource e di avere una compressione delle immagini più efficiente.

Il tag [[Image]] e i file djvu

Il tag [[Image]] accetta, come parametro opzionale, page=xxx, e tratta la pagina xxx indicata dal parametro come un'immagine qualsiasi fra quelle accettate. Purtroppo, il tag <gallery> non accetta il parametro e quindi non è possibile visualizzare una galleria di immagini delle pagine del file djvu; l'effetto del tag <gallery> può essere simulato con una tabella di thumbnails, ma occorre scrivere il relativo codice.

Qui un esempio di "pseudo-galleria" da un file djvu:

Pagina 1
Pagina 2
Pagina 3
Pagina 4
Pagina 5
Pagina 6
Pagina 7
Pagina 8

File djvu e namespaces Indice: e Pagina:

Il funzionamento della procedura proofread, fondato sui namespaces Indice: e Pagina:, è legato in maniera stretta, anche se non esclusiva, alla struttura dei file djvu. Una volta caricato su Commons (opzione consigliata: il file diventa immediatamente disponibile per qualsiasi progetto wiki) o su wikisource (opzione alternativa non consigliata) il file djvu nomefile.djvu, viene creata una pagina speciale Image:nomefile.djvu che comprende un sistema di visualizzazione delle diverse pagine del file. Creando su wikisource una pagina indice Indice:nomefile.djvu, o semplicemente Indice:nomefile, la pagina aggancia il file djvu su Commons o su wikisource. Il tag <pagelist /> nel campo Sommario genera automaticamente, in altre source (come en.s), la tabella dei link a tutte le pagine del file nomefile.djvu; in questa wikisource, è stato deciso di rinunciare a questo automatismo, e di sostituirlo con l'introduzione di una tabella dei link costruita manualmente o via bot, che dà il vantaggio di assegnare alle celle dei link dei colori di fondo non connessi al SAL, e di riportare per ogni cella il simbolo del SAL secondo le indicazioni di qualità concordate su it.source.

Uno dei vantaggi di quest'ultima procedura è che si possono creare link a pagine non esistenti sul file sorgente, e addirittura il file sorgente potrebbe mancare del tutto su wiki; si apre quindi la possibilità di usare la procedura proofread anche utilizzando, come visualizzatore delle immagini delle pagine, una finestra web puntata direttamente sul sito sorgente, evitando eventuali problemi di copyright e utilizzando comunque lo schema proofread "pagina per pagina". Utilizzando invece il tag <pagelist />, si rimane vincolati all'esistenza e alla struttura del file di immagini.

Conversione da pdf a djvu

La conversione è attuata dal service web any2djvu: http://any2djvu.djvuzone.org/ , curato da volontari; il servizio accetta in entrata vari tipi di files, e li converte in un file djvu. Accetta sia file locali che file presenti sul web, identificati da un URL. Esiste l'opzione di una interpretazione OCR delle immagini, ma funziona decentemente solo per testi in inglese, come precisato nel sito; se convertite testi in altre lingue, o di cattiva qualità grafica è consigliabile non utilizzarlo, l'elaborazione sarebbe semplicemente molto più lunga e comunque il testo fornito sarebbe inutilizzabile. Il servizio fornisce in anticipo l'indirizzo del file djvu di output; siccome l'elaborazione può essere molto lunga, anche alcune ore, è una buona idea salvarlo e verificare, di quando in quando, se il file è stato generato e quindi scaricarlo.

Modifica dei file djvu

E' possibile gestire i file djvu con alcuni programmi disponibili qui: http://djvu.sourceforge.net/ per vari sistemi operativi, Windows compreso. Sotto Windows, il programma DjVu Solo, compreso nel pacchetto, consente la riorganizzazione completa del contenuto di un file djvu (cancellazione di pagine, aggiunta di pagine, variazione dell'ordine delle pagine, importazione di immagini di vario formato).

Conversione da djvu a jpg

Se il file djvu è caricato su wiki, la conversione è molto semplice: viene attuata dai server wiki. Su una pagina wiki (anche in sola anteprima) visualizzate le immagini delle pagine che vi interessano, con il codice [[Image:nome del file djvu|800px|page=numero della pagina]], ripetuto per ognuna delle pagine (800 px è una buona dimensione, ma potreste volerla cambiare: fissate la dimensione che preferite); salvate la pagina web risultante in locale, con l'opzione "Salva pagina web completa"; nella cartella _files troverete (oltre ad altri files) la serie completa delle immagini jpg delle pagine che avete visualizzato.

Se il file djvu non è caricato su wiki, le pagine possono essere esportate dal file djvu con il programma DjVu Solo, distribuito da sourceforge, in formato bitmap, e poi convertite in jpg.

Ritaglio automatico dei margini

Avviene talora che le immagini delle pagine sono circondate da un ampio margine bianco, che è opportuno eliminare per renderne più agevole la lettura durante la procedura proofread.

Un ottimo programma free che - fra le moltissime funzioni disponibili - è anche in grado di eseguire in modo completamente automatico il ritaglio dei margini bianchi di singole immagini, o di tutte le immagini contenute in una cartella, è XnView.

Quando si deve operare sulle immagini già incorporate in un file djvu, caricato in commons, il primo passo da fare è quello di convertire tutte le pagine del file djvu in jpg e di salvare tutti i file jpg nel PC locale (ad esempio come spiegato nella sezione precedente) in una cartella; con XnView si può lanciare la funzione di ritaglio automatico su tutti i file contenuti nella cartella, dopodichè basta ricostruire il file djvu con il programma free già menzionato, DjvuSolo.

Domande?

Se hai domande, dubbi, proposte o necessiti di chiarimenti su come effettuare la rilettura di un testo premi qui e lascia un messaggio nella pagina di discussione.