Utente:Silvio Gallio/I file djvu; loro cura in salute e malattia
Home | Lezione 1 | Lezione 2 | Lezione 3 | Lezione 4 | Lezione 5 | Lezione 6 |
Qui da noi, in Wikisource, uno dei formati più utilizzati per i file dei testi è l'ormai famoso djvu (si pronuncia "déjà vu").
È un formato appositamente sviluppato per l'editoria, la cui caratteristica più simpatica (e utile!) è la grande possibilità di compressione delle immagini di testo, senza perdita di qualità. Quanto di meglio per le necessità che abbiamo di presentare testi leggibili senza richiedere apparati ultrapotenti.
Le opere che aspirano ad avere i quadratini verdi di qualità del SAL 100% (fonte indicata, testo completo, formattato correttamente, riletto usando la fonte cartacea digitalizzata) hanno bisogno di riportare a fronte l'immagine della fonte cartacea. Per questa ragione l'uso del formato djvu è diventato molto importante e largamente diffuso. Dunque il bravo wikisourciano che voglia contribuire all'eccellenza di questo progetto deve produrre l'immagine dei testi originali in formato djvu.
Come può fare? Semplice: segue queste istruzioni. E ci mette un po' di buon senso :-)
Per esempio, col buon senso, distingue da solo quando si parla di file djvu puramente di immagine (foto, disegni) e file djvu relativi a testi e articolati in più pagine. Capisce che quando si parla di "lavorare dentro il file", sarà il secondo caso...
Uno - Procurarsi un tool per gestire i file djvu
[modifica]La strada facile
[modifica]Scaricare il tool DjVuToy (freeware)! Ne parliamo ampiamente nella pagina Aiuto:DjvuToy. Il bravo wikisourciano che vorrà giocare con i file djvu dovrebbe procurarselo scaricandolo qui. Altrimenti buona parte di questa pagina non gli servirà.
Sulla vecchia strada
[modifica]Se proprio non vuole/può usare il DjvuToy, il buon wikisourciano si procura un visualizzatore per i file djvu da questo indirizzo.
Il visualizzatore, che si chiama DjView.exe, può essere eseguito semplicemente facendo un doppio click su di esso.
Verrà creata una cartella chiamata DjVuLibre. Tranquillo: l'installazione è una pura "scompattazione", non ci sono "rovistamenti" del sistema.
Dentro la cartella DjVuLibre ci sono le "routine" per modificare i file. Si tratta di file exe che sono programmi che possono essere chiamati individualmente, attraverso una console di sistema (una finestra con il vecchio prompt C:>) oppure attraverso un file bat oppure da una chiamata scritta in un programma qualsiasi.
Per non dover sistemare i parametri di sistema, il buon wikisourciano scarica i file djvu su cui deve operare direttamente dentro la cartella DjVuLibre, fianco a fianco dei file exe.
Due - Ottenere un testo partendo da un altro formato
[modifica]Ottenere un file djvu dal testo scansionato
[modifica]Tramite DjVuToy
[modifica]DjVuToy crea file djvu di buona qualità e molto velocemente. Con enorme vantaggio rispetto alla pur sempre lenta lavorazione attraverso il server (metodo vecchiotto con any2djvu) ottenibile con la banda ADSL italiana :-( Inoltre permette una gestione totale dei file ed elimina la necessità di spedire ai server gli eventuali nuovi file corretti o elaborati successivamente.
- Lanciare il tool.
- Scegliere "Maker" e seguire le relative semplicissime istruzioni che si trovano qui. Si ottiene un file "bundled" con tutte le pagine del testo ben allineate.
- Se le pagine sono di varie misure, ridefinire i DPI e/o le dimensioni (istruzioni qui).
- Controlla la qualità generale del file ― leggibilità, ordine delle pagine, ecc. ― e porre rimedio a eventuali manchevolezze (istruzioni qui).
Tramite any2djvu
[modifica]- Comprimere le scansioni delle pagine in un file-archivio .zip o .rar.
- Controllare il file-archivio. Per evitare altre complesse lavorazioni future sul file djvu, i file devono essere in ordine numerico (e quindi le pagine) e devono esserci tutti :-)
- Caricare il file-archivio (zip o rar) sul server di any2djvu (http://any2djvu.djvuzone.org/) seguendo le semplici istruzioni (in inglese ma davvero semplici): si otterrà un file il cui nome sarà un lunghissimo numero.
- Scaricare il file sul proprio disco rigido e rinominarlo come si preferisce. Sarà meglio per lui se userà lo stesso nome che poi il testo avrà qui da noi su wikisource. Con ciò, infatti, il buon wikisourciano eviterà molti grattacapi in seguito.
Questo metodo è ottimo anche per convertire i file pdf in djvu con poca fatica e senza necessità di superpoteri. :) Seguire i punti 3 e 4; solo, quando si tratta di scegliere il tipo di file, cliccare su "PS/PS.GZ/PDF Document", la prima scelta della lista. |
Facciamo lavorare Internet Archive
[modifica]Trasformare "a casa" un file pdf in djvu è, se non impossibile molto molto complesso e comunque negato ai comuni wiki-mortali che non hanno l'eternità a disposizione.
Allora, il buon wikisourciano può ottenere un duplice risultato caricando il file pdf su Archive.
"Loro" ottengono del materiale che non avevano, lo elaborano e "noi" ne ricaviamo il desiderato file in formato djvu - con anche un OCR, della cui qualità ci è però permesso discutere :-)
Fase uno - Caricare
[modifica]Allora, il buon wikisourciano:
- entra quatto quatto in I.A. e se già non lo ha fatto si registra (altrimenti non accettano il materiale),
- vede, in alto a destra della loro "Pagina Principale", un tasto "Upload",
- clicca e appare una seconda schermata con ― sempre in alto a destra ― un tasto "Share". Clicca anche quello,
- vede quindi una finestrella intitolata "Seleziona i file da caricare con www.archive.org". Con il solito sistema egli cerca nella pancia del suo computer il file che vuole caricare. Trovatolo, seleziona e clicca "Apri",
- vede aprirsi un'ulteriore schermata con
- in alto, riquadrato in verdolino, il nome del file e, sotto questo, una lineetta che man mano si allunga. Sotto questa lineetta legge un "Uploading" che alla fine si trasformerà in "Complete",
- più sotto quattro campi da riempire con
- titolo dell'opera,
- descrizione (serve breve descrizione di cosa si tratti; romanzo, saggio, poema, ecc.),
- parole chiave suggerite per la futura ricerca,
- autore dell'opera (I.A. dice che non è obbligatorio perché spesso sono anonimi ma se l'autore è conosciuto meglio metterlo).
Infine, il buon wikisourciano clicca sul tipo di licenza che pensa sia adatto. Quando apparirà il "Complete" di cui parlavamo sopra basta che clicchi sul bottone "Share my File(s)".
Sarà necessario che il buon wikisourciano attenda che il file sia elaborato. Dopo qualche ora (dipende da molti fattori e specialmente dal "peso" del file) il file sarà diventato come tutti gli altri file di I.A. e il buon wikisourciano ivi troverà il file in formato djvu.
Suggerimento: sarà utile al buon wikisouciano copiare l'identifier-access così poi trovare il file sarà immediato.
Fase due - Scaricare
[modifica]Il buon wikisourciano:
- cerca il suo file djvu con l'identifier access. In mancanza di questo va nella Home Page di I.A. (quella gialla e verde) e clicca su "Contributions" e poi su "tasks that are done" dove trova tutti i suoi contributi al sito,
- porta gli estremi sul monitor dove la pagina diventa bianca e rossa,
- sulla sinistra nota il quadretto "View the book", in basso, legge "All files: HTTP",
- clicca su questo link e trova una lista di link ai file nei vari formati,
- scarica il file djvu nel proprio PC. Se necessario lo rinomina.
Tre - Gestire i file djvu
[modifica]Naturalmente non sempre i file djvu che abbiamo sotto mano sono già perfetti, a volte occorre modificarli un po' prima che sia possibile caricali su wikisource. Vediamo come fare.
Eliminare pagine
[modifica]Il buon wikisourciano dovrà spesso eliminare alcune pagine ridondanti, ad esempio quelle warning di google. Ecco allora qualche suggerimento.
Alta comodità
[modifica]Premesso che il comportamento più astuto è quello di rivolgersi a Aiuto:DjvuToy, riportiamo qui sotto antiche metodologie di uno sciamano (carnico, pare) che possono ancora essere utilizzate come succedanei.
A long and winding road
[modifica](uno dei pezzi più romantici mai scritti. Mmhmmm!)
Se proprio diventa necessario, si può operare usando il programma djvm.exe, eseguendolo direttamente dalla riga comandi in questo modo:
- aprire la riga comandi (da Start / Esegui / Apri scrivere "cmd") e posizionarsi nella cartella dove si trovano sia il file djvm.exe che il file .djvu dal quale dobbiamo rimuovere la pagina. Per posizionarsi nella cartella giusta bisogna usare pazientemente il comando cd (cd nomecartella porta alla sotto-cartella indicata - cd.. sale di una cartella - cd\ porta alla root),
- digitare il comando "djvm -d nomefile.djvu 1" che significa: "esegui djvm in modalità delete sul file nomefile.djvu eliminando la pagina 1". Attenzione, dopo che si esegue il comando viene eliminata la pagina indicata e, di conseguenza, le pagine seguenti saranno tutte ricalcolate. Quindi, prima di eseguire nuovamente il comando per un'altra pagina aprire il file .djvu e verificare quale sia effettivamente il numero di pagina da cancellare.
Estrarre pagine
[modifica]Se il buon wikisourciano si trova nella necessità di estrarre solo alcune pagine dal file (ad esempio un articolo di 20 pagine da una rivista di 400) può usare DjVuToy, in cui però allo stato attuale (giugno 2011) questa funzione è piuttosto lenta con rischio di vedere che il programma "non risponde". Il buon wikisourciano può allora rivolgersi al buon vecchio DjvuView che permette di eliminare tutto in un colpo o una alla volta le varie pagine di un djvu, ma solo quelle prima e/o dopo il testo che si vuole estrarre!
Così.
Il buon wikisourciano dovrà quindi:
- fare un backup preventivo del file da lavorare (non si sa mai...),
- aprire il file, controllando da quale pagina inizia il testo e quale sia l'ultima che si vuol tenere,
- andare in "File/Salva come" per aprire la finestrella,
- cliccare su "Pagine da-a",
- per "da" inserire la prima pagina che si vuol tenere,
- per "a" inserire l' ultima pagina che si vuol tenere,
- decidere dove salvare scegliendo la cartella (magari cambiando il nome del file per sicurezza),
- premere "Salva".
Il buon wikisourciano otterrà un file con le sole pagine da-a, con il nomefile da lui deciso, nella directory da lui scelta.
Nota: a volte, dopo aver salvato il file, il DjvuWiev si blocca ma il file viene salvato. Nessun problema.
Aggiungere pagine
[modifica]Nell'ipotesi che al testo così faticosamente ottenuto manchi qualche dettaglio (una pagina mancante o scansionata male, un'altra non scansionata in un file ma presente in un altro - cosa che succede spesso con Books) sarà necessario "aggiungere".
Premesso che ogni lavorazione di questo tipo deve mantenere la coerenza interna dell'edizione (non si possono avere pagine chiaramente differenti tratte da edizioni diverse, per esempio con il numero di pagina non sequenziale o con il testo diversamente impaginato), ancora una volta il buon wikisourciano avrà di fronte un'alternativa.
L'Editor di DjVuToy
[modifica]Permette di lavorare dentro il file con facilità. Per informazioni basta andare a vedere (eh già!) questa sezione della pagina di aiuto.
Il certosino
[modifica]L'alternativa, modello pazienti certosini, che il buon wikisourciano userà se ha necessità/voglia di adoperare DjVuView per togliere o aggiungere ogni pagina, è questa.
- Con Con DjVuWiew, apre il file DjVu.
- Nel menù, con "File/esporta come" può esportare le pagine in formato immagine TIFF o BMP o altro (e finché sono poche...).
- Sceglie quelle che gli servono.
- Le "zippa" assieme alle altre, in ordine, in un archivio.zip.
- Fa creare un file djvu al solito server di any2djvu.
E adesso che ha ottenuto il file
[modifica]Il buon wisourciano, cosa se ne fa?
Se la qualità "tipografica" è buona, se il nome del file è pronto, se, se, se ... tutto è già controllato e self-approvato...
Oh! Allora il buon wikisourciano lo carica su Commons, no?