Utente:Aubrey/Progetto Dizionario
Pagina di coordinamento per il Progetto dizionario.
- To do
- trovare un nome adeguato a questa pagina e spostarla di conseguenza
- definire la procedura in tutti i suoi dettagli
Procedura[modifica]
- Scaricare la cartella con i jpeg delle immagini
- Convertire i jpeg con ImageMagick
- Rinominare le immagini con nomi utili (Aubrey)
- Spezzare le immagini con unpaper
- Fare djvu multipagina (Aubrey)
- Fare pdf da mandare ad Internet Archive.
ImageMagick[modifica]
Software per la conversione di immagini, da linea di comando. Scaricare e installare la versione preferita (esiste anche portable) da qui:
Installato ImageMagick guardare questa documentazione.
Per convertire, da terminale, scrivere secondo l'esempio:
convert filein.jpg fileout.tiff
Questo comando fa leggere le immagini da 1 a 5
convert image-%d.jpg[1-5]
Creazione di pdf[modifica]
Assumendo di avere le scansioni originali in originali, il seguente codice le taglia in modo lossless (con jpegtran) e le converte in pdf (con sam2p).
#!/bin/bash
mkdir jpeg_single pdf_jpeg_single
for i in $(seq -w 0869)
do
jpegtran -crop 1768x2662 originali/A$i.JPG > jpeg_single/z$(printf %04d $(expr $i '*' 2 - 1)).jpeg
jpegtran -crop 1768x2662+1768 originali/A$i.JPG > jpeg_single/z$(printf %04d $(expr $i '*' 2)).jpeg
done
for i in `seq -w 1738`
do
sam2p jpeg_single/z$i.jpeg pdf_jpeg_single/z$i.pdf
done
Per creare un pdf multipagina si può usare pdftk; la sintassi è:
- pdftk input1.pdf ... inputN.pdf cat output output.pdf
La creazione dei djvu è simile, usando c44 al posto di sam2p e djvm al posto di pdftk. - Laurentius (disc.) 22:03, 11 mar 2011 (CET)