Discussioni indice:Zola - Il paradiso delle signore - 1936 - Mondadori.pdf
Aggiungi argomentoTrascrizione del testo[modifica]
Il file pdf di questo libro è senza testo OCR, tuttavia è possibile usare con successo uno dei tool che Wikisource ci mette a disposizione. Uno di questi è il pulsante "OCR di Google" attivabile nelle proprie preferenze. L'altro è lo strumento "trascrivi il testo" che permette di scegliere quale programma esegue l'OCR. In questo caso, ho trovato molto utile l'OCR di Google, che funziona bene anche sulle pagine storte e riconosce gli accenti "rovesciati" di cui è ricco questo testo.
Per portare Il paradiso delle signore a SAL75%, ho cominciato a procedere in questo modo:
- mi posiziono su una pagina nuova ed eseguo l'OCR di Google;
- quando è comparso il testo elaborato, uso in sequenza tre dei nostri strumenti di rilettura: Aggiusta paragrafi; PostOCR; Unisci linee;
- controllo che il testo sia a posto, verificando
- che il flusso del testo sia corretto. Ogni tanto l'OCR di Google sposta pezzi di frase in un altro punto. Capita al massimo due volte per pagina.
- Non sempre le interruzioni di paragrafo sono corrette. Una rapida occhiata al testo permette di correggere le discrepanze.
- Non tutti i trattini dei dialoghi vengono riconosciuti; nella maggior parte dei casi vanno inseriti a mano.
- Infine metto il corsivo dove necessario e tolgo nell'ultima riga il numero di pagina che è rimasto nel corpo del testo. L'uso di PostOCR lo mette automaticamente nel pié di pagina.
- a questo punto salvo la pagina con SAL75% e procedo con quella successiva.
--Paperoastro (disc.) 16:23, 4 mag 2024 (CEST)
- @Paperoastro Grazie! Da imitare :-) Alex brollo (disc.). 19:58, 4 mag 2024 (CEST)
memoRegex[modifica]
{"<<":["","«","g"], ">>":["","»","g"]}
Stili del testo[modifica]
Questo testo ha una sua pagina di stili styles.css dove sono raccolti gli stili più utili ed usati nel testo. In particolare:
- gli stili
t1
,t2
,t3
sono stati usati per il frontespizio; - lo stile
cap
è usato per il numero dei capitoli. In questo caso il codice suggerito per il titolo dei capitoli è{{Ct|c=cap|I}}
, come per il capitolo I a pagina 9.
--Paperoastro (disc.) 12:58, 7 mag 2024 (CEST)
- Grazie mille @Paperoastro per tutte le indicazioni e il gran lavoro! ciao moz (disc.) 20:05, 17 mag 2024 (CEST)