Discussioni indice:Zola - Il paradiso delle signore - 1936 - Mondadori.pdf

Contenuti della pagina non supportati in altre lingue.
Aggiungi argomento
Da Wikisource.
Ultimo commento: 5 giorni fa, lasciato da Elena moz in merito all'argomento Stili del testo

Trascrizione del testo[modifica]

Il file pdf di questo libro è senza testo OCR, tuttavia è possibile usare con successo uno dei tool che Wikisource ci mette a disposizione. Uno di questi è il pulsante "OCR di Google" attivabile nelle proprie preferenze. L'altro è lo strumento "trascrivi il testo" che permette di scegliere quale programma esegue l'OCR. In questo caso, ho trovato molto utile l'OCR di Google, che funziona bene anche sulle pagine storte e riconosce gli accenti "rovesciati" di cui è ricco questo testo.

Per portare Il paradiso delle signore a SAL75%, ho cominciato a procedere in questo modo:

  1. mi posiziono su una pagina nuova ed eseguo l'OCR di Google;
  2. quando è comparso il testo elaborato, uso in sequenza tre dei nostri strumenti di rilettura: Aggiusta paragrafi; PostOCR; Unisci linee;
  3. controllo che il testo sia a posto, verificando
    • che il flusso del testo sia corretto. Ogni tanto l'OCR di Google sposta pezzi di frase in un altro punto. Capita al massimo due volte per pagina.
    • Non sempre le interruzioni di paragrafo sono corrette. Una rapida occhiata al testo permette di correggere le discrepanze.
    • Non tutti i trattini dei dialoghi vengono riconosciuti; nella maggior parte dei casi vanno inseriti a mano.
    • Infine metto il corsivo dove necessario e tolgo nell'ultima riga il numero di pagina che è rimasto nel corpo del testo. L'uso di PostOCR lo mette automaticamente nel pié di pagina.
  4. a questo punto salvo la pagina con SAL75% e procedo con quella successiva.

--Paperoastro (disc.) 16:23, 4 mag 2024 (CEST)Rispondi

@Paperoastro Grazie! Da imitare  :-) Alex brollo (disc.). 19:58, 4 mag 2024 (CEST)Rispondi

memoRegex[modifica]

{"<<":["","«","g"], ">>":["","»","g"]}

Stili del testo[modifica]

Questo testo ha una sua pagina di stili styles.css dove sono raccolti gli stili più utili ed usati nel testo. In particolare:

  • gli stili t1, t2, t3 sono stati usati per il frontespizio;
  • lo stile cap è usato per il numero dei capitoli. In questo caso il codice suggerito per il titolo dei capitoli è {{Ct|c=cap|I}}, come per il capitolo I a pagina 9.

--Paperoastro (disc.) 12:58, 7 mag 2024 (CEST)Rispondi

Grazie mille @Paperoastro per tutte le indicazioni e il gran lavoro! ciao moz (disc.) 20:05, 17 mag 2024 (CEST)Rispondi

Contributori[modifica]