Utente:Alex brollo/Come io trascrivo da un buon OCR

Da Wikisource.
Jump to navigation Jump to search

Ci vorrebbe la possibilità di assistere online a sedute di trascrizione, difficile spiegare tutto! ma ci provo, elencando cosa faccio in una pagina standard fresca di OCR di Indice:Cantoni - Trattato completo di agricoltura, 1855, I.djvu.

  1. Premo Alt+7 che chiama postOCR. Avvengono un sacco di cose:
    1. RigaIntestazione si sistema
    2. se la prima riga dell'OCR corrisponde approssimativamente a RigaIntestazione viene cancellata
    3. partono le sostituzioni generiche dell'OCR memorizzate in postOCR
    4. partono le sostituzioni opera-specifiche registrate con Trova e Sostituisci, opzione Ricorda
  2. Controllo che tutto sia andato bene e se è necessario uso autoPt sulla prima e sull'ultima parola spezzata
  3. premo Alt+6 e i paragrafi si sistemano (vengono separati da riga vuota); controllo rapidamente il risultato e correggo eventuali "eccessi" si separazione in paragrafi cancellando righe vuote erronee
  4. premo Alt+8 e il testo dei paragrafi si sistema definitivamente (le righe si fondono in un testo unico)
  5. inizio la rilettura vera e propria, che effettuo leggendo attentamente il testo concentrandomi su senso e ortografia, senza sforzarmi di verificare la corrispondenza parola per parola in il testo a fronte e ponendo attenzione alle parole che il vocabolario del browser mi indica come "sospette". Premo Alt+7 per "aggiustare" le correzioni (es: per convertire gli apostrofi dattilografici in tipografici, appena ne aggiungo uno)
  6. premo Alt+3 e così la pagina viene salvata con SAL 75%