Discussioni indice:Garibaldi - Clelia.djvu

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

memoRegex[modifica]

{"—(\\S)":["(regex)","— $1","g"], "(\\S)—":["(regex)","$1 —","g"], "^» ":["(regex)","","gm"], "^t (.+)\\n+(.+)\n+":["(regex)","\n{{Ct|c=t1|$1}}\n{{Ct|c=t2|$2}}\n","gm"], "<\\/poem> *$":["(regex)","</poem>}}","gm"], "\\(\\ ":["","(","g"], "\\ \\)":["",")","g"], "([^\\n])\\n« ":["(regex)","$1\n","g"], "■ *":["(regex)","","g"], "Koma":["(regex)","Roma","g"], "Eoma":["","Roma","g"], "ché([ ,,..!?])":["(regex)","chè$1","g"], "né([ ,,..!?])":["(regex)","nè$1","g"], " P ":["(regex)"," l’","g"], " nelP ":["(regex)"," nell’","g"], "\\^\\ ":["",", ","g"], "•\\ ":["","","g"]}

Note di formattazione[modifica]

  • la formattazione del titolo e sottotitolo dei capitoli è ottenuto con styles.css e viene applicata (via memoRegex) da postOCR dopo aver premesso t + spazio alla parola CAPITOLO.
  • sono previste in memoRegex altre piccole modifiche (scannos frequenti, come Eoma e Koma per Roma; caporale + spazio a inizio riga nella continuazione dei dialoghi; carattere ■)
  • prestare attenzione alle è finali spesso "aggiustate" dall'OCR in é (es. perché, né invece che perchè, nè come nell'ortografia originale ottocentesca)