Discussioni indice:Boccaccio - Filocolo (Laterza, 1938).djvu

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

memoRegex[modifica]

{"^[ \\n]+":["eliminazione righe vuote in testa alla pagina (regex)","","g"], "«\\ ":["eliminazione spazio dopo caporale aperto","«","g"], "\\ »":["eliminazione spazio prima di caporale chiuso","»","g"], "^\\d+ .+\\n":["Eliminazione riga header che inizia con numero(regex)","","g"], "cbe":["cbe -> che","che","g"], "\\ c\\ ":["c isolato per e"," e ","g"], "qn":["inversione n in u","qu","g"], "([^aeiouAEIOU])’ +":["Normalizzazione spazi dopo apostrofo che segue consonante(regex)","$1’","g"], "(\\w)[ ]([;,:\\.?!])":["Normalizzazione spazi prima di segno di punteggiatura (regex)","$1$2","g"], "\\n:":["due punti a inizio riga, non markup wiki (regex)",":","g"], "1’":["scanno comune per l'","l’","g"], "\\ cosi\\ ":["scanno comune per così"," così ","g"], "’1":["scanno comune per 'l","’l","g"], "\\(\\ ":["eliminazione spazio dopo parentesi aperta","(","g"], "\\ \\)":["eliminazione spazio prima di parentesi chiusa",")","g"], "\\t":["sostituzione di carattere TAB con uno spazio(regex)"," ","g"], "U’":["scanno comune","ll’","g"], "\\ clic\\ ":["scanno comune"," che ","g"], "eh":["scanno comune","ch","g"], "ù":["Accenti Laterza","ú","g"], "ì":["Accenti Laterza","í","g"], "à":["Accenti Laterza","á","g"], "chè":["","ché","g"], "!!":["esclamativo spagnolo","¡","g"], "\\?\\?":["interrogativo spagnolo","¿","g"], "nè":["","né","g"], "I(\\d)":["(regex)","1$1","g"], "(\\d)I":["(regex)","$11","g"], "·":["",".","g"], "^c$":["(regex)","{{Colonna|em=-1}}","gm"], "^ac$":["(regex)","{{AltraColonna|em=-1}}","gm"], "\\ gia\\ ":[""," giá ","g"], "\\ piu\\ ":[""," piú ","g"], "^\\d+$":["(regex)","","gm"], "^\\d+ *$":["(regex)","","gm"], "^IL FILOCOLO *$":["(regex)","","gm"], "\"\"":["","»","g"], "\"":["","«","g"], "^LIBRO *$":["(regex)","","gm"], "^LIBRO.*$":["(regex)","","gm"], "l\\ ’":["","l’","g"], "\\ sara\\ ":[""," sará ","g"], "\\ pieta\\ ":[""," pietá ","g"], " citta([ ,\\.;:])":["(regex)"," cittá$1","g"], "([Dd])ch":["(regex)","$1eh","g"], "si\\ come":["","sí come","g"], "[\\n ]*$":["(regex)","","g"], "•":["",".","g"], "\\^":["","‛","g"]}

Regex non più utilizzate:

" (\\d+)":["(regex)"," {{Pg|$1}}","g"],
"}}-(\\d+)":["(regex)","}}-{{Pg|$1}}","g"],

Note di rilettura[modifica]

  • L'OCR è eccellente, ma non sono riconosciute molte lettere accentate; le parole con lettere accentate più comuni saranno caricate in memoRegex.
  • La suddivisione in libri (senza ulteriori suddivisioni) rispetta l'originale.
  • Gli accenti sulle vocali rispettano le convenzioni Laterza: á, í, ú (conversione sistematica degli accenti prevista in memoRegex). Attenzione alle è - é e alle ò - ó (verifica memoRegex prevista per le parole più comuni)