Discussioni indice:Metastasio, Pietro – Opere, Vol. I, 1912 – BEIC 1883676.djvu

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

memoRegex[modifica]

{"à":["","á","g"], "ù":["","ú","g"], "ì":["","í","g"], "<poem>":["","<poem style=\"padding-left:6em\">","g"], "^(Alessandro\\.)":["(regex)","{{Al|{{Sc|$1}}|}}","gm"], "^(Poro\\.)":["(regex)","{{Al|{{Sc|$1}}|}}","gm"], "^(Cleofide\\.)":["(regex)","{{Al|{{Sc|$1}}|}}","gm"], "^(Erissena\\.)":["(regex)","{{Al|{{Sc|$1}}|}}","gm"], "^(Gandarte\\.)":["(regex)","{{Al|{{Sc|$1}}|}}","gm"], "^(Timagene\\.)":["(regex)","{{Al|{{Sc|$1}}|}}","gm"], "\\n+<\\/poem>":["(regex)","\n</poem>","g"], "^(<poem)":["(regex)","\n$1","g"], "^(SCENA.+)":["(regex)","{{ct|f=100%|v=1|t=3|L=0px|$1}}","gm"], "^p (.+)":["(regex)","{{Ct|f=100%|v=1|L=0px|$1}}","gm"], "[.,] \\(parte\\)":["(regex)",". {{Smaller|(parte)}}","g"], "^l$":["(regex)","{{loop|15|.    }}","gm"]}

.

Test in corso[modifica]

  • Via bot è stato caricato il testo xml (da djvu) delle pagine1 .
  • il tool postOCR traduce il codice in testo, ma in questo caso è stata necessaria una profonda modifica, perchè la gran parte delle pagine viene memorizzata in modo che i nomi dei personaggi sono raccolti in una colonna di testo separata da quella delle battute.
  • aggiungendo la parola "reorder" immediatamente prima di "<OBJECT" e poi lanciando postOCR, le parole vengono riordinate, inoltre memoRegex applica parecchia della formattazione necessaria (comunque va rivista, soprattutto nelle pagine in cui esistono intestazioni scena.
  • Work in progress! --Alex brollo (disc.) 00:17, 9 apr 2018 (CEST)[rispondi]
  1. E' teoricamente possibile caricare l'xml come tale nello strato testo del djvu; questo permetterebbe di restituirlo normalmente alla creazione della pagina, ma il djvu sarebbe inutilizzabile per la ricerca ed evidenziazione della parole

Contributori[modifica]