Discussioni indice:Goldoni - Opere complete, Venezia 1927, XXIV.djvu

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

Pre-elaborazione immagini[modifica]

Il pdf Google è stato elaborato con ScanTailor dopo estrazione delle immagini con pdftopng ed esportato in tiff monocromatico. Ler immagini tiff risultanti sono state elaborate con ABBYY FineReader ottenendo il file djvu e il file txt. Il procedimento sarà ripetuto per i volumi 25, 26 e 27. Alex brollo (disc.). 10:22, 10 mag 2023 (CEST)[rispondi]

@Candalua Vedo che hai creato un po' di pagine. Ti va se procedo con un "caricamento preformattato" (naturalmente, da rivedere...) come ho fatto con il volume XXIII? Il testo sarebbe quasi pronto. Il caricamento non sovrascrive le pagine già esistenti. Alex brollo (disc.). 10:09, 11 mag 2023 (CEST)[rispondi]
Alex brollo: ma certo! Mi sono limitato alle pagine bianche e a quelle dei personaggi, che hanno una formattazione un po' diversa. Lancia pure! Can da Lua (disc.) 10:13, 11 mag 2023 (CEST)[rispondi]
@Candalua OK, ancora qualche rifinitura e lancio. Idem per i prossimi volumi. Alex brollo (disc.). 11:20, 11 mag 2023 (CEST)[rispondi]

Note di rilettura[modifica]

L'OCR è lontano dall'ottimale, soprattutto nelle annotazioni. La pre-elaborazione ha inserito un po' di template, ma va attentamente ricontrollata. Chi si mette nell'impresa si armi di coraggio e di pazienza... Alex brollo (disc.). 22:48, 11 mag 2023 (CEST)[rispondi]

@Candalua La trascrizxione delle primissime pagine di Giustino conferma la difficoltà dell'impresa. L'interpretazione delle annotazioni, numerosissime in Giustino, migliora abbastanza usando l'OCR Google, ma non tantissimo, restano parecchi errori. Vediamo se ce la faccio. Alex brollo (disc.). 09:35, 31 mag 2023 (CEST)[rispondi]
Capito il motivo della miriade di note in Giustino: è l'unica opera di cui si è conservato il manoscritto dell'autore. Quasi tutte le note indicano differenze rispetto a quello. Le altre non saranno così maligne! Alex brollo (disc.). 16:58, 1 giu 2023 (CEST)[rispondi]

Immagini[modifica]

Il pdf deriva da un'elaborazione delle immagini con conversione in BN, che ha deteriorato le illustrazioni. Sono provvisoriamente caricate con CeropTool, ma saranno sostituite con immagini e metadati migliori, ricavate dal pdf originale. --Alex brollo (disc.). 08:01, 5 giu 2023 (CEST)[rispondi]

Giustino sistemato Alex brollo (disc.). 07:38, 6 giu 2023 (CEST)[rispondi]

memoRegex[modifica]

{" W([\\n,;.:])":["(regex)","(0)$1","g"], "lh=1\\.5\\|":["","","g"], "\\(.{1,2}\\)":["(regex)","<sup>nota</sup>","g"], "<sup>nota</sup> *<ref>":["(regex)","\n<ref>","g"], "\\ ri\\)":[""," ( )","g"], "M.{1,2}:":["(regex)","Ms.:","g"], "^s$":["(regex)","{{sezione note}}","gm"], "</rerf>":["","</ref>","g"], "\\ Ali\\ ":[""," Alì ","g"], "<sup>nota</sup>\\ <ref\\ group=G>":["","<ref group=G>","g"], "\\n+\\}\\}":["(regex)","\n}}","g"], "“ *([\\s\\S]+?) *\"":["(regex)","“$1”","g"], "“4* *(.+?)[ ']*”":["(regex)","“$1”","g"], "Deimira":["","Delmira","g"], "\\ 3\\ ":[""," il ","g"], "\\n\\n}}":["(regex)","\n}}","g"]}