Discussioni indice:Il Baretti - Anno II, n. 9, Torino, 1925.djvu

Da Wikisource.
Jump to navigation Jump to search

Partial OCR[modifica]

Hola, @Alex brollo non capisco come mai in questo (ma anche in altri baretti che ora però ho già corretto) l'ocr che ia uploader si succhia da archive è solo parziale... su archive c'è tutto il full text. Mi sembra strano possa essere un problema di ia uploader perchè i libri che carico non hanno mai quel probl... --divudi (disc.) 15:38, 7 mag 2018 (CEST)

@Divudi85 Strano. Vedo che FineReader è in fortissima difficoltà nell'interpretazione del layout pagina del Baretti; può essere che il codice _djvu.xml sia particolarmente confuso. Essendo pochi "paginoni" io scaricherei e copiaincollerei il djvu.txt e fine. E' la strada più spiccia. Alex brollo (disc.) 16:29, 7 mag 2018 (CEST)
PS: quando FineReader "stenta" a capire il layout pagina, è opportuno verificare e ridefinire a mano i confini delle "aree" di testo; l'OCR automatico può risultare molto difettoso per erronea collocazione delle aree, talora con terribili rimescolamenti dei pezzetti di testo. In Baretti passato a FineReader ho visto parecchie aree "pasticciate". In pura teoria, quando avrò tempo e voglia di lavorare ancora sul progetto xml, la selezione delle aree dovrebbe poter essere fatta direttamente sull'immagine.... ma siamo un po' lontani dal risultato. :-( --Alex brollo (disc.) 16:46, 7 mag 2018 (CEST)
@Alex brollo Si ne ho rifatti un paio e perfino il titolo su più colonne a volte non lo capisce... Cmq sembra un "errore" concentrato sulla 3 e 4 pagina (ho caricato anche il n.10 nel frattempo e fa la stessa cosa) / Riguardo quello che dicevi del djvu unico? magari si può fare per l'annata del 1926 (il 1925 l'ho già caricato tutto da Erasmo ad Archive e poi su Commons) --divudi (disc.) 19:44, 7 mag 2018 (CEST)
P.S. già che ci sono, con @Sbubi si parlava di un modo per riunire in qualche modo i numeri, tipo una categoria? una pagina progetto? Qualche esempio di altra rivista trascritta che si può seguire? --divudi (disc.) 19:44, 7 mag 2018 (CEST)
@Divudi85, Sbubi Per riunire i numeri io farei semplicemente un paginone ns0 "Il Baretti", con l'elenco delle annate e dei fascicoli. En.source contiene parecchie riviste, si potrebbe cercare qualche esempio là. Qua da noi vedi Rivista di Cavalleria.
prova --divudi (disc.) 01:38, 8 mag 2018 (CEST)

──────────────────────────────────────────────────────────────────────────────────────────────────── Anche voto per fare un paginone in ns0 per riunire i numeri. @Xavier121 aveva iniziato a lavorare sul Baretti e poi, credo per colpa mia che non ho più avuto tempo di seguire la cosa, non ha proseguito. Forse lui aveva trovato una soluzione per la qualità del teso, ma non so quale sia perché non ho seguito bene la cosa. Avevi fatto qualche magia, Xavier? Grazie!!! Sbubi (disc.) 11:08, 8 mag 2018 (CEST)

NO. Una pagina Ns0 per ogni singolo numero del giornale: m'interessa dare dignità ad ogni uscita che possiede tutta una serie di articoli interessantissimi; considerare ogni articolo come un singolo saggio sarebbe stato molto audace (ma non sarei contrario); NO al calderone UNICO. La mia assenza è dovuta a due fattori: 1) una divisione del lavoro caotica che ha sovrapposto il contributo dei singoli generando un fenomeno terribile su un progetto come wikisource, dove il tempo è fondamentale: la ripetizione delle stesse operazioni da parte di utenti diversi! Non esiste malattia peggiore per la nostra comunità; (ovviamante, @sbubi ha agito del tutto in buonafede, ci mancherebbe!); 2) un altro progetto importantissimo legato alla figura di Aldo Moro e portato avanti con l'Archvio di Stato di Roma. A breve novità, domani fanno quarant'anni. --Xavier121 11:27, 8 mag 2018 (CEST)
Mi dispiace tanto @Xavier121 e ti chiedo scusa, è stata una cosa puramente accidentale. Tieni conto che il lavoro con gli studenti tirocinanti è molto difficile perché non sono formati e hanno tempi loro (dettati dagli esami) e quindi mi sono ritrovata coinvolta con 4 persone che volevano lavorare in fretta, più i progetti per il mio ufficio, e davvero non riesco a stare dietro a tutto nonostante la buona volontà. Complimenti per il tuo progetto su Aldo Moro e spero che vorrai ancora collaborare anche su questo. Se facciamo una pagina per ogni singolo numero, cosa proponi per aggregare? Uno dei motivi per cui ci perdevamo era anche che è difficile cercare i fascicoli Sbubi (disc.) 14:23, 8 mag 2018 (CEST)
@Xavier121, Alex brollo, Sbubi Ma infatti fino ad ora si è fatto così, no? Ogni numero ha il suo ns0, si cercava solo una soluzione per aggregare i link ai singoli numeri non per i contenuti stessi; per la pagina di prova linkata sopra ho copiato l'esempio dalla rivista di cavalleria.
Nel frattempo ho provato a fare il mega djvu della 3a annata dal quale trascludere i singoli numeri, non so se è meglio o peggio, ha sicuramente risoluzione migliore perchè l'ho fatto con finereader partendo dai jpg (2 508 × 3 628 pixel) mentre quelli importati con IA upload dai pdf su Archive sono 1 036 × 1 500 pixel. --divudi (disc.) 17:42, 8 mag 2018 (CEST)
Bene! Mi raccomando: salvataggio in djvu con livelli automatici disabilitati, massima risoluzione (originale). Prima però eservitati nella revisione (ed eventuale ridefinizione) delle aree. In Baretti è essenziale. @Xavier121 stiamo parlando unicamente di come riunire i singoli fascicoli in una pagina ns0 "indice generale" indipendente, moltro più chiara e elastica di una categoria, non di fondere i testi in un unico paginone. Tuttavia, la numerazione progressiva delle pagine 1-120 ecc. delle prime annate lascia intravedere che l'editore immaginava la possibilità di rilegare i fascicoli in volumi. Da qui l'idea di creare delle corrispondenti pagine multi-fascicolo in nsIndice. --Alex brollo (disc.) 20:16, 8 mag 2018 (CEST)
  • Pictogram voting oppose.svg ripeto: un numero-fascicolo, una pagina ns0! :) --Xavier121 20:23, 8 mag 2018 (CEST)
Ma certo! La pagina-indice sarebbe solo un contenitore di link a queste pagine indipendenti, un numero-fascicolo, una pagina ns0. Comunque di Baretti non mi occuperò a fondo, le mie scarse e disperse energie le dedico più volentieri a testi che abbiano il requisito minimo di scansioni decenti che permettano un OCR decente; purtroppo in Baretti questo requisito basilare manca. Tutta la mia ammirazione per l'abnegazione di chi ci lavora comunque. Alex brollo (disc.) 00:20, 9 mag 2018 (CEST)