Wikisource:Bar/Archivio/2019.02

Da Wikisource.
< Wikisource:Bar‎ | Archivio(Reindirizzamento da Wikisource:Bar)
Jump to navigation Jump to search
Benvenuto nel Bar di Wikisource!
il punto d'incontro e discussione dei wikisourciani
archivio
Filing cabinet icon.svg
2019
gen feb mar apr mag giu lug ago set ott nov dic

Cat Categoria: Wikisource Bar Bar 

Il Bar di Wikisource è il punto d'incontro e discussione dei wikisourciani. Qui si possono porre domande, fare osservazioni o inserire comunicazioni di carattere generale a proposito di it.wikisource. Per favore, tieni conto che questo non è un forum né un blog. Tratta quindi argomenti il più possibile inerenti Wikisource e il suo progetto complessivo.

Se hai quesiti specifici riguardo a determinati argomenti, dai un'occhiata ai bar tematici, se hai domande tecniche lascia un messaggio nel bar tecnico.


Desideri... No? Ti propongo qualcos'altro?

Hai appena conosciuto Wikisource e hai domande su cos'è, come funziona e cosa si può fare?

Leggi le domande frequenti.

Non trovi un'informazione?

Fa' una ricerca e esplora it.wikisource: se ancora non trovi nulla, scrivi un messaggio sul Bar.

Alcune discussioni tuttora in corso potrebbero trovarsi nella pagina del mese scorso


Pulizia su Commons[modifica]

Per imparare a muovermi su Commons, con il bot ma anche con il tool Cat-a-lot, ho cominciato a ripulire c:Category:Italian Wikisource books, che dovrebbe diventare la categoria "pulita" da cui ottenere l'elenco di tutti i file djvu/pdf che sono collegati a una pagina Indice su itwikisource. Prima della pulizia, conteneva anche centinaia di pagine File che NON sono djvu/pdf ma sono illustrazioni. Solo dopo terminata la pulizia, potrò procedere serenamente all'assegnazione a tale categoria fondamentale di tutti i file djvu/pdf non ancora categorizzati.

Da notare che nel caso di libri illustrati, in base a quanto stabilito dalla pagina Progetto:Trascrizioni/Illustrazioni, non sarà categorizzato in c:Category:Italian Wikisource books il file djvu/pdf ma la "categoria-libro" che comprende il file djvu/pdf e una sottocategoria Illustrations from....; vedi esempio c:Category:La scotennatrice.

Trovo questo riordino una sfida difficile, la mancanza di standard ha prodotto una varietà infinita di categorizzazioni, ma spero che disporre di almeno una categoria "pulita" faciliterà le cose in seguito Sono in contatto con @Ruthven che invito a tenermi d'occhio con rigore. --Alex brollo (disc.) 22:45, 3 feb 2019 (CET)

Concordo, a questo scopo ho creato anche l'elemento wikidata per l'edizione in modo da completare il cerchio. Che ne direste di creare una check list con tutte le cose che si possono fare e che sono state fatte in modo da avere sotto controllo lo stato delle cose. Magari con un bel template che categorizza automaticamente il tutto. --Luigi62 (disc.) 07:49, 4 feb 2019 (CET)
Ho pensato alla categorizzazione automatica via template, ma ho rinunciato: Commons è un ambiente troppo complesso per infilarci dei "template categorizzanti", e diventerebbe anche molto più difficile revisionare le categorie se necessario. Incoraggio gli audaci c he non l'avessero ancora fatto a attivare e a esplorare il gadget Commons Cat-a-lot, fantastico per le ricategorizzazioni, purchè gli elementi da ricategorizzare siano identificati da una categoria. Il gadget naturalmente funziona solo per categorie esplicite, non per quelle generate da template.
Bello sarebbe capire bene cosa bolle in pentola sui "Commons structured data", e quale filosofia di categorizzazione possa facilitare la transizione più indolore e automatica possibile. --Alex brollo (disc.) 11:28, 4 feb 2019 (CET)
Veramente io intendevo qui su source. Qualcosa da inserire nella pagina di discussione dell'indice. --Luigi62 (disc.) 22:40, 4 feb 2019 (CET)
@Luigi62, Ruthven Non sono sicuro di capire. Intendi un template che visualizzi in Discusione indice le categorie suggerite pronte a essere copiaincollate (o verificate) su Commons? Questo sì, si potrebbe fare e forse sarebbe una soluzione migliore di pagine di convenzioni di categorizzazione (difficilissime da applicare con costanza e completezza.... anch'io mi confondo spesso) Alex brollo (disc.) 01:26, 5 feb 2019 (CET)
Io intendo una lista del tipo: categorizzato per anno? sì/no, categorizzato per lingua? categorizzato per autore? ha il template book? è un libro illustrato? ecc. Per default sarebbe tutto NO, dopo che è stato controllato e sistemato (lavoro sporco) basterà mettere a SI; così non sarà più necessario controllare. Se poi l'indice ha un elemento wikidata è possibile che parte di questi dati di ricavi in maniera dinamica. --Luigi62 (disc.) 07:32, 5 feb 2019 (CET)
In pratica, vuoi riproporre qui le categorie di Commons, in un certo modo? Il tutto è di creare la categoria qui e poi di linkare gli elementi con Wikidata (l'altro elemento essendo quello della categoria su Commons). Poi si troverà sicuramente un modo per inserirvi gli indici in modo automatico. --Ruthven (msg) 09:24, 5 feb 2019 (CET)
Estremamente suggestiva la proposta di Luigi62.... beninteso, stiamo parlando di cose totalmente diverse, ma mi pare che sia una interessantissima "confusione creativa". Vi ricordo che ho appena scoperto che possiamo categorizzare direttamente qui pagine File che stanno su Commons.... basta aggiungere una "Descrizione locale" alle pagine File che vengono visualizzate come "cloni" delle pagine File di Commons. Propongo di sperimentare in pratica ciascuno la sua idea..... a tempo perso scriverò il codice per Template:Categorie suggerite. --Alex brollo (disc.) 11:02, 5 feb 2019 (CET)

Tech News: 2019-06[modifica]

18:12, 4 feb 2019 (CET)

Tiraboschi[modifica]

@OrbiliusMagister, Paperoastro, Xavier121 Ho cominciato a "produrre" file djvu dai pdf OPAL elencati qui: Utente:Alex brollo/Tiraboschi. Oltre al djvu (ottenuto direttamente con FineReader 11), produco un file testo pronto per essere trattato da Split per il precaricamento, mi manca solo un buon nome per le pagine Indice (non troppo lungo per favore! Mia proposta: Tiraboschi - Storia della letteratura italiana, Tomo x, Parte y, 1822) da inserire nel codice Split. Dopodichè il codice potrà essere corretto in blocco e caricato nel file Indice con Split.

Prime impressioni:

  1. trovato un "buco" di due pagine nel Tomo I, riempito con scansioni IA delle pagine mancanti;
  2. varie scansioni sono difettose (problemi sul marghine interno delle pagine);
  3. la qualità dell'OCR è nel complesso decente, ma non ho eseguito un confronto approfondito con l'OCR IA, che non soffre di problemi di difettosa scansione.
  4. non ho eseguito, pagina per pagina, il "cropping" che sarebbe opportuno ma che fatto manualmente sarebbe un lavoraccio improbo. Anche senza questo passaggio, ogni volume occupa quasi una giornata di tempo-pc. --Alex brollo (disc.) 13:00, 6 feb 2019 (CET)
Scusami Alex, ma in questo modo per me è impossibile seguirti. Non mancano pagine nel primo tomo --Xavier121 13:22, 6 feb 2019 (CET)
N.B. @Alex brollo In data 9 agosto 2014 segnalai a Ruggeri tutti gli errori del Tiraboschi Opal. Il nostro bibliotecario ha emendato tutte le sviste e oggi i file che si scaricano sono perfetti. In quella mail mi comunicò che anche LL stava lavorando sulla Storia. Potremmo valutare il lavoro già svolto da altri per sistemare l'OCR, mentre sulle immagini dobbiamo decidere come procedere: nessun problema sul cropping certosino, basta che mi si dica cosa lavorare :) --Xavier121 13:38, 6 feb 2019 (CET)
@Xavier121 Ti confermo, dal III pdf del tomo I (imgGV28aee.pdf) mancano le due pagine 446 e 447 (segnalato su OPAL; se trovi altro, avvisa --Xavier121 18:20, 6 feb 2019 (CET)). Purtroppo la mia idea di "scansioni perfette" è diversa; riguardandole le scansioni di molte pagine a me paiono marcatamente difettose.
Tuttavia niente impedisce di tentare di migliorarle, se l'OCR è decente e la sequenza è completa il djvu può essere ricaricato in versione graficamente più gradevole e curata. A me preme in questo momento accelerare e facilitare la rilettura. Alex brollo (disc.) 14:03, 6 feb 2019 (CET)
@Alex brollo Per quanto riguarda il crop, non conviene farlo a mano quando esiste un pregevole programma scritto in Java che compie il lavoro in maniera automatica. L'ho usato molte volte con un buon successo. (Provati tutti solo FR garantisce alti standard qualitativi. --Xavier121 18:20, 6 feb 2019 (CET)) Se mi date i link ai file, posso pensarci io. --Paperoastro (disc.) 14:54, 6 feb 2019 (CET)
Conosco quella classe di prodotti per pdf, il più astuto è Briss, non modificano fisicamente il contenuto del pdf ma manipolano i "box di output"; nel caso che il pdf contenga immagini, queste non possono essere minimamente modificate, nè come colori/contrasto ecc, nè con fine raddtrizzamento quando serve. Al momento non ho trovato niente di migliore di ScanTaylor, che richiede però. compe primo passo, l'estrazione dell'immagine originale contenuta nella pagina pdf, oppure un'immagine ricavata dalla "stampa virtuale" della pagina. Nel caso di OPAL, dentro il pdf si trovano semplicemente delle jpg; nel caso dei file IA o Google, le cose cambiano. --Alex brollo (disc.) 17:43, 6 feb 2019 (CET)
@Alex brollo odt qui per OCR e split. Xavier121 18:20, 6 feb 2019 (CET)
Il problema del nome dei volumi non è banale: l'edizione Classici italiani pur mantenendo la strutturazione dell'autore numera progressivamente i volumi che la riportano in volumi da I a XVI, dunque tra la numerazione dei volumi dell'edizione e la sttruttura in tomi, libri e capi
Volumi Classici italiani Struttura Tiraboschi
Tomo I - intero
Tomo II - intero
Tomo III - intero
Tomo IV - intero
Tomo V, Parte 1ª
Tomo V, Parte 2ª
Tomo VI, Parte 1ª
(da Libro 1º, Capo 1º a Libro 2º, Capo 2º)
Tomo VI, Parte 2ª
(da Libro 2º, Capo 3º a Libro 3º, Capo 2º)
Tomo VI, Parte 3ª
(da Libro 3º, Capi da 3º a 7º)
Tomo VII, Parte 1ª
(da Libro 1º, Capo 1º a Libro 2º, Capo 1º)
Tomo VII, Parte 2ª
(da Libro 2º, Capi da 2º a 4º)
Tomo VII, Parte 3ª
(Libro 3º, Capi da 1º a 3º)
Tomo VII, Parte 4ª
Tomo VIII, Parte 1ª
Tomo VIII, Parte 2ª
Tomo IX, Indici

La denominazione per volumi sia dunque rispettata come Tiraboschi - Storia della letteratura italiana, volume xx, 18yy, come andrà poi transclusa l'opera sarà decisamente un gran lavoro molti a molti. - εΔω 18:44, 6 feb 2019 (CET)

Grazie, definire il nome è una cosa importante. Continuo gli esperimenti per produrre djvu da OPAL, sono un po' frustrato perchè i primi risultati non sono ottimali e sapere che ci sono già dei djvu buoni (BN) mi fa spesso pensare: ma ne vale la pena? :-(
Tento con il passaggio in Scan Tailor e output TIFF colori; la tentazione di ottenere un output TIFF BN è forte, ma a quel pu nto tanto varrebbe usare i djvu già esistenti. Alex brollo (disc.) 10:30, 7 feb 2019 (CET)
@Alex brollo Penso sia superfluo ricordarti l'importanza della collaborazione tra la nostra wikisource e una qualsiasi biblioteca italiana e che tale obiettivo va conseguito anche al prezzo di piccoli sacrifici. Nello specifico, stasera ho un po' di tempo, se vuoi posso preparare il primo volume o uno qualsiasi. Fammi sapere :) --Xavier121 21:20, 8 feb 2019 (CET)
@Xavier121 Vuoi andare avanti tu con la produzione dei djvu a partire dal Volume V? Io potrei fermarmi e occuparmi dei campi Sommario e cominciare a esaminare il problema del caricamento dei testi. In ogni caso, la collaborazione sarà automatica e indispensabile, non appena cominceranno i lavori immediatamente successivi.... :-) Alex brollo (disc.) 15:08, 9 feb 2019 (CET)
PS: sappimi dire cosa ti "prendi in carico", mi fermo finchè non ho notizie. --Alex brollo (disc.) 15:28, 9 feb 2019 (CET)
Allora inizio col Volume V e VI che corrispondono al tomo 5 p.1 e 2 con i seguenti titoli: Tiraboschi - Storia della letteratura italiana, Volume V, tomo v, p. 1, 1823 e Tiraboschi - Storia della letteratura italiana, Volume VI, tomo v, p. 2, 1823Xavier121 15:57, 9 feb 2019 (CET)
@Xavier121 Benissimo, ma occhio ai nomi: i primi 4 volumi seguono rigorosamente lo schema proposto da Edo, e i nomi degli altri 12 volumi sono già registrati nel campo Volumi dei quattro indici. O si procede in modo coerente con quello schema, o (discutendone) si debvono modificare anche i nomi dei primi quattro file/indici. Alex brollo (disc.) 23:38, 9 feb 2019 (CET)
@Alex brollo Alza la qualità dell'immagine, disabilità i livelli multipli, restiamo sui 100 Mb a volume. Per me va bene, modifico i titoli, però considerate che senza l'indicazione dei tomi e delle parti nei titoli non si capisce molto bene perché la numerazione delle pagine tra gruppi di volumi sia in progressione invece di ricominciare daccapo. Xavier121 00:18, 10 feb 2019 (CET)

──────────────────────────────────────────────────────────────────────────────────────────────────── Dovrei aver conservato i "documenti FineReader" dei primi, proverò a disabilitare i livelli multipli (qualità "photo") come da tuo suggerimento. Il "cropping" lo giudichi esagerato? cropping molto valido :) Alex brollo (disc.) 10:01, 10 feb 2019 (CET)

Titoli[modifica]

@Alex brollo La questione è spinosa e ringrazio @OrbiliusMagister per il suggerimento, ma abbiamo un problema legato all'idea originaria sullo sviluppo dell'opera da parte dell'autore. Il Tiraboschi non divide la sua Storia letteraria in Volumi ma in tomi; l'editore invece, fissato un limite approssimativo di 500/600 pagine a contenitore, raggruppa i tomi in volumi: quando la dimensione di un tomo corrisponde al limite di pp imposto dall'edizione abbiamo una corrispondenza perfetta 1/1; se un tomo supera questo limite, per esempio il VII con molti capitoli e oltre 2000 pagine, l'editore procede alla divisione in volumi, scandita nel corpus dell'opera da una divisione in parti. Che i Volumi siano un'unità di misura necessaria (in termini materiali) ma secondaria in ordine all'idea iniziale di sviluppo dell'opera è ben evidenziato dal fatto che questa scansione, usuale per noi, non compare MAI nel Frontespizio, ma SEMPRE nell'Occhiello. A mio modestissimo parere nel Titolo che sceglieremo si dovrebbe sempre dare importanza esclusivamente ai dati del Frontespizio per due motivi:

  • Si rispetta la divisione mentale dell'autore e non dell'editore:
  • Si giustifica la progressione della pagine che altrimenti apparirebbe insolita ad un lettore moderno che intende i volumi come unità singole e indipendenti.

La mia proposta pertanto sarebbe questa, recuperando anche una vecchia esigenza di rappresentare la casa editrice (molto importante in questo caso):

Volumi Classici italiani

Tiraboschi - Storia della letteratura italiana, Tomo I, Classici italiani, 1823, I

Tiraboschi - Storia della letteratura italiana, Tomo II, Classici italiani, 1823, II

Tiraboschi - Storia della letteratura italiana, Tomo III, Classici italiani, 1823, III

Tiraboschi - Storia della letteratura italiana, Tomo IV, Classici italiani, 1823, IV

Tiraboschi - Storia della letteratura italiana, Tomo V, p. 1, Classici italiani, 1823, V

Tiraboschi - Storia della letteratura italiana, Tomo V, p. 2, Classici italiani, 1823, VI

Tiraboschi - Storia della letteratura italiana, Tomo VI, p. 1, Classici italiani, 1824, VII

Tiraboschi - Storia della letteratura italiana, Tomo VI, p. 2, Classici italiani, 1824, VIII

Tiraboschi - Storia della letteratura italiana, Tomo VI, p. 3, Classici italiani, 1824, IX

Tiraboschi - Storia della letteratura italiana, Tomo VII, p. 1, Classici italiani, 1824, X

Tiraboschi - Storia della letteratura italiana, Tomo VII, p. 2, Classici italiani, 1824, XI

Tiraboschi - Storia della letteratura italiana, Tomo VII, p. 3, Classici italiani, 1824, XII

Tiraboschi - Storia della letteratura italiana, Tomo VII, p. 4, Classici italiani, 1824, XIII

Tiraboschi - Storia della letteratura italiana, Tomo VIII, p. 1, Classici italiani, 1824, XIV

Tiraboschi - Storia della letteratura italiana, Tomo VIII, p. 2, Classici italiani, 1824, XV

Tiraboschi - Storia della letteratura italiana, Tomo IX, Indici, Classici italiani, 1826, XVI

N.B. Va da se che la scansione in tomi, ai fini della chiarezza dell'esposizione del testo, rende l'indicazione dei volumi superflua. Io, comunque, la conserverei in posizione finale per indicare le caratteristiche storiche e fisiche dell'edizione dei Classici italiani. Xavier121 11:31, 10 feb 2019 (CET)

Ubi major minor cessat, come sapete sono un "filologo" fra i più ignoranti, lascio a voi la discussione sui titoli e cerco di occuparmi di cose di tipo diverso: Sommari e testi (c'è da verificare la possibilità e la convenienza di utilizzare trascrizioni già corrette, ma di diversa edizione: l'esito è incerto). Alex brollo (disc.) 11:43, 10 feb 2019 (CET)
Mi dichiaro pienamente d'accordo con la proposta di denominazione di Xavier qui sopra (al limite non vedo la necessità di scrivere "pi punto" invece di "parte"); dato che poi in ns0 avremo diverse situazioni di transclusione occorre studiare bene la sottopaginazione e le relative pagine indice. Faccio notare che fortunatamente il sommario di ciascun tomo-parte-libro-capo è riportato con cura più volte nel testo. A quello penso di lavorare con calma in questo periodo. (OrbiliusMagister)
Bene, allora è quasi fatta.... occhio all'anno di pubblicazione del volume I (1822) e decidiamo se p. oppure parte; dopodichè rinomino i file già caricati e modifico i campi Volumi (anzi: facciamone un template, così la modifica ruisulta più facile anche in caso di ripensamenti futuri). Alex brollo (disc.) 18:33, 12 feb 2019 (CET)
A parte la mia idiosincrasia per l'uso del punto nei nomi, potremmo scordarci l'abbreviazione nel corso del tempo, o essere poco chiara ad altre persone. Alla fine fra p. e parte ci sono solo tre caratteri di differenza; per maggior chiarezza, io userei la seconda.--Paperoastro (disc.) 08:27, 13 feb 2019 (CET)

Il Marzocco, rivista letteraria[modifica]

Hola, ennesimo problema sul niente, sto caricando su archive l'ultimo numero del 1903 della rivista Il Marzocco (che contiene Uomini, uomini; donne, donne., un articolo di Neera), digitalizzato dal Gabinetto Viessieux che però pensa bene di scrivere in fondo La Voce, Libro dei Soci and Il Marzocco by Gabinetto Vieusseux is licensed under a Creative Commons Attribuzione-Non commerciale-Non opere derivate 2.5 Italia License.. Se lo carico su Commons i problemi non esistono, giusto? --divudi (disc.) 20:50, 7 feb 2019 (CET)

Solito equivoco sulla liceità di coprire con un copyright riproduzioni meccaniche.... Ruthven raccomanda di utilizzare, al posto di {{PD-1923}}, il tl {{PD-US-expired}}, e vedo anche che nei casi in cui la data di morte dell'autore sia nota, dovrebbe essere usato {{PD-old-auto-expired |deathyear= }}, con parametro richiesto dell'anno di morte dell'autore, che dovrebbe sostituire (per i testi pubblicati prima del 1924) il vecchio {{PD-old-70-1923}}. Ammetto che sono un pochinio confuso. In ogni caso, quando le due contdizioni sono soddisfatte, non vedo problema di PD. --Alex brollo (disc.) 11:57, 10 feb 2019 (CET)
thanks --divudi (disc.) 20:06, 11 feb 2019 (CET)

Italian Woman Writers[modifica]

Questo database ha un sacco di info molto particolari (esempio), c'è modo di succhiarle e metterle in wdata? --divudi (disc.) 17:42, 8 feb 2019 (CET)

L'Anello del Nibelungo di Wagner[modifica]

Ciao a tutti. Come prossimo caricamento volevo procedere con l'Anello del Nibelungo di Wagner, che è presente su IA diviso nelle quattro giornate. Mi sono però scontrato con i molti libretti diversi tra loro, tra i quali è difficile individuare dei tratti in comune. Quelli più uniformi fanno riferimento alla Scala di Milano, ma alcuni hanno una copertina rossa, altri blu, e sono rappresentati in stagioni diverse. Esiste un'edizione più "coerente" delle altre (Milano, Stabilimento Lucca) che però oltre a essere più scarna esteticamente è anche incompleta, mancando Il Crepuscolo degli Dei. Ho cercato su GB delle integrazioni e altre edizioni più coerenti ma senza successo. Pur rinunciando al caricamento, vi lascio qui un elenco di tutto ciò che è presente su IA se qualcuno volesse cimentarsi:

Edizione Milano, Stabilimento Lucca L'Oro del Reno (prologo) (1884); La Walkiria (prima giornata) (1883) e quest'altra versione riassunta (1883); Sigfrido (seconda giornata) (1884)

Teatro a La Scala (Milano) L'Oro del Reno (prologo) (Stagione 1903-04); La Walkiria (prima giornata) (Stagione 1893-94); Sigfrido (seconda giornata) (Stagione 1899-1900); Il Crepuscolo degli Dei (terza giornata) (Stagione 1896-97)

Teatro Regio (Torino) La Walkiria (prima giornata) (Stagione 1891-92), di cui è presente un doppione;

Versioni anonime La Walkiria (prima giornata) (1890); Il Crepuscolo degli Dei (terza giornata) (1900)

Aiuto formattazione caratteri[modifica]

Mi sistemate per favore questa pagina, sto girando a vuoto da un bel po'. Grazie --Susanna Giaccai (disc.) 18:44, 10 feb 2019 (CET)

✔ Fatto --Alex brollo (disc.) 21:05, 10 feb 2019 (CET)

OCR mancante[modifica]

Devo riscrivere tutta la pagina di cui manca l'OCR o c'è modo di recuperarlo? Grazie --Susanna Giaccai (disc.) 21:30, 10 feb 2019 (CET)

L'ho recuperato dalla fonte (AlianiEducazioneDellaDonna_djvu.txt). --Luigi62 (disc.) 23:14, 10 feb 2019 (CET)

il testo originale non è visibile[modifica]

https://it.wikisource.org/wiki/Pagina:Cristoforo_Colombo-_storia_della_sua_vita_e_dei_suoi_viaggi_-_Volume_II_(1857).djvu/198 il testo originale non è visibile, cosa si fa? Saluti --Utoutouto (disc.) 18:15, 11 feb 2019 (CET)

@Utoutouto intendi l'ocr? (io lo vedo) --divudi (disc.) 20:07, 11 feb 2019 (CET)
@Utoutouto O intendi l'immagine della pagina? Alle volte la visualizzazione si "incanta" ma il problema è temporaneo (anche se fastidioso). --Alex brollo (disc.) 11:13, 12 feb 2019 (CET)

Tech News: 2019-07[modifica]

19:45, 11 feb 2019 (CET)

Annunciazione[modifica]

Sto lavorando a una nuova "robaccia" che chiamo "Match and Fix", al momento la cosa è molto teorica, ma la segnalo comunque per chi non resta intimidito dalle cose complicate e da python: Utente:Alex brollo/Match and Fix. Dovrebbe consentire di correggere singole parole dell'OCR sulla base di un testo "buono" di riferimento, anche se la struttura del testo "buono" ha sostanziali differenze e senza alcuna necessità di appaiare i due testi per pagine. Già notificato Ruthven; stavolta tutto lo siluppo procederà "pubblicamente", e oggetto dei test sarà Tiraboschi.

A proposito: datemi un titolo definitivo! p. oppure parte? Odio stare "inoperoso".... :-) --Alex brollo (disc.) 12:02, 12 feb 2019 (CET)

Deciso per parte, rename fatto, creato template di navigazione: I - II - III - IV - V - VI - VII - VIII - IX - X - XI - XII - XIII - XIV - XV - XVI --Alex brollo (disc.) 13:15, 13 feb 2019 (CET)
@Alex brollo Ehm... Nel template viene scritto VI invece di IV... --Paperoastro (disc.) 15:47, 13 feb 2019 (CET)
Il bello dei template è che si correggono in un attimo e che la correzione automagicamente si dissemina. Grazie del controllo!--Alex brollo (disc.) 17:55, 13 feb 2019 (CET)
Potete vedere i primi vagiti di Match and fix nelle prime due pagine "trattate", questa e questa, e loro pagine di discussione. @OrbiliusMagister: ce la fai a darmi un feed-back o la cosa è ancora troppo nebulosa? --Alex brollo (disc.) 10:11, 14 feb 2019 (CET)
Vediamo se ho capito: pensavo di prendere il testo di Liberliber e fare con esso il M&S, invece tu prendi il testo OCR e lo confronti con quello LiberLiber in modo da ottenere in automatico una buona correzione dell'OCR senza che questo debba finire "rullato" dal M&S di LiberLiber che proviene da un'edizione differente. Ho capito bene? Se è questo che intendi hai tutta la mia stima. - εΔω 19:16, 14 feb 2019 (CET)
Sì, esattamente così. E' una cosa del tutto nuova, anche se saccheggia un bel pò di codice del Match "canonico" (che è stato scritto da un genio!). Non aspettarti che vengano corretti tutti gli errori e che non venga occasionalmente inserito qualche errore "nuovo"; ma il meccanismo è questo. Per dire la semplicità dello script: al momento, e dopo aver memorizzato l'indirizzo del djvu e quello del testo LiberLiber, il comando è maf(ini=100, fin=120) e lo script carica l'OCR aggiustato nelle pagine da 100 a 119. Tutte le pagine in lavorazione dalla 78 sono state ottenute così. Alex brollo (disc.) 22:08, 14 feb 2019 (CET)

170 anni or sono[modifica]

Costituzione della Repubblica Romana 1° luglio 1849

Qualcuno me la rilegge?

Grazie, --Accurimbono (disc) 22:18, 13 feb 2019 (CET)

✔ Fatto, a te la salatura finale --DLamba (disc.) 23:11, 13 feb 2019 (CET)
Grazie, gentilissimo. --Accurimbono (disc) 08:44, 14 feb 2019 (CET)

Progressi su Tiraboschi[modifica]

Ho caricato una decina di pagine del Volume I, a partire da pag. 78, "trattate" con Match and fix. Nella prima della serie, SAL 50%, la mia proposta di trasforemazione delle note laterali in "titoletti" (non c'è l'OCR, ma il testo è copiaincollabile daller pagine-indice: la prima è pag. 38.

Prego di osservare le particolarità (attuali) di Match and fix:

  1. tocca solo le parole; non tocca la punteggiatura;
  2. non tocca le parti di testo comprese nell'OCR ma assenti nel testo di riferimento (es. annotazioni a fine pagina); queste parti sono lasciate con l'OCR originale;
  3. non corregge errori di "spezzamento di parole" nè di "impropria fusione fra parole adiacenti";
  4. purtroppo corregge anche gli "errori" che in realtà sono rappresentati da una diversa grafia della parola nel testo di riferimento, il che può essere fastidioso, ad esempio, per le iniziali maiuscole/minuscole.

Sono a caccia di bug; ci sono possibili miglioramenti, per esempio la sistemazione degli spazi intorno alla punteggiatura. Ma il "motore", secondo me, funziona in modo molto interessante (in una pagina normale vengono individuati e corretti circa una decina di errori).

A questo punto alternerò caricamento (in piccoli blocchi di pagine) e rilettura; attendo, naturalmente, vostri commenti/osservazioni. Alex brollo (disc.) 13:39, 14 feb 2019 (CET)

Piccola annotazione: Abbiamo visto che alcune parole hanno l'iniziale maiuscola nel testo LiberLiber e non in quello Classici Italiani. - εΔω 11:54, 15 feb 2019 (CET)

Alternativa per le annotazioni laterali[modifica]

Screenshot annotazioni a lato LiberLiber.png

Sono molto ammirato dala cura che LiberLiber dedica alle sue digitalizzazioni, e come sapete sto usando le loro trascizioni come "strumento di controllo" per l'OCR Tiraboschi (il che mi rende molto più sereno, il riuso "tal quale" del loro materiale è legittimo ma personalmente imbarazzante). Noto una intelligente soluzione del problema delle annotazioni a lato, che potremmo emulare: invece di metterle a lato del testo, cosa complessa e difficilmente esportabile, le inseriscono in una "nicchia" del testo, come noi facciamo con le immagini dei capilettera. Vedete ad esempio il primo tomo. Vedo se riesco a fare uno screenshot.... nel frattempo scaricate il testo e visualizzatelo. --Alex brollo (disc.) 15:45, 14 feb 2019 (CET)

Ce l'ho fatta :-)
Ma voi scaricate e visualizzate lo stesso l'ODT... per me è bellissimo, dovremmo emularlo in toto (senza rinunciare al nostro plus, i link)--Alex brollo (disc.) 17:16, 14 feb 2019 (CET)
  • Pictogram voting support.svg Favorevole e propongo di non mantenere il numero di capitolo sia nel testo sia nella nota "a capolettera" (come deciso anche su LiberLiber) in quanto, a mio avviso, sarebbe ridondante visto che non si tratterebbe più di una nota a margine in senso stretto, ma di un capolettera immediatamente vicino allo stesso numero di capitolo nel testo. Piuttosto lo manterrei in una delle due, ma a differenza di LiberLiber terrei quello nella nota, così da rendere più evidente che si tratta del titolo del capitolo. --DLamba (disc.) 18:28, 14 feb 2019 (CET)
  • Pictogram voting support.svg Bello! Tecnicamente sarebbe possibile creare un template ad hoc con lo stile che scegliamo in modo da poterlo modificare al volo se cambiassimo idea? --Paperoastro (disc.) 20:25, 14 feb 2019 (CET)
@Paperoastro Sì, è possibile. Una domanda: io le metterei tutte sullo stesso lato, visto com'è organizzato il nostro ns0; ma in visualizzatore rispettare il lato renderebbe la cosa più carina. Se nello stesso lato, a destra o a sinistra? Alex brollo (disc.) 21:58, 14 feb 2019 (CET)
@Alex brollo Nel cartaceo alternano destra con sinistra per mantenerlo all'esterno dell'impaginazione, problema che in ns0 noi non abbiamo... Siccome sono titoli di paragrafo e noi leggiamo da sinistra a destra, io li metterei a sinistra. --Paperoastro (disc.) 22:11, 14 feb 2019 (CET)
Primo test (di pura fattibilità) qui: Pagina:Tiraboschi - Storia della letteratura italiana, Tomo I, Classici italiani, 1822, I.djvu/103. Naturalmente va raffinato, è solo un "se pol far". Io però suggerisco di eliminare il numero romano nella annotazione nella nicchia e di conservarlo nel testo normale, alla LiberLiber. Come vi accennavo sono entusiasta (e un po' umiliato...) dalla bellezza della formattazione LiberLiber.... :-) :-( Alex brollo (disc.) 23:14, 14 feb 2019 (CET)
Il termplate si chiama, con i nomi intuitivi che preferisco, {{Nal}}; ma ha due visualizzazioni alternative (una può essere "rullata" modificando il codice), la prima, denrto la nicchia, si ottiene con {{Nal|Testo del titolo}}, la seconda si ottiene con {{Nal|Testo del titolo|n}} e visualizza il solito titoletto centrato. Al momento uso la seconda sintassi. In seguito, se l'esperimento riesce, penseremo a un nome e a qualche parametro aggiuntivo. --Alex brollo (disc.) 14:38, 15 feb 2019 (CET)

Attivazione[modifica]

Fatti altri test, ho attivato la "visualizzazione in nicchia" di default, e ho anche inserito nel template il codice templatestyles, per cui la formattazione della "nota nella nicchia" può essere modificata senza toccare il codice del template, ma modificando semplicemente il css in Template:Nal/style.css. Naturalmente, essendo un template, sono possibili radicali ripensamenti che si visualizzeranno subito ovunque. Alex brollo (disc.) 07:55, 16 feb 2019 (CET)

Direi che è molto efficace e di effetto. Suggerisco nel riquadro di provare a togliere l'allineamento "giustificato" del testo e tenerlo semplicemente a sinistra: in uno spazio così piccolo, lo spazio variabile tra le parole potrebbe risultare troppo grande e quindi poco gradevole. Altra differenza rispetto a LiberLiber, ma questa non penso sia risolvibile, evitare il rientro del paragrafo ove il template è inserito per avere una visualizzazione più omogenea. --Paperoastro (disc.) 09:24, 16 feb 2019 (CET)
Vediamo... la prima è facile, la seconda meno.--Alex brollo (disc.) 13:26, 16 feb 2019 (CET)
@Paperoastro Fatto, come immaginavo la seconda è delicata. Innanzitutto si deve decidere se è utile/gradevole una riga bianca in testa al capitoletto (come qui: Pagina:Tiraboschi - Storia della letteratura italiana, Tomo I, Classici italiani, 1822, I.djvu/79 o se è meglio eliminarla: si elimina eliminando la riga vuota nel codice prima del template Nal. Poi occorre non disperarsi se il paragrafo corrispondente indenta comunque (succede in varie pagine); e qui la soluzione è "aliena", occorre aggiungere un </div> preceduto da una riga vuota in footer, come qui: Pagina:Tiraboschi - Storia della letteratura italiana, Tomo I, Classici italiani, 1822, I.djvu/82. Provate a cancellare il codice </div> oppure a eliminare la riga vuota prima del </div> e guardate voi stessi. --Alex brollo (disc.) 13:54, 16 feb 2019 (CET)
@Alex brollo Bel lavoro! Con l'allineamento a sinistra il tutto sembra più ordinato (almeno secondo me :-P). Per quanto riguarda l'indentazione del paragrafo, mi complimento con te che hai trovato una soluzione, ma sono anche d'accordo che potremmo benissimo farne a meno in quanto soluzione "aliena". Per ora lascerei anche la riga di stacco fra i paragrafi perché alla fin fine segnalano un cambio di argomento e il testo sembra meno pesante a guardarlo... --Paperoastro (disc.) 14:11, 16 feb 2019 (CET)
Il trucco "riga vuota + </div> in footer" l'ho scoperto in altri casi in cui l'indentatura fa le bizze.... sulle prime ci sono impazzito dal nervoso. --Alex brollo (disc.) 14:20, 16 feb 2019 (CET)
Ho riletto qualche pagina per "fissare" la prova. Personalmente non toglierei completamente il numero romano, piuttosto lo conserverei come parametro visto che nell'originale è centrato nel "capolettera". Cercherei anche di non perdere il rientro del paragrafo; ci si riesce inserendo una riga vuota, ma il testo si abbassa di mezza riga e inoltre lo spazio bianco tra un paragrafo e l'altro mi sembra un po' troppo. --Luigi62 (disc.) 07:41, 20 feb 2019 (CET)

Immagini centrali[modifica]

Dopo affannose ricerche ho letto da qualche parte che in caso di immagini centrate non c'è modo di "wrappare" il testo intorno. Come accade ad esempio in questa pagina: Pagina:L'Ossola_di_Carlo_Errera.djvu/53. Mi confermate che è così? Come si fa in questi casi? --Civvì (disc.) 19:02, 14 feb 2019 (CET)

Al momento la vedo come un'impresa complessa a fronte di un valore aggiunto puramente estetico a mio parere tranquillamente sacrificabile. - εΔω 19:08, 14 feb 2019 (CET)
Confermo, è una scelta tipografica infelice perchè ambigua; non si sa a colpo d'occhio se la lettura va fatta in colonna o per riga. Penso che sia questo il motivo per cui è stata usata pochissimo. Ignorare! --Alex brollo (disc.) 21:54, 14 feb 2019 (CET)
PS: Al momento, mi sembra che sia comunque una impresa impossibile piuttosto che complessa... e non è che io non sia attratto dalle sfide.... ;-) --Alex brollo (disc.) 00:27, 15 feb 2019 (CET)
  • Pictogram voting oppose.svg in epub non ha proprio senso, preferibile ingrandire l'immagine e coprire l'intera larghezza del paragrafo ecc. Xavier121 09:51, 15 feb 2019 (CET)
Sappiate che voglio molto bene alle vostre risposte <3, avevo provato a fare una roba a tabella ma l'anteprima era una vera schifezza... procedo ignorando! :-) --Civvì (disc.) 13:44, 15 feb 2019 (CET)
 :-) Accontentiamoci del nostro piccolo miracolo itwikisourciano del testo che scorre prima e dopo un'immagine floating-center.... :-) --Alex brollo (disc.) 14:10, 15 feb 2019 (CET)

Autobiografia di Ottorino Manni[modifica]

Sono riuscito a "liberare" l'autobiografia di Ottorino Manni.

https://books.google.it/books?id=y49YAAAAMAAJ

Prima era non visibile, poi ho richiesto a Google che il libro venisse riconosciuto come PD. La richiesta dopo 3 settimane è stata accolta.

Prima che scompaia di nuovo, qualcuno di esperto (@Alex brollo, Candalua, etc...) me lo può scaricare in alta definizione e trasformare in DjVu?

Si tratta di un importante personaggio senigalliese. Grazie, --Accurimbono (disc) 10:08, 15 feb 2019 (CET)

@Accurimbono Il pdf "normale" è BN ma sembra ottimo, lavoro su quello (intanto tento direttamente con pdf2djvu) Alex brollo (disc.) 11:23, 15 feb 2019 (CET)
Niente da fare, l'OCR Google è fastidioso, ripasso in FineReader (vuoi che carichi anche su IA per aumentare la diffusione del libretto?). --Alex brollo (disc.) 14:08, 15 feb 2019 (CET)
@Accurimbono Indice:Manni - La mia vita, 1921.djvu --Alex brollo (disc.) 15:57, 15 feb 2019 (CET)
Grazie @Alex brollo, sei sempre gentilissimo.
Se lo carichi anche su IA, non può che farmi piacere! :) --Accurimbono (disc) 16:53, 15 feb 2019 (CET)
@Accurimbono La mia vita (Internet Archive) Alex brollo (disc.) 23:16, 18 feb 2019 (CET)
Grazie! --Accurimbono (disc) 10:26, 20 feb 2019 (CET)

PROBLEMA TOOL DI EXPORT[modifica]

Ciao a tutti, oggi pomeriggio ho provato a scaricare dei libri, ma mi sono reso conto che il tool di export (in qualsiasi formato) risulta non funzionante (codice di errore 503). Qualcuno sa cosa sia successo? Ciao e grazie Alessandro Gianfelici (disc.) 17:07, 15 feb 2019 (CET)

Prova anche su una wikisource di lingua diversa: se non funzia nemmeno là, la risposta diventa più facile. --Alex brollo (disc.) 17:35, 15 feb 2019 (CET)
Ho provato adesso sul libro in vetrina (Il Grillo del focolare) e funzionano tutti. --Xavier121 19:27, 15 feb 2019 (CET)
Grazie mille, ora ha ripreso a funzionare anche a me! Probabilmente era un down temporaneo!

Alessandro Gianfelici (disc.) 20:56, 15 feb 2019 (CET)

Ancora una domanda su Tiraboschi[modifica]

Per favore, confrontate due "stili" di realizzazione del djvu, uno "orientato alla rilettura", uno "orientato alla fedele riproduzione della pagina originale":

E' una questione puramente estetica, le immagini (qualità "foto" alla risoluzione originale) e l'OCR hanno la stessa qualità, ma per i prossimi caricamenti vorrei adeguare lo "stile" che la nostra comunità giudica più opportuno. --Alex brollo (disc.) 00:37, 17 feb 2019 (CET)

Per me è indifferente, anche se da un punto di vista estetico siamo abituati al margine più ampio. Da un punto di vista "filologico" è meglio avere il margine ampio: non si sa mai che qualcuno in futuro si chieda se è stato tagliato qualcosa di interessante involontariamente... --Paperoastro (disc.) 10:10, 19 feb 2019 (CET)
Bene, i prossimi caricamenti con margine più ampio. Finito tutto il lavoro, forse rifarò i volumi I-IV: adesso no. :-) --Alex brollo (disc.) 17:48, 19 feb 2019 (CET)

Cristoforo Colombo[modifica]

@Luigi62 vedo che di tanto in tanto lavori anche tu su Cristoforo Colombo. Ci sarebbe da creare https://it.wikisource.org/w/index.php?title=Cristoforo_Colombo_(de_Lorgues)/Libro_IV&action=edit&redlink=1 utilizzando il template begin ma non ne sono pratico, potresti risolvere tu? Ciao e Grazie --Utoutouto (disc.) 10:35, 17 feb 2019 (CET)

Mi inserisco, ho dato qualche sistemata alla struttura del libro in ns0; di regola, nelle pagine ns0 costituite da un solo titolo di sezione, aggiungiamo un Indice col link ai suoi capitoli (es. Cristoforo Colombo (de Lorgues)/Libro I). In più il libro offre difficoltà per il fatto che fonde due diverse pagine nsIndice; le pagine dell'Indice originale, come questa, hanno una formattazione non facile, ma risolvibile con il solito {{Vi}}, non impazziteci, me ne occupo io (poi voi magari curiosate per la prossima volta...) --Alex brollo (disc.) 08:03, 18 feb 2019 (CET)
@Utoutouto, Luigi62 Indice delle materie del primo voolume sistemato; in realtà è un SAL 75% ottimistico, non ho riletto con attenzione, ma formattazione e link (ostici, per i due volumi) dovrebbero essere a posto. Torno a Tiraboschi.... --Alex brollo (disc.) 21:54, 18 feb 2019 (CET)

Tech News: 2019-08[modifica]

00:13, 19 feb 2019 (CET)

Ripassino tl|Pg e Modulo:Dati[modifica]

Il template {{Pg}} trasforma un numero pagina, così come compare in un riferimento all'interno del libro, nel link alla corrispondente pagina in nsPagina e , una volta transcluso, nel link al capitolo che contiene quella pagina. Il template visualizza di norma il numero pagina, passato come primo parametro, ma opzionalmente può visualizzare qualcosa di diverso, passato come secondo parametro (es."ivi", frequentissimo)

Problema: se la trasclusione deriva dalla "fusione" di più pagine Indice, ovviamente il numero pagina non basta: occorre anche passare il dato di quale indice contenga quella pagina. Ciò si fa passando come terzo parametro il titolo dell'indice, oppure una sua abbreviazione registrata nel Modulo:Pg. Guardate ad es. questa pagina: l'opera si compone di due volumi in due indici distinti, quindi il codice {{Pg|1}} sarebbe ambiguo; il codice {{Pg|1||cc1}} invece non è ambiguo, punta alla pagina 1 (pagina djvu 9) di Indice:Cristoforo Colombo- storia della sua vita e dei suoi viaggi - Volume I (1857).djvu. Lo fa anche qui: 1, ma siccome non siamo in nsPagina punta invece sul capitolo ns0 contenente la pagina djvu 9, ossia alla pagina 1 del libro.

Naturalmente il Modulo:Pg deve trovare da qualche parte i dati... da solo non potrebbe indivinare che la pagina djvu 9 corrisponde alla pagina 1 del liobro, e tantomeno che quella pagina è stata transclusa in un certo capitolo. Modulo:Dati/Cristoforo Colombo- storia della sua vita e dei suoi viaggi - Volume I (1857).djvu, che viene creato o aggiornato con un click su ModuloDati in sidebar, contiene proprio i dati necessari. Ogni volta che la pagina Indice viene modificata nel pagelist o nel sommario, bisognerebbe cliccare quel link. Se la pagina Indice non copntiene ancora sia un perfetto pagelist, che un Sommario ben fatto, cliccare sarebbe inutile.

Se qualcuno non ci ha imitato, questo meccanismo è unico nel mondo wikisource. :-) --Alex brollo (disc.) 18:28, 19 feb 2019 (CET)

I miei complimenti! Lo provo subito qui, ricco di rimandi a pagine dello stesso (o degli altri!!) volumi! --Paperoastro (disc.) 19:22, 19 feb 2019 (CET)
@Paperoastro Attenzione però: potrebbe sbagliare, in ns0 (non in nsPagina), nel caso che punti a pagine transcluse in diversi capitoli (con section). Purtroppo non c'è modo di capire se un certo riferimento "cade" in una sezione o in un'altra della pagina. Questo è un problema che non sono riuscito a risolvere. Alex brollo (disc.) 20:09, 19 feb 2019 (CET)