Discussioni utente:Alex brollo

Da Wikisource.
Jump to navigation Jump to search


Legge del 20 novembre 1859, n. 3778[modifica]

Abbiamo una Legge del 20 novembre 1859, n. 3778 e le pagine Pagina:Parlamento Italiano - Atti parlamentari, 1860, Documenti.pdf/578 (e successive). Che devo fare per unire il tutto? (nelle pause tra una pagina e l'altra della intro di Luigi Morandi ai sonetti di Peppe er tosto aka 996, aka G G Belli).

Carlo M. (disc.) 18:10, 8 nov 2022 (CET)Rispondi[rispondi]
@Carlomorino Volentieri ci metto mano. però prima una conferma: vuoi sostituire il testo naked con il contenuto delle pagine dalla 578 alla 594 (tabella compresa)? O mi fermo alla fine del testo della legge, ossia alla pagina 585? Alex brollo (disc.). 18:18, 8 nov 2022 (CET)Rispondi[rispondi]
Dovrebbero stare insieme. (E io devo finire le pagine che ancora sono da trascrivere). Mi sa che metto anche un po' di ancore in giro (almeno alle provincie). Il testo su WP è ripreso da GB. Non sia mai.
de coeteris: A proposito di Luigi Morandi et.: mi avevi scritto che ne facevi una parte e di conseguenza io ho iniziato da CCXXX ca. onde evitare di conflittarmi con te. Inoltre, visto che è pesantemente lungo e che Morandi stesso ha messo una specie di indicazione di capitoli in numeri romani (che poi non sono Romani...) penso sarebbe oppotruno dividerli anche noi in capitoli.
Carlo M. (disc.) 18:32, 8 nov 2022 (CET)Rispondi[rispondi]
@Carlomorino OK per la suddivisione in capitoli (il Sommario è già terribile così, ma qualche voce in più non cambia molto), adeguo Sommario e pagina transclusa, che diventerà una pagina-indice. non preoccuparti di sovrappoizioni, sto lavorando sui Sonetti ed è abbastanza impegnativo per tenermi occupato parecchi giorni. Alex brollo (disc.). 18:39, 8 nov 2022 (CET)Rispondi[rispondi]
@Carlomorino ✔ Fatto Intanto è transcluso tutto in un paginone unico, poi lo spezzetteremo (prima ipotesi: relazione, legge, tabelle). E... grazie per Belli! Alex brollo (disc.). 20:22, 8 nov 2022 (CET)Rispondi[rispondi]

{{Breaking news}}! il testo della Legge n. 3778 è stato TUTTO trascritto. Mentre il testo vero e proprio è OK, la tabella è un po' da vomito. Se ci dai una guardata te ne rendi conto. Prima di partire lancia in resta a cambiare tutto sarà meglio ragionarci un attimo. Io mo' (= adesso) accompagno mia moglie al cinema, quindi ti lascio solo un po' di pensieri, da verificare e discutere.

  1. eliminerei il ripetere dell'intestazione a ogni piè sospinto.
  2. NON farei un unico TABLE per tutto il documento (diventa un casino trovare gli errori e correggere)
  3. La versione senza marginè più elegante ma si legge male.
  4. metterei il "PROVINCIA DI" entro il TABLE anche quando nell'originale sta fuori.

T'arisponno quanno aritorno dar cimena (=ti rispondo quando torno dal cinema).

--Carlo M. (disc.) 16:26, 9 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Eh, adesso tocca decidere... si può fare qualsiasi cosa, ma tocca decidere:
  1. se riprodurre in transclusione le pagine come stanno, in tabelle separate, e in questo caso se ficcarle tutte in un'unica paginona in ns0 o suddividerle in più sottopagine;
  2. se ristrutturare, in ns0, le tabelle delle varie pagine, fondendole a gruppi, e con quale criterio (es. una tabella unica per provincia, o una tabella per più province;
  3. se riprodurre i bordi delle tabelle così come sono nell'originale o semplificare.
Ipotizzata una soluzione alle varie domande, bisogna provare, pronti a cambiare idea se le cose diventano ieccessivamente complicate. Alex brollo (disc.). 23:16, 9 nov 2022 (CET)Rispondi[rispondi]

Io lascerei la transclusione in un unico file. Mentre sul testo non ci sono ovviamente problemi sulle tabelle i problemi ci sono.

vado in ordine:

  1. le tabelle mi piace che appaiano separate per provincia. Anche se nell'originale così non è. e quindi da eliminare il "Segue PROVINCIA DI"
  2. non so come possano essere alleggeriti i bordi che (secondo il mio gusto) sono un po' pesanti.
  3. ho provato a togliere al "Segue prov. di Genova" e l'intestazione ma allora bisogna fissare la larghezza delle varie colonne.
  4. la 4° colonna, quella con l'elenco dei comuni va allineata a sinistra (e magari anche con indentatura)

Il film (Astolfo) non era male. --Carlo M. (disc.) 23:50, 9 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Non è un caso semplice. Bisogna lavorare su styles.css, classe tab1, ficcandoci dentro tutto quello che si può. Uno degli aspetti più difficili da rendere sono le graffe che raggruppano le righe, rinuncerei sostituendole con una linea che idendifichi i vari raggruppamenti. Un secondo problema è quello dei titoli "Provincia", da standardizzare, la soluzione scovata dal tipografo è orrida. Secondo me si potrebbe adottare questa "regola": una tabella per provincia, nome provincia fuori tabella, riga didascalia ripetuta in ogni tabella (con un template), niente righe orizzontali tranne quelle che sostituiscono le graffe. In generale, filosofia "deve venire bene in ns0, a costo di qualche rinuncia di fedeltà in nsPagina". Ti va? Naturalmente ci vogliono tentativi ed errori. Alex brollo (disc.). 00:40, 10 nov 2022 (CET)Rispondi[rispondi]
Ipotesi:
  1. class tab1: con margini come dici te, larghezza della colonne a allineamento come serve nelle tabelle.
  2. intestazione fatto con tmpl. Da mettere noinclude quando la provincia prosegue nella pagina successiva e onlyinclude se la provincia inizia a metà pagina. Credo che così sarebbe come da tipografo cartaceo e secondo le esigenze del "tipografo webiano". Metterei (oltre alle ancore che già ci dovrebbero stare) anche le sezioni così se ci sfrugola il velopendulo (cit.) possiamo fare file con singole provincie. Mantenendo comunque il file intero.

Non so se ho fatto proposte ad mentulam canis. Mi sembra che stiamo dicendo entrambi la stessa cosa. Comincerei intanto del {{Tabella legge 3778}} (ci saranno altre tabelle più meno simili per altre leggi) --Carlo M. (disc.)

@Carlomorino Ok, proseguo "a tempo parziale" (voglio "finire" Belli!) rifinendo styles.css e pensando al template intestazione. Fare una tabella per provincia (con i suoi noinclude, come hai detto) facilita molto l'aggiunta di section per eventuale transclusione separata. Alex brollo (disc.). 09:54, 10 nov 2022 (CET)Rispondi[rispondi]

Fatto test:

Finito 669 ne riparliamo. --Carlo M. (disc.) 14:33, 10 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Ho un paio di idee sulle famose tabelle e lavorerei sulla pagina-test 587 portando tutto il possibile su styles.css, compresa la larghezza delle colonne e il text-indent dove serve. Ma prima serve la risposta a un quesito fisimoso: tentiamo di inserire le graffe fra la prima e la seconda colonna? Se sì, ci sono due opzioni, che devo verificare (una più "solida", ma che richiede la modifica della struttura di tutte le tabelle, l'altra più "sbrigativa", che però non funzionarebbe se ci sono testi "lunghi" nella prima colonna). Alex brollo (disc.). 10:30, 15 nov 2022 (CET)Rispondi[rispondi]

Cerco di pensare (cosa faticosa)

se è possibile mettere le graffe in un secondo tempo senza faticare troppo, conviene intanto fare senza, controllare la leggibilità e se non crea problemi fermarsi lì.
Anche le graffe messe dal tipografo spesso non sono chiare.
--Carlo M. (disc.) 10:41, 15 nov 2022 (CET)Rispondi[rispondi]
@Carlomorino ho trovato un paio di intoppi:
  1. styles.css va in conflitto con rowspan, "vede" come cella first-of-type talora il nome della provincia, talora il numero progressivo. Risolto fissando la laghezza delle colonne nella sezione header in pagina 586;
  2. la soluzione spiccia per le eventuali graffe non va, bisognerebbe usare quella "solida", ma lascerei perdere volentieri, il bordo fra una provincia e l'altra rende le cose molto chiare.
Ti segnalo le "pensate" adottate in pag 586 e 587:
  1. TUTTE le celle hanno text-indent, agendo sulla classe tab1 in styles.css, ma l'effetto si vede solo nelle righe lunghe;
  2. le tabelle sono spezzate una per provincia;
  3. invece di usare un template per l'intestazione, ho definito una section in pagina 586, e basta richiamarla nel punto giusto come in pagina 587 per sistemare la tabella.
  4. a causa del conflitto rowspan-styles non è possibile fissare l'align:right per i numerelli della colonna 2. Se indispensabile, l'align va scritto a mano per le celle critiche.
  5. l'unica formattazione che va messa a mano è il rowspan + {{cs|Mb}} per le celle delle provincie in colonna 1, oltre che i bold e i italic opportuni.
  6. resta il problema della unione, in transclusione, fra tabelle spezzate in pagine successive ma penso sia risolvibile.
Alex brollo (disc.). 12:50, 15 nov 2022 (CET)Rispondi[rispondi]

A me sembra, a uno sguardo veloce, decisamente ok. E ora? --Carlo M. (disc.) 13:06, 15 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Ti propongo di correggere il puro testo in tabelle elementari, poi io ripasso, se trovi difficoltà, a formattare. Intanto proseguo formattando le pagine già tabellate (intravedo un altro problemino, ma non dovrebbe essere ostico). una curiosità: hai incontrato in Belli il tl|nsb? Strano a dirsi, può essere usato anche in questo testo.... mi divertirò a fare un esperimento. Alex brollo (disc.). 13:26, 15 nov 2022 (CET)Rispondi[rispondi]
Se mi riesce di riunire Como, pagine 588-589, forse è fatta.... :-) Alex brollo (disc.). 13:53, 15 nov 2022 (CET)Rispondi[rispondi]
Como riunita in transclusione! Alex brollo (disc.). 14:24, 15 nov 2022 (CET)Rispondi[rispondi]

Numeri a lato[modifica]

Ciao Alex, qui i numeri a lato come si inseriscono? Grazie! Spinoziano (BEIC) (disc.) 14:48, 10 nov 2022 (CET)Rispondi[rispondi]

@Spinoziano (BEIC) Al momento non c'è soluzione; non li inseriamo. Eventuali annotazioni che puntano su un numero riga sono trasformate in annotazioni standard applicate all'interno del testo con tag ref. Alex brollo (disc.). 15:06, 10 nov 2022 (CET)Rispondi[rispondi]
Ok, allora lì non li inseriamo. Grazie, a presto.--Spinoziano (BEIC) (disc.) 15:19, 10 nov 2022 (CET)Rispondi[rispondi]

In virtù di un autore citato[modifica]

Carissimo, avrei bisogno di inserire un Ec (precisamente:{{Ec|Francesco Beccattini|Becattini}}) nel secondo blocco di Autore citato qui Xavier121 14:35, 14 nov 2022 (CET)Rispondi[rispondi]

@Xavier121 provato e riprovato..... e gettata la spugna :-( Alex brollo (disc.). 14:52, 14 nov 2022 (CET)Rispondi[rispondi]

Nota annidata[modifica]

Pagina:Ferretti - Centoventi sonetti in dialetto romanesco.pdf/42

O so io che nun sò bbono o le spiegazzioni nun sò cchiare.

(Template:Note annidate)

Carlo M. (disc.) 19:50, 20 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Il caso, più che un caso, è un casino, perchè la seconda annotazione cade dentro un poem, il chd non è previsto dal template. Provo a risolverlo. Ammetto un piccolo colpetto di Alzheimer: di tl|Note annidate avevo perso la memoria :-( Alex brollo (disc.). 21:04, 20 nov 2022 (CET)Rispondi[rispondi]
@Carlomorino Ho aggirato vilmente il problema, ma il risultato, dai, non è male. Alex brollo (disc.). 07:08, 21 nov 2022 (CET)Rispondi[rispondi]
Furbastro !!! Non è che a furia di leggere Peppe er Tosto prendi anche i nostri "difetti"? Altro problemino appresso.--Carlo M. (disc.) 17:25, 21 nov 2022 (CET)Rispondi[rispondi]
@Carlomorino OK, debitamente pungolato e ferito nell'amor proprio mi ci sono messo... controlleremo poi come viene in trnsclusione.

Appendice[modifica]

Ne avevamo già parlato ma ho dimenticato cosa avevamo detto.

Il problema: Qui sono elencati alcuni atti che dovremmo sistemare.

Il primo pezzo è quasi ok. Quasi perché manca quasta parte che lo modifica (section già messa).

Mancano i decreti dittatoriali per Emilia e per Toscana. Poi quando abbiamo tempo mettiamo a posto le tabelle.

Il problema è decidere il nome. Così quando serve li linko da WP.

--Carlo M. (disc.) 17:25, 21 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Volentieri "ripasserò" le altre tabelle; sui nomi non sono forte e spesso sono in imbarazzo anche sui testi su cui lavoro direttamente, figurimoci su quelli altrui. Per quanto riguarda l'integrazione da pag. 596, non immagino come tu voglia rappresentarla.... Alex brollo (disc.). 23:33, 21 nov 2022 (CET)Rispondi[rispondi]

Fatti:

Statuto e legge elettorale nelle Provincie dell'Emilia
Statuto e legge elettorale nella Toscana

Intanto è arrivato un altro problemino: l'impostazione per la tabella di:

Nuova ripartizione dei collegi elettorali di Sardegna

Quando hai tempo e voglia. --Carlo M. (disc.) 23:10, 22 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino particolarmente fastidiosa, a prima vista... di gran lunga peggiore delle altre. vediamo.... Alex brollo (disc.). 07:23, 23 nov 2022 (CET)Rispondi[rispondi]

Ma chi avete eletto?[modifica]

Uno mezzo matto? Guarda che ha combinato!

Pagina:Parlamento subalpino - Atti parlamentari, 1853-54, Documenti.pdf/368

-- Anonimo romanesco. (disc.) 12:00, 23 nov 2022 (CET)Rispondi[rispondi]

@Carlomorino Di fronte un tabella del genere. io ci penso lungo.... e poi sbaglio un mezza dozzina di volte. :-) al momento non sono nemmeno alla fase 1°..... temo che in questo caso maligno le graffe siano indispensabili. Se mi convinco che lo siano, bisogna strutturare la tabella per loro fin dall'inizio. Alex brollo (disc.). 17:13, 23 nov 2022 (CET)Rispondi[rispondi]

WOW!![modifica]

Indice:Parlamento subalpino - Atti parlamentari, 1848.pdf/styles.css

Creata nuova class!! Meraviglia delle meraviglie:

FUNZIONA!!!


Carlo M. (disc.) 17:08, 6 dic 2022 (CET)Rispondi[rispondi]

p.s. Pagina con Indice, un indice veramente di classe. Carlo M. (disc.) 17:12, 6 dic 2022 (CET)Rispondi[rispondi]

Manca il tocco finale[modifica]

Cari Alex e @Candalua,

mi hanno chiesto di spostare l'indice delle prose di Bianca Laura Saibante: l'ho fatto, ho spostato tutte le pagine che afferivano ad esso al nuovo indice, ho creato il nuovo ModuloDati, ho aggiornato i pages index in ns0: tutto bene se non fosse che in ns0 non mi compaiono i template capitolo di navigazione tra le varie novelle del testo. Magari è solo questione di aspettare, ma più probabilmente ho sbagliato qualcosa nel processo che ti ho descritto: c'è qualche altro file da aggiornare? εΔω 14:46, 19 dic 2022 (CET)Rispondi[rispondi]

Tu quoque @OrbiliusMagister! Più automatismi vi facciamo, e più vi dimenticate come funzionano i template :) Tutti i template IncludiIntestazione erano vuoti, perché la frettolosa caricatrice aveva creato le pagine ns0 prima di compilare il sommario, e quindi mancavano i link. Le ho rigenerate col bottoncino del "fulmine" e ora sono a posto. Can da Lua (disc.) 15:03, 19 dic 2022 (CET)Rispondi[rispondi]
@Candalua Richiesta h. 14,46, risoluzione problema h. 15.03. Fulmineo! :-) Alex brollo (disc.). 15:12, 19 dic 2022 (CET)Rispondi[rispondi]

Numero versi[modifica]

Ciao Alex, c'è un modo per sistemare il "5" a destra di "l’albero della" in Pagina:Abrabanel, Juda ben Isaac – Dialoghi d'amore, 1929 – BEIC 1855777.djvu/412? Quel numero risulta proprio appiccicato, tanto che si vede appena. Spinoziano (BEIC) (disc.) 17:40, 21 dic 2022 (CET)Rispondi[rispondi]

@Spinoziano (BEIC) Ce ne sono diversi, ne ho applicato uno: assegnare a poem uno style "margin-right" leggermente negativo, che sovrascrive il valore di default, che è di 2em, e così si crea un po' più di spazio a destra. Il problema, però, è delicato, perchè dipende dai particolari del layout di visualizzazione e dai suoi vincoli. Ad esempio, sul mio schermo e con il mio browser il problema non si verificava. Alex brollo (disc.). 17:53, 21 dic 2022 (CET)Rispondi[rispondi]
Ciao Alex, sempre a proposito di versi, in casi come Pagina:Abrabanel, Juda ben Isaac – Dialoghi d'amore, 1929 – BEIC 1855777.djvu/408 dobbiamo riprodurre l'a capo tipografico che nella pagina originale è presente per "e la mia fede è nella sua grazia" e, se sì, c'è uno standard per farlo? Grazie!--Spinoziano (BEIC) (disc.) 12:50, 22 dic 2022 (CET)Rispondi[rispondi]
@Spinoziano (BEIC) L'effetto, volendolo riprodurre, si ottiene con uno span float:right che "appoggia" la seconda parte del verso al margine dx. Fammi provare... penso che ci voglia anche un display:inline-block. Alex brollo (disc.). 17:47, 22 dic 2022 (CET)Rispondi[rispondi]
@Spinoziano (BEIC) Vedi se vi va: la parentesi quadra è opzionale. Il css della classe vl (acronimo di "verso lungo) è nella pagina styles.css dell'Indice. Alex brollo (disc.). 18:12, 22 dic 2022 (CET)Rispondi[rispondi]
Mitico!! Grazie! --Spinoziano (BEIC) (disc.) 18:25, 22 dic 2022 (CET)Rispondi[rispondi]

Sono un disastro, aiuto![modifica]

Caro Alex,

mi tocca chiedere il tuo aiuto dopo aver provato ad arrangiarmi: prima di gettarmi in progetti ad ampio respiro volevo cavarmi due sassi dalla scarpa: i Canti di Aleardi e il Lucrezio tradotto da Marchetti: entrambi hanno problemi.

  1. Aleardi (trovato su GB) ho provato a trasformarlo in djvu con un convertitore online, ma nel processo le sue dimensioni sono decuplicate. Caricatolo comunque su commons mi sono accorto che chi lo ha messo sotto lo scanner era molto distratto, e ci sono diversi gruppi di pagine acquisite due volte... Se volessi mettere in ordine e ricaricare quel testo mi appresterei ad accoppiarlo a Canti (Aleardi).
  2. Il caso del De rerum natura tradotto da Giovanni Marchetti ti è già noto: Sono stato frettoloso e non ho capito bene quante e quali pagine sono state duplicate o acquisite in ordine sbagliato e ti ho interpellato prima di avere idea dell'entità del problema: vista la necessità di rivedere completamente la numerazione e l'ordine delle pagine ho dovuto interromperne la trascrizione.

Torno a chiedere umilmente perdono per il disturbo: se tu potessi, con gli strumenti che io non ho, controllare questi due file e ricaricarli con le pagine in ordine potrei procedere con M&S e trascrizione senza patemi o sorprese. εΔω 23:37, 3 gen 2023 (CET)Rispondi[rispondi]

@OrbiliusMagister Volentieri... Il lavoro su Sonetti romaneschi alle volte è un po' tedioso e una ricreazione è benvenuta. Alex brollo (disc.). 08:21, 4 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Il tomo I di Lucrezio dovrebbe essere a posto; ho trovato la pagina 72 mancante, la 73 duplicata, e l'assenza delle pagine dalla 203 in poi (libro IV monco). Ho adeguato il pagelist. Il tomo II dovrebbe essere a posto, confermami per favore.
I tomi di Lucrezio sono entrambi a posto. Grazie! - εΔω 09:48, 4 gen 2023 (CET)Rispondi[rispondi]
Per Aleardi, mi metto a ripassarlo. Alex brollo (disc.). 09:34, 4 gen 2023 (CET)Rispondi[rispondi]
Nell'attesa mi sono travestito da bot e ho regolarizzato un po' di indici da file rinominati su commons. - εΔω 11:11, 4 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Che pasticcio era Aleardi! Ho deciso di rifarlo daccapo con abbyy, partendo dal pdf, e poi ho dato la caccia ai doppioni. Il djvu è dimagrito moltissimo, ma mi sembra che la qualità sia più o meno invariata. Lo carico su commons al posto del vecchio. Alex brollo (disc.). 18:13, 4 gen 2023 (CET)Rispondi[rispondi]
Non si finisce mai di controllare:
ho appena scoperto che Pagina:Aleardi - Canti, Firenze 1899.djvu/18 e Pagina:Aleardi - Canti, Firenze 1899.djvu/19 sono doppioni da eliminare di Pagina:Aleardi - Canti, Firenze 1899.djvu/22 e Pagina:Aleardi - Canti, Firenze 1899.djvu/23: senza i doppioni la numerazione delle pagine torna a correre. Per evitare ulteriori sorprese ho scaricato il file e ripassato la sequenza pagina per pagina: dopo queste due pagine in più la sequenza è corretta. P.S. ho provato a generare il ModuloDati ma inutilmente. εΔω 09:04, 5 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Dovrei aver sistemato. Ho corretto il pagelist e spostato quelle poche pagine che andavano spostate.
Modulo dati è schizzinoso: vuole che esista qualcosa nel Sommario. Altre cose che tollera male sono le doppie virgolette nei nomi o nei titoli, e la presenza di elementi estranei nel campo pagelist. Quando il campo Sommario sarà completato, basterà richiamare il tool per sistemare.
Riguardo alle pagine dell'Indice , anche tl|Vi e tl|Pg sono abbastanza schizzinosi.... non uso mai tl|Spazi per le indentature di blocchi di titoli, uso invece il tl|Ms; Pg non gradisce spazi attorno ai parametri. Se il titolo è più lungo di una riga, tocca usare il parametro larghezzap per ottenere un risultato gradevole. Alex brollo (disc.). 11:53, 5 gen 2023 (CET)Rispondi[rispondi]
Grazie, sei fantastico! ^__^ εΔω 12:25, 5 gen 2023 (CET)Rispondi[rispondi]

Sto cercando fonti su queste monete.

In alcuni casi c'è un testo su IA e su GB.

La domanda è: convienemi usare IA upload (ammesso che ancora funzioni) o caricare direttamente da GB?

Carlo M. (disc.) 14:40, 5 gen 2023 (CET)Rispondi[rispondi]

@Carlomorino Al momento, l'unico vantaggio che si ottiene nel trasformare un pdf in un djvu per gli utenti "normali"(tranne pochi "anormali"come me) è che il djvu permette di far correre il Match and Split mediawiki. Se non ci sono testi di cui fare il M&S, quindi io caricherei direttamente il pdf Google, eliminando però l'eventuale pagina "warning" prima del caricamento. Il programma libero pdfsam lo fa benissimo. Alex brollo (disc.). 15:07, 5 gen 2023 (CET)Rispondi[rispondi]

Nguè Nguè (non è un calciatore africano ma un pianto infantile): ho scaricato il file ma commons mi dice che è troppo grosso: 194,1 MB su disco (194.055.770 byte). Ho provato a caricarlo direttamente da GB e mi dice che da quel sito (GB) non si può caricare. E poi dice che uno compra la Treccani... Carico da IA? IA upload funziona ancora? p.s. l'autore è autore:Edoardo Martinori e il testo è La moneta: vocabolario generale.--Carlo M. (disc.) 19:06, 5 gen 2023 (CET)Rispondi[rispondi]

Carlomorino Si può, si può. Ci vuole un tool "Chunked upload"da attivare su Commons. Attivato, il limite di grandezza dei file diventa di 2 Gby o_O. Io sarei pronto a caricare il tuo file che dovrebbe essere questo, giusto? Andrebbe bene File:Martinori - La moneta: vocabolario generale.pdf o basta File:Martinori - La moneta.pdf, che io, minimalista, preferirei? Alex brollo (disc.). 20:23, 5 gen 2023 (CET)Rispondi[rispondi]
PS: le istruzioni per installare il tool su Commons qui: c:Help:Chunked upload Alex brollo (disc.). 20:26, 5 gen 2023 (CET)Rispondi[rispondi]
Io avevo previsto: La moneta: vocabolario generale.pdf. Mi sembra che alla fine ci siano della pagine ripetute e una tavola "fallica". Per fortuna ho l'originale....
Per il chuck (chissà che vor di', ma perchè non parlano una lingua decente?) vedo se di capisco qualcosa.
Carlo M. (disc.) 21:05, 5 gen 2023 (CET)Rispondi[rispondi]
Carlomorino Sarebbe bene controllare e sistemare il pdf prima di caricarlo.... le pagine duplicate non sono un problema (ma sarebbe bene eliminarle), mentre invece sarebbe un problema se alcune pagine fossero mancanti. Te la senti di controllare? Io stento a scorrere pagina per pagina un pdf così enorme. Alex brollo (disc.). 21:56, 5 gen 2023 (CET)Rispondi[rispondi]
Lo farò tra le Befana e santa Stefanessa. Al massimo per l'8. Poi spero di riuscire a usare Chuck (Berry). Buona notte. --Carlo M. (disc.) 23:34, 5 gen 2023 (CET)Rispondi[rispondi]
@Carlomorino Chunked significa "a pezzi", il file viene trasmesso a Commons in segmenti e poi ricostruito. Mi prostro davanti a chi ha ideato il magheggio. Alex brollo (disc.). 23:42, 5 gen 2023 (CET)Rispondi[rispondi]
"fatto a...". Comunque Chuck Berry è (era) più figo. Bonae novae: non mancano pagine. de coeteris: le donne di casa sono stanche per il lavoro fatto stanotte a cavallo delle loro scope. --Carlo M. (disc.) 09:52, 6 gen 2023 (CET)Rispondi[rispondi]
@Carlomorino Ma tu hai a casa uno scanner piano per scannerizzare pagine di libri della tua biblioteca? Io ho lo scanner, ma non ho la biblioteca.... la qualità delle immagini a fine libro è molto incostante, buone scansioni a colori sarebbero doverose. Se non mancano pagine io caricherei, c on nome file File:La moneta: vocabolario generale.pdf. ma forse vuoi farlo tu per provare Chunk. Sappimi dire. Alex brollo (disc.). 11:01, 6 gen 2023 (CET)Rispondi[rispondi]

A casa ho uno scanner piano ma si è rotto e devo sostituirlo. L'ho usato molto per acquisire tutti i documenti sparsi tra tutti i familiari e che riguardano "li mortacci mia": diversi mega di foto, manoscritti, quadri (un paio di pittori in famiglia e alcuni ceramografi; se ti interessa dai una letta ai miei conflitti di interesse). Il "mio Martinori" è messo molto male. Dovrò fargli rifare la rilegatura. Detto questo: il file di GB l'ho caricato. Non credo che mi ci metterò a lavorare subito. Forse lavorerò alcune pagine che servono come fonti per WP. Cercherò anche di fargli pubblicità sperando che qualche altro appassionato di monete inizi a venire anche di qua.

p.s. non diversi mega ma oltre 27 Giga...--Carlo M. (disc.) 14:27, 6 gen 2023 (CET)Rispondi[rispondi]

2 domande 2:

che scanner tieni (faccio la spia....)
Qui mi sono inventato una sciocchezza. Il nome delle "sotto-pagine" è la moneta.../A mentre sull'indice si legge "A". Non so se mettere le virgolette al nome della sotto-pagina o toglierle dall'indice oppure lasciare tutto così. Che ne dici? --Carlo M. (disc.) 19:25, 8 gen 2023 (CET)Rispondi[rispondi]
@Carlomorino 1. Un antico scanner Epson. 2: NO! Niente doppie virgolette! Sono un carattere "tossico" per Indice sommario, per scoprirlo ho usurato un bel po' di neuroni. Alex brollo (disc.). 21:04, 8 gen 2023 (CET)Rispondi[rispondi]

Nuovo vocabolario Siciliano-Italiano[modifica]

Ciao, vorrei trascrivere il libro di Antonino Traina Nuovo vocabolario Siciliano-Italiano, presente sul sito digitale-sammlungen.de in CC0. ma non so quali norme vi sono per il formato del file, come dev'essere trascritto, ecc. Àncilu (disc.) 22:36, 12 gen 2023 (CET)Rispondi[rispondi]

@Àncilu Posso permettermi di suggerirti di pensarci a lungo? Si tratterebbe di un lavoro estremamente lungo e difficile - centinaia e centinaia di ore di lavoro anche per un trascrittore molto esperto. In teoria basterebbe caricare il testo in formato pdf, ma... non è certo il lavoro con cui iniziare una collaborazione con wikisource. Alex brollo (disc.). 23:59, 12 gen 2023 (CET)Rispondi[rispondi]
@Àncilu Il testo è disponibile anche su archive.org: IA oppure IA. Alex brollo (disc.). 00:04, 13 gen 2023 (CET)Rispondi[rispondi]
Ho contribuito da IP per un po' di tempo (tipo 1 anno e mezzo) su wikisource francofona e multilingual. In realtà vorrei trascriverlo per averlo più facilmente come fonte sul wikizionario francofono. E anche perché il sito che conteneva una bellissima trascrizione, veramente ben fatta è sparito. Certo è ancora accessibile sulla wayback machine, ma per comodità è più semplice averlo in un sito più rapido che archive.org. Àncilu (disc.) 00:07, 13 gen 2023 (CET)Rispondi[rispondi]
@Àncilu La precedente trascrizione mi interessa moltissimo. Puoi vertificare se è disponibile sulla wayback machine? Ricordi l'url del sito?
Prima di imbarcarsi nel caricamento completo, direi comunque di fare alcuni test su una o poche pagine per verificare la qualità dell'OCR incorporato nei file o ottenibile con gli strumenti mediawiki. L'OCR dei file IA non è male: richiede comunque decine e decine di correzioni per pagina. Alex brollo (disc.). 09:40, 13 gen 2023 (CET)Rispondi[rispondi]
Ho ancora un filtro che me lo impedisce, quindi te lo mando spezzato https ://web.archive.org/web/20220123153301/https ://www.liberliber.it/mediateca/libri/t/traina/nuovo_vocabolario_siciliano/pdf/traina_nuovo_vocabolario_siciliano.pdf . Àncilu (disc.) 09:50, 13 gen 2023 (CET)Rispondi[rispondi]
La trascrizione su LiberLiber, quella replicata nella wayback machine. è ancora diasponibile: https://www.liberliber.it/online/autori/autori-t/antonino-traina/nuovo-vocabolario-siciliano-italiano/ . A questo punto rifare il lavoro mi sembra veramente difficile da giustificare. Alex brollo (disc.). 10:03, 13 gen 2023 (CET)Rispondi[rispondi]
@Àncilu @OrbiliusMagister La cosa si fa interessante. Ma prima una domanda: che livello di competenza informatica hai? Sei a tuo agio nella manipolazione xml/html/css? O addirittura sei un profondo conoscitore della manipolazione dei file pdf, a livello della estrazione non solo del testo, ma anche del suo codice di formattazione?
In breve, il problema. Nei dizionari non basta estrarre il testo, occorre estrarre anche la formattazione delle singole voci e delle singole parole (grassetto, corsivo, maiuscoletto hanno essenziale valore informativo). Tutte queste informazioni sono open nel formato file odt di LiberLiber, molto meno open nel formato pdf. Ci sarebbero anche in alcune estrazioni OCR, ma con innumerevoli errori, sia nel riconoscimento caratteri che nel riconoscimento della formattazione, da correggere manualmente, uno a uno. In questo caso particolare, quindi, essendo disponibile da fonte open source sia il testo corretto da umani, che la sua formattazione, rifare tutto quanto è impensabile. L'ipotesi di caricare il dizionario in wikisource passa attraverso il lavoro di analisi e programmazione della conversione automatizzata del codice odt in un codice mediawiki. La cosa per certi versi mi affascina, per altri mi terrorizza. Pingo OrbiliusMagister per un'opinione generale. Alex brollo (disc.). 11:34, 13 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Ripingo.... probabile che il ping precedente sia inefficace. Alex brollo (disc.). 11:38, 13 gen 2023 (CET)Rispondi[rispondi]
@Alex brollo: So smanettare i file odt, ma non so quali template di formattazione siano i più adatti a wikisource. Magari se sto un po' qua a contribuire mi impratichisco con tutti i template ecc. (Tipo per il maiuscoletto so usare i tag span per l'effetto, ma non so ad esempio se qua c'è un template specifico che fa ciò). Àncilu (disc.) 11:54, 13 gen 2023 (CET)Rispondi[rispondi]
@Àncilu "So smanettare odt" è molto incoraggiante. Magari anche un minimo di python... sarebbe l'ideale.
La formattazione delle singole parole è facilissima: '''grassetto''' ''corsivo'' {{Sc|maiuscoletto}} -> grassetto corsivo maiuscoletto. Ogni voce, un paragrafo con testo continuo, senza acapo. Per separare i paragrafi, una linea vuota. Per ottenere l'indentazione dei paragrafi, si può fare in vari modi, anche con css generale. Riguardo per bene l'html derivato dal odt via LiberOffice. comincio a essere ottimista (il lavoro si sta trasformando da impossibile a parecchio impegnativo). :-) Alex brollo (disc.). 12:59, 13 gen 2023 (CET)Rispondi[rispondi]
Vabbè il wikitesto lo conosco :P sennò non avrei più di 20 000 contributi. Era per capire se appunto c'erano template di messa in pagina; Àncilu (disc.) 15:23, 13 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Il caso è particolare: dovrebbe prestarsi a un caricamento di massa fortemente automatizzato, analogo a quello usato per Dizionario - Vocabolario del dialetto triestino ma con risultati ancora migliori. @Àncilu Scusa la banalità sul wikicode... no, non ci sono template particolari; volendo riprodurre il layout a due colonne (ma io rinuncerei) vedi {{Colonna}}, {{AltraColonna}} e {{FineColonna}}, che agiscono, opportunamente, solo in nsPagina. Il problema più spinoso è suddividere correttamente il testo in pagine, devo guardare bene il codice html per vedere se c'è qualche codice di fine pagina originale. Se non c'è, bisogna inventarsi qualcosa: esiste un tool "match and split", ma di certo non funziona bene su testo formattato. Ci rifletterò.
Io non sono riuscito a scaricare il pdf dal sito tedesco, mi piacerebbe confrontarne la qualità con quello IA. Tu ce l'hai fatta? Alex brollo (disc.). 18:37, 13 gen 2023 (CET)Rispondi[rispondi]
Sì ecco il il link [https ://download.digitale-sammlungen.de/pdf/16736398578888bsb10524014.pdf]. Dopo circa un trimestre di contribuzione qua penso che comincerò a fare questo, preferisco davvero prendere un po' di pratica con wikisource. Àncilu (disc.) 21:11, 13 gen 2023 (CET)Rispondi[rispondi]
Ehm..... scusateni, vedo solo ora il ping. Onestamente il mio contributo è poca cosa. Consiglierei ad @Àncilu di prendere un testo compilativo come Dizionario Latino-Italiano e dare un'occhiata ai vari codici di formattazione nelle pagine già formattate.
In seconda battuta da un'occhiata al testo di Internet Archive posso affermare che l'imprsa è certo fattibile, ma che mille e rotte pagine di testo sono destinate a produrre risultati come Dizionario moderno, Vocabolario del dialetto napolitano o Vocabolario dell'uso abruzzese, imprese ben cominciate ma arenatesi e in attesa da anni di completamento. εΔω 14:45, 13 gen 2023 (CET)Rispondi[rispondi]
@Àncilu Un po' di complicazioni. Il sito tedesco continua a sembrarmi problematico: per realizzare il lavoro (secondo me) occorre basarsi sulla versione LiberLiber + un pdf della stessa edizione (1868: altre edizioni presentano diffuse differenze). Su IA trovo due items dell'edizione 1868, una ha un pdf con risoluzione insoddisfacente, l'altra: IA ha buone scansioni ma l'ordine delle pagine è buggato: la sequenza va verificata pagina per pagina (es. manca la pagina 154) Senza un pdf, che contenga tutte le pagone nell'ordine giusto, non comincio nemmeno a lavorare.... continuo la ricerca e le verifiche; il mio pessimismo cresce un pochino. Alex brollo (disc.). 20:07, 14 gen 2023 (CET)Rispondi[rispondi]

OrbiliusMasochister[modifica]

Caro Alex,

ti aggiorno sul mio lavoro e ti do un paio di notizie interessanti:

  • finito Aleardo Aleardi (di cui sono molto contento), lascio da parte il Pavese che avevo sbocconcellato prima di te (e a dirla tutta sono tentato di dividere i romanzi con capitoli numerati in sottopagine) per guardarmi intorno...
  • riprendo il mio progetto di completare il Lucrezio tradotto da Marchetti: è un paciugo dato che il M&S bruto contrappone due edizioni troppo diverse tra loro e l'OCR preesistente non è molto incoraggiante nemmeno per iniziare. L'OCR di google permette quantomeno di non impazzire ma ogni pagina è un discreto bagno di sudore: per la mia salute mentale decido a malincuore di non affrontare di petto tutte le pagine ma di alternarle ad altre riletture;
  • ho scoperto una falla molto interessante da coprire: Il Canzoniere di Matteo Bandello che ha praticamente tutte le poesie in ns0 da collegare alle pagine dell'indice. Ci sarà un bello sforzo da compiere con le note in calce, ma dopo il lavorone su Monti, Dresselio e Aleardi mi sento abbastanza rodato. Non avevo messo in programma questo indice ma la prospettiva di applicare un poderoso accoppiamento di pagine ns0-nsPagina anche senza M&S mi attrae e dunque... mi faccio del male.
  • Con grande soddisfazione ho portato a termine un altro grosso colpo: dopo i due Capuana fiabeschi, dopo Aleardi, ho ottenuto da Google la liberazione di un altro elemento da anni annorum nella mia wishlist: il Catechismo Maggiore! Finalmente leggibile la sua fonte su Google Books, la metto in coda per il prossimo lavoro di M&S. Dato però che si tratta di molte piccole pagine, che come al solito le pagine del libro portano più materiale di quello presente in ns0 e che la formattazione non è banalissima, prima di effettuare altre operazioni volevo chiederti se potevi dare un'occhiata al pdf di Google e in particolare allo testo testo per effettuare il caricamento su commons di un file apprezzabile (magari djvu).
  • In coda mooolto nei sogni a lungo termine ti elenco le mie mire:
    1. Inseguire poesiole e prosette meno note di Foscolo o Manzoni presenti sia in nsPagina che in ns0 ma non accoppiate (Cfr. qui con la pagina dell'autore)
    2. Ritornare su Romagnoli (Aristofane oppure completare la collezione cercando i volumi mancanti);
    3. Prendere il coraggio a due mani e accoppiare i Fioretti di San Francesco con l'edizione che contiene la Vita di Frate Ginepro:
    4. Ristrutturare in ns0 il Tesoro di Brunetto latini attualmente in stato pietoso a metà tra struttura di libri "cartacei" e "logici";
    • rileggere tante opere che lo meritano e chiudere tanti cantieri lasciati aperti (qui l'elenco è veramente enorme)
    • nota che finora ho toccato perlopiù il tasto "ns0"... se penso al lavoro che attende in nsOpera o alla semplice "scoperta di nuovi testi interessanti da trascrivere" (come ad esempio le migliaia di pagine della Gazzetta musicale Ricordi, le centinaia di poesie di Chiabrera e Testi) qui mi fermo.
  • A latere ho scoperto un mesetto fa che la Rätoromanische chrestomathie volume XII è del tutto disaccoppiata con la fonte e sarebbero centinaia di pagine... ma dopo un tentativo pagina e transclusione ho capito che era una impresa più grande di me...

Questo lo stato dell'arte del mio passatempo preferito. Lo tengo "tra me e te" anche se immagino che qualche altro utente non si tratterrà dallo sbirciare questo papello. εΔω 19:30, 24 gen 2023 (CET)Rispondi[rispondi]

@OrbiliusMagister Sto dando un'occhiata a Catechismo Maggiore. Dovrei caricare il djvu ex Google books oggi o domani.Alex brollo (disc.). 07:17, 25 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Per non lavorare di band, mi confermi che la fonte Google è quella giusta? Alex brollo (disc.). 09:32, 25 gen 2023 (CET)Rispondi[rispondi]
La fonte sembra quella esatta; intravedo la possibilità di un adeguamento massivo della formattazione direttamente in ns0, almeno parziale, preliminare al M&S (aggiunta D - R; eliminazione numerazione delle domande/risposte; formato intestazione delle domande->paragrafo normale in corsivo). Il M & S sarebbe anche facilitato dell'aggiunta dei titoli nel testo spostandoli dal tl Intestazione (senza formattazione, il M&S si imbroglia con i tl Centrato e simili). La suddivisione delle pagine segue i "capi" e, anche se è abbastanza frammentata, penso che potrebbe restare quella che è. Tutto via bot, ovviamente. Approvi? Alex brollo (disc.). 10:12, 25 gen 2023 (CET)Rispondi[rispondi]
Certo che approvo! È tutto un lavorone in meno da intraprendere da zero: se ci sono aggiustamenti da fare saranno sicuramente meno numerosi di quanta formattazione andrebbe diversamente aggiunta a mano. εΔω 12:52, 25 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Carico il djvu; nome file, autore (vigliaccamente: Pio X) ecc. tutti provvisori. Ti raccomando: se vuoi cambiare nome file, facciamolo subito, prima di caricare pagine. Nome provvisorio: : File:Catechismo Maggiore, 1905.djvu. Lascio perdere tutti gli altri masochismi, i sonetti romaneschi e il dizionario siciliano-italiano ne hanno una dose ottima ed abbondante. Alex brollo (disc.). 17:52, 25 gen 2023 (CET)Rispondi[rispondi]

────────────────────────────────────────────────────────────────────────────────────────────────────Rinomina effettuata. Ti prego, non lasciare gli altri masochismi: in particolare io resto ostacolato nella ricerca di titoli da disambiguare finché l'elenco di titoli multipli non sarà sfoltito di duemilaerotti doppioni di titoli dei sonetti romaneschi. ;-) εΔω 06:47, 27 gen 2023 (CET)Rispondi[rispondi]

@OrbiliusMagister Appaiamento conservativo effettuato, non ti sto a dire il numero di problemi. Appaiamento conservativo significa che c'è una lunga lista di sonetto naked appaiati a sonetti proofread, ossia veri doppioni, e una lista, aimè lunga, ancora da sfoltire controllandoli uno a uno, di casi di mancato appaiamento . Il confronto viene eseguito anche per somiglianza del contenuto, via bot. Una strage di neuroni. Tu pensi che i naked già appaiati possano essere marcati con {{cancella subito}} e tanti saluti?
L'alternativa: cancellare tutti i naked, siano o non siano appaiati, e tanti saluti. Ma esito a farlo. Alex brollo (disc.). 07:30, 27 gen 2023 (CET)Rispondi[rispondi]
Come ho già scritto altrove io sono assai meno scrupoloso e procederei per eliminazione in blocco: gli unici scrupoli che mi sono sorti dalle discussioni fatte finora riguardano solo quei sonetti che mancano nella raccolta di Morandi e sono stati accorpati successivamente. Per il resto Cancella subito. εΔω 08:32, 27 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister OK, cerco di salvare i mancanti in Morandi, poi do una passata di bot. Alex brollo (disc.). 09:01, 27 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Non si sono appaiati 137 sonetti naked. Suppongo che Morandi si sia scandalizzato particolarmente per la gustosa corona "Le confidenze de le regazze" :-). Procedo con la marcatura dei sonetti naked duplicati. Alex brollo (disc.). 19:17, 27 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister Alla fine della marcatura saranno pronte per la cancellazione immediata oltre 2000 sottopagine ns0 SAL 75%. La cosa provocherà tacche visibili nelle statistiche... :-(
Come "trattiamo" i sonetti naked non cancellati? Vanno spostati da Sonetti romaneschi, ma dove li mettiamo? Alex brollo (disc.). 00:07, 28 gen 2023 (CET)Rispondi[rispondi]
Caro Alex,
mi spiace per la statistica, ma duemila nuove pagine ns0 SAL 75% le creeremo nel corso di quest'anno, dunque non me ne dolgo eccessivamente: pensa invece alla tacca di percentuale di testi proofread vs naked che questa operazione comporterà (a cui aggiungerò nel corso dei prossimi mesi sia le molte pagine ns0 di Bandello che quelle del Catechismo maggiore). Io i sonetti romaneschi superstiti li tratterei così:
  1. Creo la raccolta Sonetti romaneschi (1998) con l'infotesto che trovi nella cronologia di Discussione:Sonetti romaneschi e ci elenco i sonetti supertiti
  2. questi sonetti possono essere tanto sottopagine della raccolta, ma per coerenza con la raccolta proofread potremmo "liberarli" con il titolo dato dal Belli a ciascun sonetto e linkandoli alla nuova raccolta.
  3. Infine, per scrupolo di coscienza, creo in una sottopagina utente un elenco di link rossi con tutti i sonetti cancellati: non si sa mai che in futuro si vogliano ripristinare e in tal modo avremmo una pagina per recuperarli tutti.
Spero che si capisca quello che ho scritto. εΔω 06:37, 28 gen 2023 (CET)Rispondi[rispondi]
@OrbiliusMagister ✔ Fatto punti 1 e 2, per ora spostati in sottopagine (ci saranno in giro link rossi). ✔ Fatto punto 3, in Utente:Alex brollo/Sonetti romaneschi 1998, cancellati Alex brollo (disc.). 15:50, 28 gen 2023 (CET)Rispondi[rispondi]

Non so perché mi mette in rosso alcuni collegamenti peraltro presenti. Mistero collegamentoso. :-) Carlo M. (disc.) 13:28, 9 feb 2023 (CET)Rispondi[rispondi]

@Carlomorino Aggiornato il ModuloDati, il problema sembra scomparso. Alex brollo (disc.). 13:44, 9 feb 2023 (CET)Rispondi[rispondi]