Wikisource:Domande tecniche/Archivio/2019
Transclusione del template VoceIndice
[modifica]In questa transclusione date un'occhiata nelle note. Esiste una soluzione oppure meglio convertire tutto in una tabella? --Luigi62 (disc.) 23:26, 8 gen 2019 (CET)
- Sistemato, mi sembra; occorrerebbe organizzare una "pagina di link a esempi per casi difficili", ci penso spesso e non lo faccio mai... :-( --Alex brollo (disc.) 11:50, 19 gen 2019 (CET)
Help.... help!
[modifica]Messaggio in bottiglia: mediawiki sta rendendo le cose sempre più complesse, in più sto tentando di passare a Linux come sistema operativo principale per lavorare con BrolloBot.... se c'è qualcuno che ha esperienza di bot sotto Linux, ho bisogno di aiuto. Ma chi cerco dev'essere molto paziente anche in caso di domande veramente banali.
Prima difficoltà: mi sono subito incastrato nel login. Se volessi usare Special:BotPasswords:
- devo entrare nella pagina speciale del progetto dove voglio lavorare con il bot, naturalmente avendo l'account bot?
- devo farlo progetto per progetto?
- devo accedere con l'account personale di "guidatore del bot" o con l'account bot?
Al momento non prendo nemmeno in considerazione l'autenticazione OAuth che è molto più complessa e di cui non capisco nulla. --Alex brollo (disc.) 11:58, 19 gen 2019 (CET)
Funzioni asincrone
[modifica]@Candalua, Ruthven Nonostante gli sforzi, faccio sempre fatica a ragionare in termini di chiamate asincrone, il default delle chiamate ajax, che richiedono una logica particolare per la necessità di "passare" una funzione callback da eseguire a risposta asincrona ottenuta. Vi pongo alcune domande.
- se imposto async:false la logica asincrona viene naturalmente aggirata ma ricevo un warning riguardo a conseguenze su "bad experience" dell'utente. Posso ignorare questi warning, quando la risposta è velocissima (frazioni di secondo) e tanti saluti?
- immaginiamo di usare le callback. Come passo i parametri necessari alla funzione callback? Come ulteriori parametri?
- qua e là i migliori gadget fanno uso di chiamate non asincrone per recuperare il wikitext di pagine varie. Il "bug del febbraio 2019" impedisce di accedere al wikitext nd nsIndice e di nsPagina via
index.php?action=raw
metre funzionano le routine di lettura del wikitext via api.php, ok. Conosco due API che recuperano il wikitext; una attraversoapi.php?action=query
, che mi fornisce le revisioni di una pagina o il wikitext anche di pagine multiple, l'altra attraversoapi.php?action=parse
che può restituirmi il puro wikitext di una pagina. Dovendo ottenere il wikitext di una singola pagina, ci sono motivi per preferire query o parse? --Alex brollo (disc.) 10:13, 24 feb 2019 (CET)
- @Alex brollo Allora, credo che ci sia un errore di architettura di fondo. Devi usare le funzioni asincrone, quindi
- se fai
async:false
, allora forzi la sincronia e blocchi (freeze) l'esecuzione del programma in caso di ritardo di risposta al callback. Quindi ti va bene nel caso di server veloce, ma è una cattiva pratica di programmazione. Si chiama "callback Hell": in pratica forzi l'arresto del programma ogni volta che interroghi un server. In realtà, il tuo programma deve andare avanti lo stesso; semplicemente se il server non risponde, la funzione non si esegue (si eseguirà dopo, eventualmente). - Il callback non può cambiare forma (altrimenti non viene riconosciuto). Se fai un callback, vuol dire che stai chiamando un server con una cosa del tipo
- se fai
var i = ... ajax("api..", function(XXXXX) { corpo... }
- Nel callback puoi usare unicamente le variabili definite dentro allo stesso o quelle definite fuori e prima (come i nel nostro esempio qui sopra) e non hai bisogno di passarle come variabili. È come se definissi in C una variabile fuori da un ciclo while: dentro al ciclo le puoi chiamare lo stesso. Poi, se vuoi usare quello che ti risponde il server (in modo asincrono), lo puoi fare con i parametri XXXXX della funzione callback. --Ruthven (msg) 17:59, 26 feb 2019 (CET)
- @Ruthven Grazie! Se i parametri possono essere definiti "fuori", questo mi chiarisce parecchio. Il C non lo conosco quindi la similitudine non mi aiuta :-). Proverò a fare questo sforzo di "ribaltamento di logica". Alex brollo (disc.) 19:04, 26 feb 2019 (CET)
- Nel callback puoi usare unicamente le variabili definite dentro allo stesso o quelle definite fuori e prima (come i nel nostro esempio qui sopra) e non hai bisogno di passarle come variabili. È come se definissi in C una variabile fuori da un ciclo while: dentro al ciclo le puoi chiamare lo stesso. Poi, se vuoi usare quello che ti risponde il server (in modo asincrono), lo puoi fare con i parametri XXXXX della funzione callback. --Ruthven (msg) 17:59, 26 feb 2019 (CET)
Problema python
[modifica]@Candalua Adesso lavoro in Linux Mint, dual boot con Windows 7 (del 10 mi sono liberato). Python sotto Linux va che è una meraviglia; stranamente ogni tentativo di installazione di Python sotto Windows 7 mi dà uo strato errore; non funzionano nè os.system, nè le chiamate subprocess, stesso errore codice -1. Ho reinstallato 4 volte, diverse versioni di python2.7, niente. sempre lo stesso errore. Io sospetto del dual boot: ci sono altre ipotesi? --Alex brollo (disc.) 09:15, 26 feb 2019 (CET)
Aggiornamento messaggi
[modifica]Salve a tutti. Segnalo che in settimana ho aggiornato su translatewiki il messaggio che definisce il contenuto del tasto "modifica wikitesto" in alto, trasformandolo in "modifica sorgente" (e lo stesso per alcuni messaggi correlati, elencati sotto). Questo è dovuto al fatto che la dicitura "wikitesto" non si applica a tutte le pagine (ad esempio lua o JS), e perché il messaggio originale dice proprio "edit source": "wikitesto" è una traduzione assolutamente libera. Su itwp qualche anno fa era stato deciso di cambiare "modifica sorgente" in "modifica wikitesto" perché "sorgente" poteva scoraggiare gli utenti novizi (vedi discussione), ma la modifica riguardava solo itwp. Qualora anche voi preferiste "wikitesto" a "sorgente", gli admin possono ripristinare la vecchia dicitura nei seguenti messaggi:
- MediaWiki:Visualeditor-ca-editsource
- MediaWiki:Visualeditor-ca-editsource-section
- MediaWiki:Visualeditor-mweditmodesource-warning
- MediaWiki:Visualeditor-mweditmodesource-title
- MediaWiki:Visualeditor-ca-createsource
Segnalo che alcuni di questi hanno ancora la dicitura "wikitesto" perché non sono arrivate le nuove traduzioni. In questo caso, le soluzioni sono due: o aspettate che arrivi la nuova traduzione per modificarli, oppure fate un dummy edit per crearli (ad es. aggiungendo uno spazio in mezzo) e poi ripristinate il vecchio messaggio (vedi come ho fatto io su itwp). Approfitto dell'occasione per ricordare che il testo dei messaggi, in generale, non va mai usato nelle linee guida: altrimenti, ogni volta che cambia un messaggio vanno cambiate tutte le linee guida che ne riportano il testo. È invece buona abitudine transcluderli direttamente, vedi esempio. Per una lista di possibili utilizzi, vedere questa ricerca approssimativa. Per qualsiasi informazione o richiesta di aiuto, cortesemente pingatemi perché non seguo la pagina. Grazie, --Daimona Eaytoy (disc.) 11:08, 23 mar 2019 (CET) PS: Per favore, aggiornate il maledetto filtro 1... È impensabile non whitelistare almeno i link a progetti wiki...
- @Daimona Eaytoy Non so che nome si vorrà usare qui, se "testo", "wikitesto" o "sorgente" (quest'ultimo più informatico che libraio). Di contro, non sarebbe meglio rimuovere il filtro 1 ed usare piuttosto MediaWiki:Spam-blacklist e MediaWiki:Spam-whitelist? --Ruthven (msg) 09:28, 24 mar 2019 (CET)
- @Ruthven Sulla preferenza del testo da usare non saprei... C'è anche da dire che ho aperto T219056 per poter avere "modifica" e "modifica visuale", che risolverebbe forse tanti grattacapi. Riguardo al filtro, in realtà un po' ne capisco la necessità, ma diamine, scatta anche con un link interno come https://it.wikisource.org/wiki/Pagina_principale... Ovviamente se serve aiuto anche per quello basta chiedere. --Daimona Eaytoy (disc.) 09:55, 24 mar 2019 (CET)
- @Daimona Eaytoy Fatto --Ruthven (msg) 15:19, 24 mar 2019 (CET)
- @Ruthven Sulla preferenza del testo da usare non saprei... C'è anche da dire che ho aperto T219056 per poter avere "modifica" e "modifica visuale", che risolverebbe forse tanti grattacapi. Riguardo al filtro, in realtà un po' ne capisco la necessità, ma diamine, scatta anche con un link interno come https://it.wikisource.org/wiki/Pagina_principale... Ovviamente se serve aiuto anche per quello basta chiedere. --Daimona Eaytoy (disc.) 09:55, 24 mar 2019 (CET)
- @Ruthven, una volta questo filtro bloccava solo gli utenti con meno di 3 contributi, ora invece sta bloccando tutti... se vogliamo tenerlo così, dovremmo mettere in whitelist tutti i siti esterni che usiamo regolarmente, tipo archive.org, wmflabs.org, books.google.com ecc. @Daimona Eaytoy ci puoi dare una mano? se serve ti possiamo dare temporaneamente il flag di sysop. Can da Lua (disc.) 16:34, 25 mar 2019 (CET)
- @Candalua Beh, al momento è molto meglio della prima versione, se non altro... Darei una mano volentieri, ma ricostruire un filtro da capo è un po' oltre ciò che posso fare al momento... Suggerisco invece di dare un'occhiata ad altri progetti (magari mediawiki.org, dove c'è tanto spam) e scopiazzare un po' i loro filtri antispam. --Daimona Eaytoy (disc.) 16:49, 25 mar 2019 (CET)
- @Candalua Non credo che sia cambiato il fatto che blocchi solo gli utenti con meno di 3 contributi. Se qualcosa non ti è chiara, parliamone in privato magari (via email). --Ruthven (msg) 17:30, 25 mar 2019 (CET)
- Beh sì, ha bloccato anche me :D (e pure, che è più grave, il MediaWiki message delivery...) Se la cosa non è voluta, allora cerco di rimetterlo com'era (credo manchi solo un paio di parentesi). Can da Lua (disc.) 17:49, 25 mar 2019 (CET)
- @Ruthven ora dovrebbe essere a posto. Teniamo d'occhio il registro nei prossimi giorni Can da Lua (disc.) 17:55, 25 mar 2019 (CET)
- Beh sì, ha bloccato anche me :D (e pure, che è più grave, il MediaWiki message delivery...) Se la cosa non è voluta, allora cerco di rimetterlo com'era (credo manchi solo un paio di parentesi). Can da Lua (disc.) 17:49, 25 mar 2019 (CET)
- @Candalua Non credo che sia cambiato il fatto che blocchi solo gli utenti con meno di 3 contributi. Se qualcosa non ti è chiara, parliamone in privato magari (via email). --Ruthven (msg) 17:30, 25 mar 2019 (CET)
- @Candalua Beh, al momento è molto meglio della prima versione, se non altro... Darei una mano volentieri, ma ricostruire un filtro da capo è un po' oltre ciò che posso fare al momento... Suggerisco invece di dare un'occhiata ad altri progetti (magari mediawiki.org, dove c'è tanto spam) e scopiazzare un po' i loro filtri antispam. --Daimona Eaytoy (disc.) 16:49, 25 mar 2019 (CET)
- @Ruthven, una volta questo filtro bloccava solo gli utenti con meno di 3 contributi, ora invece sta bloccando tutti... se vogliamo tenerlo così, dovremmo mettere in whitelist tutti i siti esterni che usiamo regolarmente, tipo archive.org, wmflabs.org, books.google.com ecc. @Daimona Eaytoy ci puoi dare una mano? se serve ti possiamo dare temporaneamente il flag di sysop. Can da Lua (disc.) 16:34, 25 mar 2019 (CET)
Casella ricerca anche nelle sottopagine ns0
[modifica]@Candalua, OrbiliusMagister Penso sarebbe utile far comparire la casella Ricerca anche nelle sottopagine ns0, o almeno in alcune (es. nelle sottopagine di Storia della letteratura italiana (Tiraboschi, 1822-1826), corrispondenti ai vari tomi). Posso provarci ma non ho idea di dove trovare il codice che la genera. --Alex brollo (disc.) 07:40, 10 apr 2019 (CEST)
- OK, trovato. In Template:IncludiIntestazione/Sandbox una possibile soluzione: aggiungendo un parametro
ricerca=si
si apre il box input Ricerca come in pagina principale. Resta da discutere se è utile/se è bello. --Alex brollo (disc.) 00:23, 12 apr 2019 (CEST)
Pseudobot funziona?
[modifica]@Candalua, OrbiliusMagister Sto facendo grossi caricamenti con Split!, ma nonostante mi sia attivato il profilo "pseudobot" per Utente:Alex brollo, i miei contributi "massivi" restano in chiaro in Ultime modifiche. Why? --Alex brollo (disc.) 12:06, 5 mag 2019 (CEST)
- Alex brollo, dovrei controllare, ma così a occhio credo che facendo modifiche tramite le api, ci sia qualche flag per indicare che si vuole usare la modalità bot; in altre parole non è sufficiente avere il flag, bisogna anche dire al sistema che si vuole usarlo. Domani se riesco ti cerco qualche istruzione in merito. Can da Lua (disc.) 17:38, 5 mag 2019 (CEST)
- Alex brollo, ci sei poi riuscito? Se usi come immagino la action=edit ci dovrebbe essere un parametro bot=true, vedi mw:API:Edit. --Can da Lua (disc.) 15:37, 11 mag 2019 (CEST)
- Can da Lua Grazie, l'azione è effettivamente edit, provo ad aggiungere il parametro. --Alex brollo (disc.) 01:04, 15 mag 2019 (CEST)
- Can da Lua Avevi ragione. --Alex brollo (disc.) 09:01, 27 mag 2019 (CEST)
- Can da Lua Grazie, l'azione è effettivamente edit, provo ad aggiungere il parametro. --Alex brollo (disc.) 01:04, 15 mag 2019 (CEST)
Sottopagine in nsAutore
[modifica]@Candalua nsAutore è abbastanza "delicato": ci sono problemi a creare sottopagine? Mi serve una localizzazione "logica" per un estratto tabellare (esportabile facilmente in excel) dei metadati delle pagine Indice delle opere di un autore. Forse sarebbe meglio farli comparire direttamente in un popup, piuttosto che salvarli. --Alex brollo (disc.) 00:58, 15 mag 2019 (CEST)
Dizionario per la correzione delle s lunghe
[modifica]@Xavier121, OrbiliusMagister Trovata una bella collezione di scansioni di buona qualità, in toni di grigio, provenienza Getty (no Google!) delle commedie di Goldoni, Pasquali 1761: Delle commedie di Carlo Goldoni. Il problema è che l'OCR risente dell'uso dell'epoca delle s lunghe e trasforma quasi tutti i ſ in f. Per questo genere di opere non mi sembra opportuna una versione diplomatica stretta con conservazione dei caratteri; quindi proverei a costruire un dizionario di conversione apposito per agevolare la pre-elaborazione offline. Ne vale la pena? Goldoni è una "macchia" di wikisource, non c'è nulla proofread. --Alex brollo (disc.) 09:49, 12 giu 2019 (CEST)
- Dobbiamo confrontarci e mi rimetto molto all'intendimento di Xavier che è più modernista di me: l'edizione del 1761 è più vicina alle intenzioni e all'ortografia dell'autore (sarà preziosa la fedeltà all'ortografia veneziana dei testi), ma ha certamente una tipografia molto antiquata, in cui anche senza guardare una pagina non fatico a prevedere
- abitudini di punteggiatura molto strane ai nostri occhi moderni
- Iniziali Maiuscole a Profusione Anche per Fare Scena
- forse ancora qualche u e qualche v scambiate senza particolare intenzione
- gruppi consonantici e accentazioni anarchiche ltineggianti, gallicizzantio spagnoleggianti ("un pò"; "va à casa!"; "harei havuto honori da huomo" ecc.)
- varie ed eventuali...
- Su questo rimarrei fedele quanto già definito in sede di Convenzioni di trascrizione: adattiamo u/v e modernizziamo le esse lunghe, per il resto lasciamo stare com'è. Ora cedo la palla a Xavier, supponendo che distinguere una edizione diplomatica da una edizione moderna sia una fatica improba che rischia di allontanare i rilettori per un corpus di ampio respiro come le opere di Goldoni.
- Mi sovviene infine che nel 1761 Goldoni era ancora vivo e vegeto, ma non conosco la vicenda editoriale delle sue commedie a quell'anno: ve ne sono di successive? È un'edizione che gode del benestare dell'autore e dunque autorevole? - εΔω 22:15, 12 giu 2019 (CEST)
- visto che la "colpa" iniziale è mia, posso dirvi quello che ho trovato per i vari punti indicati da @OrbiliusMagister:
- per la punteggiatura, ci sono un po' di virgole che io non userei e a volte un ; scambiato con la , - però in genere nulla di particolare
- c'è qualche Maiuscola, ma nemmeno troppe; giusto qualcuna su parole come Locandiere
- u e v sono a posto, al limite si trova qualche j semiconsonantica in "ajuto", ma meno di quanto troveremmo in un testo dell'Ottocento
- niente roba spagnoleggiante (ma Goldoni è veneziano; il problema al più sono appunto i venetismi, ma devo dire che generalmente sono abbastanza standard. Non è il trevisano che conosco abbastanza bene da parte di madre o il padovano che conosco un po' da parte di padre, ma la grafia è sufficientemente standard
- Io insomma eviterei le ſ, ma per il resto non vedo grosse difficoltà di comprensione rispetto per dire alla versione Utet che ho scaricato da MLOL (e che mi sa che abbia avuto un OCR... ci sono almeno un paio di punti in cui anziché CLARICE si trova scritto CLARTCE)
- Cito un paio di punti dalle note bibliografiche: «È noto che non possediamo i manoscritti delle commedie goldoniane e quindi, per poter giungere a una trascrizione filologicamente meno arbitraria, non c’era altra via che rifarsi alle più autorevoli stampe settecentesche, rivedute dall’Autore. così la maggior parte delle commedie sono state esemplate sull’edizione del Pasquali; » «È stata, per lo più, mantenuta la punteggiatura originaria, mentre è stato regolato l’uso delle maiuscole. Per quel che riguarda le didascalie, invece, anche allo scopo di evitare possibili confusioni, si è preferito inserirle al punto giusto, piuttosto che lasciarle alla fine della battuta.» Diciamo che fosse per me lascerei punteggiatura e maiuscole originali che non danno troppi problemi al lettore, mentre ho dei dubbi sulle didascalie. Per i refusi evidenti, immagino che sia meglio correggerli, anche per permettere una ricerca più semplice. --.mau. (disc.) 16:40, 13 giu 2019 (CEST)
- @.mau., OrbiliusMagister, Candalua La cosa si fa interessante; se la Pasquali è autorevole come sembra, bene; se addirittura potrebbe essere stata visionata dall'autore, benissimo! Potremmo aver trovato l'edizione di riferimento. Adottate le convenzioni di conversione dei caratteri, io rispetterei tutto il resto (per i refusi assolutamente certi e indiscutibili, c'è il template {{Ec}}).
- Riguardo alla conversione automatizzata via dizionario delle ſ in s ho sperimentato la cosa con Orlando furioso (sec. la stampa 1532) e ho visto che funziona bene, ma non risolve parola ambigue (es. buffo - busso) in cui entrambe le alterative sono lemmi sensati; la scelta fra le due alternative dipende dal contesto, nella larghissima maggioranza dei casi è evidente a un lettore umano senza nemmeno consultare l'immagine originale. Si potrebbe perfino correeggere direttamento lo strato testo djvu. Insomma, per me sarebbe una bella avventura, lavorare su quella raccolta. Ma.... Goldoni è un caso particolare, perchè quando usa il veneziano il suo posto sarebbe su vec.source. Quindi al momento ci penso e basta, non mi metto all'opera.... Alex brollo (disc.) 21:54, 13 giu 2019 (CEST)
- @Alex brollo, OrbiliusMagister, Candalua sempre per la mia minima esperienza sul Servitore di due padroni, la commedia è in bilico, nel senso che Pantalone, Truffaldino, Brighella e Smeraldina parlano in veneziano, ma Clarice, Beatrice, Florindo, il dottore e Silvio parlano in italiano. Dal punto di vista filologico, insomma, può stare sia in it.source che in vec.source senza problemi. È però ovvio che un OCR si pianterà comunque per la metà del tempo. (Ma come dicevo, per me rileggere il veneziano non è molto faticoso). --.mau. (disc.) 08:48, 14 giu 2019 (CEST)
- @.mau., Candalua per tagliare la testa al toro prevedo un criterio quantitativo: le commedie con copione interamente in veneziano vanno su vec.source; quelle con un personaggio che parla toscano in mezzo a un contesto totalmente veneziano possono ancora stare su vec.source, ma dove il toscano non è sporadico o di un solo personaggio meglio stiano qui. Poi nulla impedisce di trascludere uno stesso indice in due posti diversi, lo sappiamo. A me preme principalmente la rileggibilità de testo. - εΔω 18:44, 14 giu 2019 (CEST)
- @.mau., OrbiliusMagister, Candalua IA Upload aveva ottime ragioni per non fare il suo: il file xml da ciui ricava il testo è un disastro mai visto. Ipotesi: invece di far costruire il djvu da FineReader, potrebbe essere che i server di IA tentino la conversione _abbyy-xml (output di FineReader) in _djvu.xml. Risultato: file _djvu.xml inutilizzabile, e non solo: ad esempio, il pdf derivato ha 352 pagine e dovrebbe averne 382-385 (a seconda di quante devono essere eliminate). Un disastro totale, che sembra ripetersi in altri volumi della stessa serie. In più, a guardarle meglio, le immagini sono difettose (almeno una fuori fuoco; molte da ritagliare grossolanamente). Soluzione: ricostruire tutto con un FineReader locale. Alex brollo (disc.) 12:14, 14 giu 2019 (CEST)
- @Alex brollo, OrbiliusMagister, Candalua sempre per la mia minima esperienza sul Servitore di due padroni, la commedia è in bilico, nel senso che Pantalone, Truffaldino, Brighella e Smeraldina parlano in veneziano, ma Clarice, Beatrice, Florindo, il dottore e Silvio parlano in italiano. Dal punto di vista filologico, insomma, può stare sia in it.source che in vec.source senza problemi. È però ovvio che un OCR si pianterà comunque per la metà del tempo. (Ma come dicevo, per me rileggere il veneziano non è molto faticoso). --.mau. (disc.) 08:48, 14 giu 2019 (CEST)
- visto che la "colpa" iniziale è mia, posso dirvi quello che ho trovato per i vari punti indicati da @OrbiliusMagister:
Circa la collocazione: su vec io ho caricato finora le commedie dove la lingua veneziana è chiaramente prevalente, quelle invece dove solo 1-2 personaggi parlano veneziano ho preferito lasciarle su it. Quindi continuerei così. Le edizioni naked che abbiamo in ogni caso le terrei, quindi laddove troviamo la corrispondente edizione proofread la caricherei nello stesso luogo della naked, per non disperdere troppo le cose. Andrebbe comunque rifatta la pagina dell'autore in entrambi i siti, per elencare la totalità delle opere, in modo che uno non debba andare avanti e indietro per trovarle. Can da Lua (disc.) 19:57, 14 giu 2019 (CEST)
Edizione nazionale 1922
[modifica]Amici, imo è inutile accanirsi sulla Pasquali se abbiamo l'edizione nazionale! :D Xavier121 23:18, 14 giu 2019 (CEST)
- Finalmente @Xavier121 si è manifestato. Facci capire se è davvero completa: da quel che ho potuto appurare il grado di modernizzazione del testo è lievissimo e ci viene molto incontro; l'edizione Pasquali è usata come modello principale ma ci sono (pochissime) note critiche molto importanti di confronto con altre edizioni che non appesantiscono il testo; aggiungo che la formattazione del testo appare coerente e facilmente automatizzabile inoltre si trovano molte immagini di pregevole fattura dall'uso molteplice: per quel che mi riguarda se non ci sono obiezioni questa edizione è perfetta per noi. @Alex brollo, com'è lo strato testo di questa edizione? - εΔω 10:53, 15 giu 2019 (CEST)
- @Xavier121, OrbiliusMagister, .mau. ECC, dove si era nascosta? Bravo Xavier! Aperto un volume a caso l'OCR appare straordinariamente buono - ho dovuto scorrere un po' il testo per convincermi che non era un testo riletto. E ci sono già i djvu! Se le successive verifiche confermano, immagino si possa fare un megacaricamento con pre-elaborazione (e pre-formattazione) con fiocchi e controfiocchi. Sto combattendo duramente con la sezione Nota di Orlando furioso, e anche con Canzoniere Vaticano latino 3793, ma apro in parallelo la sperimentazione su questa edizione. --Alex brollo (disc.) 13:47, 15 giu 2019 (CEST)
- Definiamo per favore un buon nome per File e Indice, più informativo e più sintetico possibile, che indichi, ovviamente, anche il volume. Intanto mi scarico il volume I e comincio a scandagliarlo offline. --Alex brollo (disc.) 14:09, 15 giu 2019 (CEST)
- Ok, a questo punto io mi fermo con la Pasquali, direi. Ditemi quando posso ripartire :-) (anche perché il Servitore è nel volume 1, quindi comincio subito. Avrò qualche dubbio su come mettere le note critiche, ve lo dico subito. --.mau. (disc.) 16:40, 15 giu 2019 (CEST)
- Definiamo per favore un buon nome per File e Indice, più informativo e più sintetico possibile, che indichi, ovviamente, anche il volume. Intanto mi scarico il volume I e comincio a scandagliarlo offline. --Alex brollo (disc.) 14:09, 15 giu 2019 (CEST)
- @Xavier121, OrbiliusMagister, .mau. ECC, dove si era nascosta? Bravo Xavier! Aperto un volume a caso l'OCR appare straordinariamente buono - ho dovuto scorrere un po' il testo per convincermi che non era un testo riletto. E ci sono già i djvu! Se le successive verifiche confermano, immagino si possa fare un megacaricamento con pre-elaborazione (e pre-formattazione) con fiocchi e controfiocchi. Sto combattendo duramente con la sezione Nota di Orlando furioso, e anche con Canzoniere Vaticano latino 3793, ma apro in parallelo la sperimentazione su questa edizione. --Alex brollo (disc.) 13:47, 15 giu 2019 (CEST)
OK .mau., ti ho pingato per quello :-) . Problema: Potrei ammattire per un particolare della formattazione: l'allineamento a destra, a fine battuta, dei suggerimenti dell'autore: non trovo il modo di farlo bene. Piuttosto che pasticciare, rinuncerei all'allineamento a destra, accontentandomi del corsivo, fra parentesi tonde, a fine battuta. La difficoltà sta nel trovare un codice css che sposti a destra un frammento di testo, ma che eviti l'overlapping (andando su una nuova riga) quando se non c'è lo spazio necessario. Questo è fedele, ma è complesso e non è "robusto", il codice è diverso per il caso di "battute lunghe" e variando il font tutto si spaccherebbe:
Truffaldino. Con so bona grazia, una parola (a Florindo, tirandolo in disparte
Florindo (Che cosa vuoi ?)
Truffaldino. (S' arrecordel cossa eh' el m' ha promesso ?) (piano a Florindo
Florindo. (Che cosa ? Io non me ne ricordo). (piano a Truffaldino
Truffaldino. (De domandar a sior Pantalon, Smeraldina per me muier ?)
(come sopra
Florindo. (Sì, ora me ne sovviene. Lo faccio subito). (come sopra
Truffaldino. (Anca mi, poveromo, che me metta all' onor del mondo).
Pantalone. benché sia la prima volta....
Questo invece è robusto e semplice, ma non è fedele:
Truffaldino. Con so bona grazia, una parola (a Florindo, tirandolo in disparte)
Florindo (Che cosa vuoi ?)
Truffaldino. (S' arrecordel cossa eh' el m' ha promesso ?) (piano a Florindo)
Florindo. (Che cosa ? Io non me ne ricordo). (piano a Truffaldino))
Truffaldino. (De domandar a sior Pantalon, Smeraldina per me muier ?) (come sopra)
Florindo. (Sì, ora me ne sovviene. Lo faccio subito). (come sopra)
Truffaldino. (Anca mi, poveromo, che me metta all' onor del mondo).
Pantalone. benché sia la prima volta....
Alex brollo (disc.) 17:12, 15 giu 2019 (CEST)
- @Alex brollo TeX aveva apposta lo spazio infinitamente allungabile: W3C non ha imparato dal passato :-)
- In effetti si può anche pensare di non seguire pedissequamente l'Edizione Nazionale ma fare come nella versione Utet che ha spostato le parti tra parentesi nel punto esatto in cui si fanno, e non in fondo alla battuta. Altrimenti la soluzione più semplice è non giustificare a destra e lasciare la parte subito dopo la battuta, come dicevi. --.mau. (disc.) 17:51, 15 giu 2019 (CEST)
- Dimenticavo: sto lanciando IA Upload per il volume 1. Ho notato che il copyright è 1927, ma il primo volume è del 1907. che si fa? --.mau. (disc.) 19:22, 15 giu 2019 (CEST)
- Al momento su Commons ho caricato https://commons.wikimedia.org/wiki/File:Goldoni_-_Opere_complete_-_Tomo_I.djvu . Ci vuole anche il nome Carlo? Prima o dopo il cognome? Inutile partire e poi cambiare tutto in corsa... --.mau. (disc.) 20:14, 15 giu 2019 (CEST)
Ciao, @.mau., consiglio di lasciare ad Alex il compito del caricamento su commons e non per scarsa fiducia nelle tue capacità, ma per esigenze di praticità, dovendo il nostro occuparsi anche delle prove relative alla preformattazione e alla perfetta corrispondenza proofread: l'esperienza ci insegna che UN solo contributore deve occuparsi di tutta la procedura in parallelo! :) Il titolo corretto dovrebbe essere questo: Goldoni - Opere complete, Tomo I, Venezia, 1907, I
dove il numero romano finale indica la divisione in volumi dell'editore. Per chiarezza, riporto una sinossi:
Volumi editi dal Municipio di Venezia |
---|
|
|
|
|
|
|
|
|
Su IA abbiamo 20 volumi di Commedie su 22 (possiamo tranquillamente lavorare su questi in attesa degli altri, oppure: setacciare biblioteche vicine in cerca anche dei volumi IV e X; appoggiarsi all'edizione Pasquali; confidare nel prestito interbibliotecario e digitalizzare gli originali!-). Al momento, non penso sia indispensabile caricare i restanti 18 volumi (in rete, comunque non ci sono); mi concentrerei sulle commedie, pronte al 95%. --Xavier121 00:04, 16 giu 2019 (CEST)
- @.mau., Xavier121, OrbiliusMagister Come "renamer" su Commons, ho rigettato la modifica di nome file sul Volume 1, immaginando che la cosa avrebbe avuto sviluppi globali (scusa .mau.). Proposta operativa: la cosa sta diventando grossa, proporrei di aprire un sottoprogetto Progetto:Teatro/Goldoni (Commedie) e definire là il definibile in ogni particolare ragionevole. Ma non fermiamoci per questo: io comincerei comunque a lavorare su una pagina Indice Indice:Goldoni - Opere complete - Tomo I.djvu, poi non è troppo faticoso spostare il tutto su altro nome file/indice/pagina. La questione Tomo I non l'ho capita.... qual è il Tomo II :-( ?
(certo che Goldoni era peggio di Salgari, come produttività....)
Alex brollo (disc.) 00:32, 16 giu 2019 (CEST)
- Ho capito la questione Tomo I, tuttavia mi sembra che - essendo il numero di volume univoco - potremmo semplificare i nomi come
Goldoni - Opere complete, Volume I, Venezia 1907
,Goldoni - Opere complete, Volume II, Venezia 1908
ecc. --Alex brollo (disc.) 00:44, 16 giu 2019 (CEST)- vabbè, ditemi quando posso cominciare :-) --.mau. (disc.) 08:35, 16 giu 2019 (CEST)
- Ho capito la questione Tomo I, tuttavia mi sembra che - essendo il numero di volume univoco - potremmo semplificare i nomi come
Altre formattazioni
[modifica]Lasciare {{a destra}} in una riga separata ha dei problemi con l'indentatura, così ad occhio, però è abbastanza simile all'originale nonostante la suddivisione in due righe:
Truffaldino. Con so bona grazia, una parola
(a Florindo, tirandolo in disparte
Florindo (Che cosa vuoi ?) Truffaldino. (S' arrecordel cossa eh' el m' ha promesso ?)
(piano a Florindo
Florindo. (Che cosa ? Io non me ne ricordo).
(piano a Truffaldino
Truffaldino. (De domandar a sior Pantalon, Smeraldina per me muier ?)
(come sopra
Florindo. (Sì, ora me ne sovviene. Lo faccio subito).
(come sopra
Truffaldino. (Anca mi, poveromo, che me metta all' onor del mondo). Pantalone. Benché sia la prima volta....
In un testo attuale però probabilmente si scriverebbe così, con le indicazioni messe prima del testo: è più leggibile ma ovviamente non è la trascrizione della pagina.
Truffaldino. (a Florindo, tirandolo in disparte) Con so bona grazia, una parola .
Florindo. (Che cosa vuoi ?)
Truffaldino. (piano a Florindo) (S' arrecordel cossa eh' el m' ha promesso ?)
Florindo. (piano a Truffaldino) (Che cosa ? Io non me ne ricordo).
Truffaldino. (come sopra) (De domandar a sior Pantalon, Smeraldina per me muier ?)
Florindo. (come sopra) (Sì, ora me ne sovviene. Lo faccio subito).
Truffaldino. (Anca mi, poveromo, che me metta all' onor del mondo).
Pantalone. Benché sia la prima volta....
--.mau. (disc.) 12:53, 18 giu 2019 (CEST)
Accenti gravi anziché acuti
[modifica]Se io mi trovo scritto "nè / perchè" anziché "né / perché" lascio gli accenti gravi, giusto? --.mau. (disc.) 14:14, 19 giu 2019 (CEST)
- Esatto. Anch'io mi trovo il caso contrario di parole come cosí, piú oppure giá nelle edizioni Laterza e tali le mantengo. - εΔω 20:02, 19 giu 2019 (CEST)
Indentazione rovescia
[modifica]Pagina:Goldoni - Opere complete, Tomo I, Venezia 1907, I.djvu/593 è indentata rovescia: la prima riga dovrebbe avere un margine negativo. C'è un template apposta con text-indent: -2em; padding-left: 2em; o me lo devo creare io? --.mau. (disc.) 17:25, 19 giu 2019 (CEST)
apostrofi
[modifica]C'è un modo semplice per convertire gli apostrofi ' in ’ ? --.mau. (disc.) 10:18, 22 giu 2019 (CEST)
- Certo, @.mau.: vedi nella sidebar sotto "strumenti per la rilettura" il comando postOCR Alt+7? Ecco, quel comando effettua in automatico su un OCR grezzo alcune operazioni base "sicure" che a mano sarebbero lunghe, ad esempio l'eliminazione di doppi spazi o la sostituzioni di apostrofi come quella che chiedi. Evidentemente "Alt+7" sta ad indicare che l'operazione può essere eseguita anche con la combinazione di tasti "Alt+7". Prova e non te ne pentirai :D εΔω 08:24, 23 giu 2019 (CEST)
che fare quando postOCR non funziona?
[modifica]Se per tre pagine di fila postOCR mi si pianta *prima* delle mie modifiche (E quindi prima di errori commessi da me nella trascrizione), mi sa che ci sia qualcosa che non va a monte... --.mau. (disc.) 16:25, 1 lug 2019 (CEST)
- Se per "si pianta" intendi "va in loop e non si conclude mai" la ragione è che incontra dei caratteri indigesti (tipicamente la parentesi graffa) che lo mettono in crisi: in questo caso esiste un comando "preOCR" che elimina tali caratteri indigesti (ma devi attivarlo chiedendo ad @Alex brollo
- Se invece non è questo il caso si presentano due possibilità:
- PostOCR non fa nulla se non lo invochi manualmente: dunque forse ti aspetti automatismi che in realtà non ci sono.
- se "non fa nulla anche se lo hai invocato" è infine possibile che non ci sia nulla di cui postOCR debba occuparsi, probabilmente perché le azioni compiute normalmente da esso sono state già implementate da Alex nello strato testo dei djvu prima ancora del caricamento su commons. --εΔω 17:23, 1 lug 2019 (CEST)
- @OrbiliusMagister era la prima ch'hai detto. Proverò a chiedere ad Alex --.mau. (disc.) 09:07, 2 lug 2019 (CEST)
- @.mau. Se la pagina va in "freeze" dopo postOCR si tratta di un bug, finora irrisolto, dell'algoritmo (complicato!) per la conversaione degli apostrofi. In pratica, è come lanciare un parser xml su un xml difettoso: solo che il parser segnala che l'xtml è mal conformato, mentre postOCR va in loop. Dipende dalla presenza casuale di caratteri speciali "sbilanciati": in genere [, {, <, che produce un risultato anomalo di find_stringa() e blocca in loop produciLista(). Anche se so che il bug è in find_stringa() non sono mai riuscito a risolverlo. Dimmi quali sono le pagine, le studierò subito, e se ci riesco affronto per l'ennesima volta la ricerca del bug. Sto raccogliendo i codici delle pagine bloccanti qui: Utente:Alex brollo/Problema find stringa --Alex brollo (disc.) 11:03, 9 lug 2019 (CEST)
- il problema sono probabilmente le graffe singole, alla fine mi sono scocciato, lanciavo preOCR e rimettevo le tonde a posteriori. Purtroppo non mi sono salvato la lista delle pagine... --.mau. (disc.) 11:19, 9 lug 2019 (CEST)
- @.mau. al momento preOCR è efficace ma distruttivo se lanciato su pagina già formattata; sto cercando di "ripulire" i testi in fase di pre-elaborazione offline, ma la lotta contro caratteri dispersi casualmente è dura.... nelle due pagine in Utente:Alex brollo/Problema find stringa, il carattere maledetto nella seconda è una graffa anomala, facile da trovare, nella prima ci vuole più attenzione, alla fine si vede un < anomalo in mezzo a una parola. Ci vorrebbe un esperto di algoritmi per isolare e trattare il bug :-) Alex brollo (disc.) 12:07, 9 lug 2019 (CEST)
- :-P Comunque credo che non si riesca a fare il controllo in un solo passo, bisogna prima scorrere il testo e poi eventualmente cancellare i caratteri spuri (soprattutto i <, probabilmente le "{" singole possiamo convertirle direttamente in "(" senza soverchi problemi, la probabilità di graffe in un testo è di solito molto bassa). --.mau. (disc.) 14:24, 9 lug 2019 (CEST)
- @.mau. Aimè: la probabilità di graffe non è affatto bassa in un testo preformattato.... logico che sta al preformattatore eliminare i caratteri sbilanciati prima di cominciare a preformattare, ma l'errore è in agguato. Sto cercando di infilare nella routine incriminata un controllo preliminare di parità dei caratteri critici con alert in caso di problemi e uscita dalla routine in caso di problemi. Non è una soluzione "pulita", ma ridurrebbe moltissimo i blocchi. Alex brollo (disc.) 11:51, 11 lug 2019 (CEST)
- :-P Comunque credo che non si riesca a fare il controllo in un solo passo, bisogna prima scorrere il testo e poi eventualmente cancellare i caratteri spuri (soprattutto i <, probabilmente le "{" singole possiamo convertirle direttamente in "(" senza soverchi problemi, la probabilità di graffe in un testo è di solito molto bassa). --.mau. (disc.) 14:24, 9 lug 2019 (CEST)
- @.mau. al momento preOCR è efficace ma distruttivo se lanciato su pagina già formattata; sto cercando di "ripulire" i testi in fase di pre-elaborazione offline, ma la lotta contro caratteri dispersi casualmente è dura.... nelle due pagine in Utente:Alex brollo/Problema find stringa, il carattere maledetto nella seconda è una graffa anomala, facile da trovare, nella prima ci vuole più attenzione, alla fine si vede un < anomalo in mezzo a una parola. Ci vorrebbe un esperto di algoritmi per isolare e trattare il bug :-) Alex brollo (disc.) 12:07, 9 lug 2019 (CEST)
- il problema sono probabilmente le graffe singole, alla fine mi sono scocciato, lanciavo preOCR e rimettevo le tonde a posteriori. Purtroppo non mi sono salvato la lista delle pagine... --.mau. (disc.) 11:19, 9 lug 2019 (CEST)
@.mau. Implementazione di prova attiva. Nei casi di sbilanciamento {} e <>, alert con invito a correggere. Naturalmente ci sono dei casi in cui una graffa o un segno "maggiore di" sbilanciati fanno parte del testo.... in questo caso l'unica soluzione praticabile è di sostituire i caratteri "sbilanciati ma buoni" con entità html. Speriamo bene, mettere mano in quelle routine vecchie e complicate mi dà sempre un po' di ansia.... --Alex brollo (disc.) 14:52, 11 lug 2019 (CEST)
- @Alex Brollo quando arrivo di nuovo alle pagine con testo, ti saprò dire :-) --.mau. (disc.) 12:56, 12 lug 2019 (CEST)
Indice che rimanda a più volumi
[modifica]Qualcuno potrebbe spiegarmi come funziona un'indice spezzato tra più volumi? Ho praticamente finito I Nibelunghi ma i template Pg dell'indice vedono soltanto quelli che rimandano al secondo volume, nel quale è incluso l'indice appunto. Bisogna intervenire sul modulo dati? --DLamba (disc.) 19:28, 8 lug 2019 (CEST)
- @DLamba Caso difficile! Per fortuna il caso è raro, si può usare il nome completo del "nome base Indice" come terzo parametro del template Pg, oppure, meglio, creare un'abbreviazione univoca del nome base indice e inserirlo in Modulo:Pg, usando l'abbreviazione come terzo parametro di Pg.
- Vedi il codice di Modulo:Pg che inizia proprio con una lista di abbreviazioni, in Tiraboschi le pagine indice diverse sono addirittura 16.... Se hai difficoltà ti aiuto volentieri, intanto aggiungo due abbreviazioni semplici (n1,n2) al modulo Pg per permetterne l'uso. Poi faccio un paio di test. --Alex brollo (disc.) 10:21, 9 lug 2019 (CEST)
- @DLamba Bluizzati i link delle due prime pagine dell'indice che puntano al primo volume; i link che puntano al secondo volume sono già bluizzati per default. Ti basta così? --Alex brollo (disc.) 10:47, 9 lug 2019 (CEST)
- @Alex brollo Aaah grazie mille, ho capito. :-) Sì penso vada bene anche così. --DLamba (disc.) 12:53, 9 lug 2019 (CEST)
- @DLamba Bluizzati i link delle due prime pagine dell'indice che puntano al primo volume; i link che puntano al secondo volume sono già bluizzati per default. Ti basta così? --Alex brollo (disc.) 10:47, 9 lug 2019 (CEST)
Doppio ordine di note: qual è lo stato dell'arte?
[modifica]Cari amici,
apprestandomi a metter mano alle antiche rime volagri del codice vaticano latino 3793 mi rovo ad affrontare una situazione a me nuova, ma già vista in passato, dunque chiederei una conferma o un aggiornamento di quali siano le soluzioni più efficaci. Date un'occhiata a una pagina modello come questa. Ci sono due apparati di note:
- il primo indica i casi in cui i curatori hanno posto le loro ipotesi interpretative
- il secondo indica le ipotesi interpretative delle edizioni di riferimento precedenti (Allacci, VAleriani, Nannucci ecc.)
In pratica vorrei risolvere questi problemi:
- Come creare i due apparati con la forma meno invasiva possibile nel testo della poesia
- Come porre il testo delle note uno di seguito all'altro e non uno sotto l'altro.
Entrambe le soluzioni le ho viste da qualche parte ma non ricordo dove. @Utoutouto, Candalua, Alex brollo, Xavier121, ricordate dove? - εΔω 09:29, 9 lug 2019 (CEST)
- @OrbiliusMagister My two cents: la mia proposta "grossolana" era di rinunciare semplicemente a usare il codice annotazione e di rendere i due apparati di note due semplici blocchi di testo, lasciando al lettore interessato il compito di ricercare le annotazioni relative a un certo verso nel testo del blocco. Questo naturalmente risolverebbe anche il problema delle note di seguito oltre a quello di doversi inventare, all'interno del verso, la posizione adatta per il richiamo, e rispetterebbe anche la volontà dell'editore (che evita di "sporcare" i versi con i numerosi richiami alle annotazioni). Diverso il caso di Sonetti romaneschi in cui l'editore indica esplicitamente i riferimenti.
- Volendo ottenere delle reali annotazioni, varie disposizioni (orizzontale numerata; orizzontale non numerata) si ottengono con il parametro
tipo
del template Sezione note. Temo che per la suddivisione di due gruppi di note non ci siano altre soluzioni oltre a quella di usare, per uno dei due gruppi, l'attributogroup
di ref, anch'esso gestito da Sezione note. Forse usare un carattere come § per indicare il nome del secondo gruppo (come da un esempio di Template:Sezione note) non sarebbe eccessivamente invasivo, ma resta il problema del fastidioso sovraffollamento di riferimenti nei versi, difforme dall'edizione. Alex brollo (disc.) 10:08, 9 lug 2019 (CEST)- Vostra orgogliosa ciera è una mia prova di applicazione del doppio gruppo di note con tentativo di tenere queste in un gruppo relativamente compatto, ma non mi soddisfa. Prima di applicare un metodo a centinaia di casi aggiustate, provate o al limite ripetete quel che pensate. - εΔω 17:10, 9 lug 2019 (CEST)
- Una osservazione, un commento e una proposta.
- Osservazione: il secondo gruppo di note penso siano varianti, e così le chiamerei.
- Commento: come immaginavo i riferimenti "sporcano" moltissimo e mi disturbano.
- Proposta: se comparisse un pulsantino "Visualizza note" che cliccato le fa comparire, diventando "Nascondi note", situazione di partenza: note nascoste, forse il disturbo diventerebbe tollerabile con possibili applicazioni anche altrove. Faccio un paio di test in console...--Alex brollo (disc.) 21:22, 9 lug 2019 (CEST)
- Confermo. Tutti i riferimenti compaiono e scampaiono con questa istruzione "toggle" che potete provare dalla console:
$(".reference").toggle();
; le note rimangono visibilinaturalmente per costruire il pulsante solo se e quando serve, disattivare la visualizzazione delle note in entrata, collegare il pulsante a quell'istruzione ci vuole un po' più di codice, ma comunque sarebbero poche righe (e un template opzionale, la cui presenza attivi l'ambaradan). Ma chiederei di valutare attentamente la mia proposta originaria: niente note, che i numerosi lettori interessati alle annotazioni o alle varianti si arrangino a cercarle loro nei due blocchi. Alex brollo (disc.) 21:32, 9 lug 2019 (CEST)- In realtà si tratta di varianti da ambo i gruppi. Anche a me il risultato attuale sembra insostenibile. In effetti sono tentato di alleggerire il testo lasciando i riferimenti alle varianti nella trascrizione di nsPagina, ma 1) il lavoro sporco di trascrizione delle varianti in nsPagina va fatto comunque e sarebbe interessante trovare una maniera per esporlo; 2) vorrei vedere un esempio della tua proposta in azione, magari nella stessa poesia su cui ho lavorato io. - εΔω 12:09, 11 lug 2019 (CEST)
- OK. provo a costruire un bottone e visualizzarlo in alto a sinistra, quando il codice contiene il template Template:Visualizza note. Alex brollo (disc.) 13:20, 11 lug 2019 (CEST)
- @OrbiliusMagister Testo troppo annotato: vedi se è applicabile la soluzione VN con il secondo gruppo di note ancorato. --Xavier121 20:50, 12 lug 2019 (CEST)
- OK. provo a costruire un bottone e visualizzarlo in alto a sinistra, quando il codice contiene il template Template:Visualizza note. Alex brollo (disc.) 13:20, 11 lug 2019 (CEST)
- In realtà si tratta di varianti da ambo i gruppi. Anche a me il risultato attuale sembra insostenibile. In effetti sono tentato di alleggerire il testo lasciando i riferimenti alle varianti nella trascrizione di nsPagina, ma 1) il lavoro sporco di trascrizione delle varianti in nsPagina va fatto comunque e sarebbe interessante trovare una maniera per esporlo; 2) vorrei vedere un esempio della tua proposta in azione, magari nella stessa poesia su cui ho lavorato io. - εΔω 12:09, 11 lug 2019 (CEST)
- Confermo. Tutti i riferimenti compaiono e scampaiono con questa istruzione "toggle" che potete provare dalla console:
- Vostra orgogliosa ciera è una mia prova di applicazione del doppio gruppo di note con tentativo di tenere queste in un gruppo relativamente compatto, ma non mi soddisfa. Prima di applicare un metodo a centinaia di casi aggiustate, provate o al limite ripetete quel che pensate. - εΔω 17:10, 9 lug 2019 (CEST)
@Xavier121, confermami che ho capito giusto: il primo gruppo di annotazioni (le proposte di emendazione del curatore) lo pongo come un blocco di testo come nell'esempio della Vita nuova che mi hai linkato, mentre il secondo gruppo di annotazioni (le soluzioni proposte nelle edizioni precedenti) come note a pià di pagina normali. L'operazione ha senso in quanto mette in vista entrambi gli apparati ma mantiene un solo gruppo di rimandi note. Provo ad applicare la soluzione e sappiatemi dire. - εΔω 21:16, 12 lug 2019 (CEST)
- Fatto: Date un'occhiata ora a Vostra orgogliosa ciera. Il risultato è sicuramente meno brutto. Certo l'operazione resta laboriosa da trascrivere e da qualche parte dobbiamo scrivere qualunque decisione prenderemo. - εΔω 22:25, 12 lug 2019 (CEST)
display:inline-table
[modifica]Strana cosa, antintuitiva, ma esiste, grazie a un quiz di Carlomorino l'ho scoperta:P * R
I. Si tratta di una immagine FI inline; l'immagine è la graffa sopra, la "didascalia" è il testo sotto; e il tutto è "inline", ossia compreso nel normale flusso del testo. E' semplicemente una normale immagine FI, però inclusa in uno span display:inline-table. Che ne dite? Io cerco di capirne di più e di conservarlo come attrezzo utile per casi difficili.... --Alex brollo (disc.) 07:31, 11 lug 2019 (CEST)
- Veramente interessante. La cosa migliore è inserirla nelle istruzioni del template. --Luigi62 (disc.) 07:49, 11 lug 2019 (CEST)
- @Luigi62 Giusto te! Avrei bisogno di una cosa facile per uno che ne sa di grafica: caricare un'immagine (meglio svg, altrimenti png) che corrisponda alla parte superiore del monogramma segnalato da @Carlomorino: Pagina:Rivista italiana di numismatica 1897.djvu/32 e due successive (linea orizzontale con arco al centro). --Alex brollo (disc.) 13:14, 11 lug 2019 (CEST)
- @Alex brollo Ecco fatto . --Luigi62 (disc.) 18:45, 12 lug 2019 (CEST)
- @Luigi62, Carlomorino Grazie mille! Vediamo: P * R
I Mi pare perfetto :-) --Alex brollo (disc.) 06:47, 13 lug 2019 (CEST)
- @Luigi62, Carlomorino Grazie mille! Vediamo: P * R
- @Alex brollo Ecco fatto . --Luigi62 (disc.) 18:45, 12 lug 2019 (CEST)
- @Luigi62 Giusto te! Avrei bisogno di una cosa facile per uno che ne sa di grafica: caricare un'immagine (meglio svg, altrimenti png) che corrisponda alla parte superiore del monogramma segnalato da @Carlomorino: Pagina:Rivista italiana di numismatica 1897.djvu/32 e due successive (linea orizzontale con arco al centro). --Alex brollo (disc.) 13:14, 11 lug 2019 (CEST)
Amnesia....
[modifica]@Candalua, OrbiliusMagister Non ricordo più cosa fa scattare la possibilità che utenti registrati da poco possano portare le pagine a SAL 100%. Numero di edit? Passaggio automatico ad altro gruppo utente? Sarebbe bello che il messaggio "Tu puoi farlo" (con le modifiche opportune) apparisse solo se effettivamente l'utente a cui compare potesse farlo, se tecnicamente non è troppo pesante. --Alex brollo (disc.) 22:12, 17 lug 2019 (CEST)
Nuovo attacco allo strato testo dei djvu
[modifica]Sto affrontando (per l'ennesima volta) la questione dello strato testo mappato dei file djvu nei suoi due formati (xml e lisp-like) usando python. Per il primo formato, si tratta di riuscire a padroneggiare pyquery o bs4 (ho l'impressione che bs4 sia più potente, anche se ha una logica sua, contrariamente a pyquery che è più familiare per chi usa un po' JQuery); per il secondo formato, segnalo pyparsing che risolve bene le strutture lisp-like e che sto esplorando. Sarà la volta buona? Il problema torna di attualità per le commedie in versi di Goldoni, in cui la struttura testo è molto spesso fortemente mal interpretata nell'OCR e richiede una rielaborazione. --Alex brollo (disc.) 22:00, 19 lug 2019 (CEST)
Ristrutturare l'OCR
[modifica]Problema: avviene, nei testi in cui l'OCR "vede" tabelle, che il testo non sia organizzato per linee, su un'unica colonna, ma in più colonne; prima, linea per linea, la prima colonna, e poi, linea per linea, le successive colonne. Disgraziatamente in alcuni testi particolari, come quelli teatrali in versi con personaggi incolonnati a sinistra, il risultato è disastroso e molto faticoso da sistemare a mano (bisogna spostare, uno per uno, i personaggi a fianco della loro battuta). Lavorando sul puro testo, non c'è niente da fare se non sistemare a mano con fatica. Nel volume XII di Goldoni, dove ci sono tre commedie in versi, ho lavorato col text editor per ore e non ho ancora finito (si tratta di migliaia di spostamenti da fare).
Lavorando invece sull'XML (il file _djvu.xml di Internet Archive), la cosa è fattibile in python; ho scelto di usare BeautifulSoup (bs4) per il parsing. Ci vuole qualche decina di secondi per il parsing dell'xml di un librone, un po' meno per la riorganizzazione del testo, ma si può fare. Emergono anche altri vantaggi, tipo quello di riunire su una sola linea il testo dell'intestazione pagina, ma per ora mi accontento di riunire personaggi e battute. I test saranno fatti sul volume XIII e successivi; disgraziatamente il pubblico ha apprezzato le commedie in versi martelliani e Goldoni si è adeguato.... :-(.
Appena i test saranno conclusi, metterò il codice in Progetto:Bot. --Alex brollo (disc.) 14:33, 27 lug 2019 (CEST)
Un div che si chiude a sproposito
[modifica]Cari @Candalua, Alex brollo,
nella pagina Apriti Standard!/Indice generale dopo un po' il div generato dall'intestazione di chiude apparentemente senza motivo, con il risultato che a partire da L’interoperabilità: alcune definizioni l'indice è graficamente scombinato. Il problema si presenta a metà di Pagina:Aliprandi - Apriti Standard !, Ledizioni, 2010.djvu/3, ma non ci sono tag visibili tra il paragrafo di cap. 1.2 e 1.3; così per prova ho tolto un paio di graffe per vedere di nascosto l'effetto che fa, ma il risultato è stato solo che il problema si è spostato al paragrafo sottostante. aggiungere una chiusura di div amnualmente è un gioco da ragazzi, ma toglierla quando non è visibile è fuori dalle mie capacità, a maggior ragione quando con gli strumenti di analisi del browser noto che l'annidamento di div nella pagina è per me complesso da seguire. Segnalo il problema per capire come potrei risolverlo. - εΔω 09:28, 29 ago 2019 (CEST)
- Mi pare che il problema stia in una incompatibilità fra : (per le indentature) e tl Vi. E' una miscela che io evito accuratamente "per istinto", i : creano un intrico nell'html, soprattutto quando sono multipli. L'indentatura con Vi si crea correttamente con il parametro sezione, che può anche contenere semplicemente un se deve essere "vuota". --Alex brollo (disc.) 11:01, 29 ago 2019 (CEST)
- @OrbiliusMagister Sistemato, ma eliminando i
:
; da dove precisamente provenga quella chiusura di div, non sono riuscito a capirlo :-( Alex brollo (disc.) 13:30, 29 ago 2019 (CEST)
- @OrbiliusMagister Sistemato, ma eliminando i
Teatro: nuova idea
[modifica]Ho provato, con soddisfazione, a rivalutare la vecchia convenzione teatrale che suggerisce di utilizzare il markup ;
per il personaggio e il il markup :
per la battuta. E' possibile truccare il css via templatestyles in modo che il comportamento dei due codici cambi e diventi molto più fedele rispetto alla fonte, il tutto con una sola chiamata templatestyles per pagina.
Intanto un esempio:
- Pers. 1
- Battuta uno
- Pers. 2
- Battuta due
Ma semplicemente cambiando classe:
- Pers. 1
- Battuta uno
- Pers. 2
- Battuta due
Dovrebbe essere possibile, quindi, usare la solita convenzione ottenendo moltissimi diversi formati. --Alex brollo (disc.) 16:54, 5 ott 2019 (CEST)
Piccola "scoperta" di stile
[modifica]Ho "scoperto" che anche ai tag <i> e <b> (quelli in cui viene tradotto il markup con due e tre apostrofi) può essere assegnato uno stile css via templatestyles. Questo consente una notevole semplificazione di codice wiki, in casi molto ricorrenti in Goldoni e probabilmente non solo.
Notate il codice in questa pagina: Pagina:Goldoni - Opere complete, Venezia 1908, II.djvu/51, per la riga dei personaggi, in cui è previsto il maiuscoletto retto per il nome dei personaggi, e il corsivo non maiuscoletto per le altre parole. Non serve il template Sc per i personaggi, perchè la classe .personaggi prevede il maiuscoletto. Ma non serve specificare che le parole in corsivo non sono maiuscoletto ma sono "normali", perchè il css associato al tag <i> in {{StileTeatro/teatro1.css}} prevede font-variant:normal. In conclusione, il codice che era:
{{Ct|f=100%|v=1|t=1|{{Sc|Eleonora}}, ''poi'' {{Sc|Arlecchino}} ''e'' {{Sc|Beatrice}} ''in abito di uomo''.}}
diventa:
{{Ct|c=personaggi|Eleonora, ''poi'' Arlecchino ''e'' Beatrice ''in abito di uomo''.}}
il che mi pare una piccola, ma notevole semplificazione :-) E siamo ancora all'inizio della sperimentazione! --Alex brollo (disc.) 09:15, 24 ott 2019 (CEST)
- e dici niente :-) --.mau. (disc.) 10:17, 24 ott 2019 (CEST)
Nota difficile
[modifica]In questa pagina trovo una annotazione difficile: continua su due pagine, e si spezza a metà di una lunga serie di versi. Non sono riuscito a "fondere" bene i due ampi frammenti, e per ora ho semplicemente spostato i versi della seconda pagina nella prima. Se qualcuno ha una soluzione, bene; altrimenti pazienza, lascio una annotazione in Discussioni pagina e porto a SAL 75% nonostante la difformità fra testo e immagine a fronte. --Alex brollo (disc.) 14:19, 6 nov 2019 (CET)
- Fatto --Ruthven (msg) 15:27, 6 nov 2019 (CET)
I files _jp2.zip
[modifica]Per chi volesse estrarre dei buoni file immagine da IA, c'è lo zip _jp2.zip dove sono contenute tutte le immagini (di buona qualità) utilizzate per tutti i file derivati; ma c'è un problema (che ha causato non pochi intoppi a IA Upload nella costruzione del djvu): alcune delle immagini, probabilmente riconosciute cone "anomale" da qualche algoritmo, talora non vengono utilizzate. Se non vi accontentate della qualità di cosa CreopTool estrae dal djvu, è una buona idea ricaricare quelle difettose dai jp2, ma bisogna stare attenti.... --Alex brollo (disc.) 22:51, 10 nov 2019 (CET)