Discussioni indice:Leopardi - Epistolario, Bollati Boringhieri, Torino 1998, I.djvu

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

memoRegex[modifica]

{"\\t":["sostituzione tabulazioni con spazi (regex)"," ","g"], "\\n\\d+$":["eliminazione numero pagina a fine testo (regex)","","gm"], "^f (.+)":["formattazione riga firma (regex)","{{blocco a destra|c=f|$1}}","gm"], "^d (.+)":["formattazione riga data (regex)","{{blocco a destra|c=d|$1}}","gm"], "^(\\d+)\\.\\s(Ad*)\\s(.+)\\.":["formattazione automatica riga destinatario (regex)","{{dest|$1|$2|$3}}","gm"], "^(\\d+)\\.\\s(Di)\\s(.+)\\.":["formattazione automativa riga mittente (regex)","{{dest|$1|$2|$3}}","gm"], "¬":["(regex)","- ","g"], " +$":["(regex)","","gm"]}

Convenzioni di trascrizione e formattazione[modifica]

Amanuensi digitali


Prima di iniziare il lavoro su ogni pagina invitiamo tutti i nostri generosi contributori a farsi un'idea su cosa si intende per rilettura di un testo e a sbirciare rapidamente la nostra guida alle Convenzioni di trascrizione.

Superata questa prima infarinatura, diventa fondamentale procedere all'attivazione, nella pagina delle preferenze, degli "Strumenti per la rilettura"1 e spuntare alcune funzioni extra della sezione accessori: per aiutarsi nella formattazione ne sono necessarie tre (+ due facoltative):

in Strumenti di interfaccia spuntare

1. La raccolta dei giocattoli

2. La bottoneria

  • Facoltativa: Inversione della visualizzazione in nsPagina, che mette il testo a fronte a sx dello schermo;

in Strumenti di modifica per il namespace Pagina spuntare:

3. memoRegex (potenziamento del classico trova e sostituisci. Attenzione! leggere attentamente la guida)

Da tenere anche presente che per ogni singola pagina è imprescindibile la sua intestazione (di solito, il numero di pagina, ma si trovano anche altre info), espressa nei nostri esempi dalle seguenti formule:


Codice Risultato
{{RigaIntestazione||{{Sc|giacomo leopardi}}}}

giacomo leopardi


Codice Risultato
{{RigaIntestazione||{{Sc|epistolario - 1810}}}}

epistolario - 1810

Per approfondire vedi anche Riga Intestazione.


Lo scopo della maggior parte delle funzioni è intuitiva: anche senza salvare una pagina, si possono vedere gli effetti prodotti dal loro uso combinato sul testo in lavorazione. Qui un esempio ricavato da una pagina correttamente formattata:

Codice Risultato
<section begin="s2" />{{dest|2|Ad|Adelaide Antici Leopardi}}
{{blocco a destra|c=d|[s.d., ma Recanati, 26 marzo 1809]}}

Carissima signora Madre,

Già ben prevedo, che una critica inevitabile mi sia preparata. Questa composizione,<!--2.1--> mi par di sentire, è troppo breve, ed in qualche luogo lo stile è basso. Io non so che rispondere a questa critica, ma mi contento di pregarla a considerare la scarsezza del mio ingegno e a credermi.

Di Lei carissima signora madre
{{blocco a destra|c=f|Dev.mo, Umil.mo, Obbl.mo Servo<br>
Giacomo Leopardi}}<section end="s2" />
2. Ad Adelaide Antici Leopardi.

[s.d., ma Recanati, 26 marzo 1809]

Carissima signora Madre,

Già ben prevedo, che una critica inevitabile mi sia preparata. Questa composizione, mi par di sentire, è troppo breve, ed in qualche luogo lo stile è basso. Io non so che rispondere a questa critica, ma mi contento di pregarla a considerare la scarsezza del mio ingegno e a credermi.

Di Lei carissima signora madre

Dev.mo, Umil.mo, Obbl.mo Servo
Giacomo Leopardi

In questa prima fase di avvicinamento al complesso mondo della formattazione Wikisource, solo due appunti:

  • la funzione autoRi (compilazione automatica della riga intestazione nell'header di nsPagina), inclusa anche nella funzione postOCR, necessita della precompilazione di un paio di pagine (pari e dispari) per archiviare le info necessarie al calcolo automatico delle successive: es. {{RigaIntestazione|1|Prova|}}, {{RigaIntestazione||Prova|2}}.
  • la funzione Crop tool (attiva di default) ha sostituito il vecchio ritaglio per tutte le immagini.2 Se non avete intenzione di occuparvi delle immagini potete utilizzare il seguente template per segnarle:
{{Immagine da inserire}}
  • il corretto funzionamento della transclusione selettiva è fondamentale per i testi antologici. Se volete occuparvi anche della formattazione complessa è fortemente consigliato lo studio della relativa pagina aiuto.

Per approfondire vedi anche:

Workflow[modifica]

@Xavier121

  • 12.3.24: estrazione del testo paginato con extract_djvu_text.py. Test PieDiPagina (ok, postOCR funziona aggiornando il numero pagina). Test di un tl|Dest per la formattazione del numero lettera + destinatario/mittente (rifinire aggiungendo l'ancora al numero lettera). Test di formattazione. Problemi: note separate raccolte nel vol. II da pag. 886. Da verificare automazione section. Da aggiustare le spaziature verticali.
  • test per blocco a destra (data e firma) usando styles.css (classi d e f); aggiunta ancora al numero lettera (#l1, #l2...) generata dal tl|Dest
  • creato anche il secondo Indice, eccezionalmente usando il tag to in pagelist per evitare la visualizzazione di centinaia di pagine bianche (cosa deprecata esplicitamente sia da noi che da en.wikisource). Il campo Sommario andrà riempito non appena elaborato il testo.
  • ricaricato il file Djvu dopo eliminazione di due pagine duplicate (pagine libro 182 e 183) --Alex brollo (disc.). 22:21, 12 mar 2024 (CET)[rispondi]
  • Trovati alcuni errori bloccanti nel file djvu; il primo nella pagina djvu 245, dlla quale in poi il testo recuperato è sfalsato rispetto alle immagini; le due pagine successive non vengono visualizzate. Sembra che la versione non manipolata (file completi) siano a posto. Necessaria correzione e verifica approfondita. Sarà un lavoro abbastanza fastidioso. --Alex brollo (disc.). 23:41, 12 mar 2024 (CET)[rispondi]

Book o Information?[modifica]

@Xavier121 @OrbiliusMagister Ho lasciato vilmente che Xavier caricasse i due file su Commons per evitare vari imbarazzi; raccomando comunque di rivedere attentamente le due pagine, per evitare fastidi. Sarebbe meglio usare il tl|Book piuttosto che il tl|Information, e verificare soprattutto i template di licenza e i parametri Source e Date. Speriamo bene. Alex brollo (disc.). 09:28, 12 mar 2024 (CET)[rispondi]

Verifico, avevo dimenticato il tl book. Per le note non preoccupiamoci, sono copyrighted... --Xavier121 14:36, 12 mar 2024 (CET)[rispondi]
Book sistemato, ---Xavier121 14:55, 12 mar 2024 (CET)[rispondi]
@Xavier121 Pensi sia meglio cancellare del tutto i riferimenti delle note o lasciamo una traccia (invisibile)? Seconda domanda: lasciamo una traccia dell'inviante/destinatario tipo un semplice template che generi una categoria?
PS: se mi tagghi vedo subito la notifica.. grazie!! Alex brollo (disc.). 18:05, 12 mar 2024 (CET)[rispondi]
@Alex brollo Le note sono di carattere storico, per lo più, e sicuramente dovremmo valutarne importanza caso per caso; esempio: nella prima lettera si parla del precettore del giovane Giacomo; la nota riporta alcuni passi della biografia di Monaldo in cui ricorda quando aveva preso in casa il religioso. Si tratta di brani PD, tra l'altro linkabili alla stessa Autobiografia di Monaldo (che dovremmo avere da qualche parte). In questo specifico caso abbiamo anche una nota che ho scritto su di lui nella Virtù indiana a cui linkare bluificando la parola di riferimento. SI anche per le tracce e le categorie Xavier121 18:39, 12 mar 2024 (CET)[rispondi]
@Xavier121 Bene, le note sono organizzate per numero progressivo nella lettera, quindi la traccia potrebbe essere una cosa come 13.1 (dentro un template muto o anche dentro un banale commento html) per indicare la nota 1 della lettera 13. Per categorizzare invianti e destinatari con relative categorie cercherò di inventarmi qualcosa lavorando sul template dest in modo che generi anche le categorie:✔ Fatto
Ieri ero depresso per gli errori bloccanti del djvu, ma nonostante sia azzoppato perchè lavoro su un pc diverso dal mio mi pare che ce l'abbiamo fatta! Le pagine dovrebbero essere tutte allineate con l'OCR e tutte le immagini dovrebbero visualizzarsi (cosa sia successo non l'ho mica capito! Per fortuna i file originali sono OK).
Ho trascritto un paio di pagine di prova, per testare la formattazione: dimmi se possono andare. Se ti vanno bene, le uso come modello per preformattare il testo più che si può. Niente impedisce, adesso che l'OCR è allineato, di andare eventualmente avanti anche a mano.
Che dire... buon lavoro! Alex brollo (disc.). 13:51, 13 mar 2024 (CET)[rispondi]

@Alex brollo Mi sembra ci sia tutto. Sistemo la pagina Discussioni indice inserendo una guida con i template usati sull'esempio delle tragedie di Eschilo. Come sempre, ottimo lavoro :) --Xavier121 20:21, 14 mar 2024 (CET)[rispondi]

  1. Alcune funzioni principali sono già attive di default
  2. Si può utilizzare in alcuni casi anche per i capilettera miniati ecc.