Discussioni indice:Le antiche rime volgari I.djvu

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

Dai....[modifica]

@Xavier121, OrbiliusMagister Io partirei. --Alex brollo (disc.) 11:13, 9 giu 2019 (CEST)[rispondi]

Titolo in Ns0 Canzoniere Vaticano latino 3793, edizione di riferimento Le antiche rime volgari 1888 ecc. Le note sono ancorate alla numerazione dei versi e riportano solo varianti di altre edizioni a stampa o lezioni preferite all'originale ecc. Abbiamo immagini molto pulite e un un ottimo OCR: la rilettura e la formattazione dovrebbero essere scorrevoli; un buon testo per il prossimo compleanno --Xavier121 13:10, 9 giu 2019 (CEST)[rispondi]
Tento, come per gli ultimi testi su cui ho lavorato, l'estrazione dell'OCR + post-elaborazione offline. Ho uno script python che estrae il testo e aggiunge i "codici split", molto comodo per fare delle pre-elaborazioni di massa, funziona sui djvu e anche sui pdf. Lo aggiungo "così com'è" in Progetto:Bot/Programmi in Python per i bot/textExtract.py. --Alex brollo (disc.) 15:04, 9 giu 2019 (CEST)[rispondi]

Struttura ns0[modifica]

  • Pagina principale ns0 "multi-indice", Canzoniere Vaticano latino 3793.
  • Titolo delle poesie: numero romano originale; sottopagine della pagina principale.
  • Nome delle poesie: primo verso, come da Indice per volume e Indice generale.
  • Annotazioni: proposta: trascriverle come smaller blocks e non come annotazioni lasciando i riferimento ai numeri verso. IN caso di poesia su più pagine transcludere in unico smaller block ciascuna serie di annotazioni divise in più pagine.
Ehm, sulla struttura in ns0 non la sbrigherei troppo rapidamente. Sono pur sempre scottato dal fatto che Lirici marinisti ha ancora centinaia di poesie irraggiungibili singolarmente in ns0 e con doppioni (vedi questa e questa diversi ma a rigore provenienti dalla medesima fonte!). Ragioniamoci meglio a partire dall'esperienza maturata con le poesie di Cino da Pistoia e con i sonetti dei lirici arcadici: l'idea è la seguente
  1. L'unità del volume è costituita dall'unità del manoscritto che è un contenitore di moltissimo materiale disparato: essa sarà garantita da un indice del volume non necessariamente gerarchizzato in sottopagine se non per quanto riguarda le introduzioni e le appendici della raccolta ad inizio e fine volume
  2. il resto sono poesie d'autore o poesie anonime ravvoglibili in sottopagine per autore o spargibili in autonomia per il ns0, tutte con ricche introduzioni e ricche note: ognuna dovrà essere comunque raggiungibile in qualche maniera anche direttamente da ns0: o le si transclude sia come sottopagine che come componimenti a sé (come avviene per le due raccolte da me citate all'inizio) o si proponga una soluzione differente, come prendere il primo verso e creare pagine con esso che siano redirect a sottopagine della raccolta...tra le due io preferisco ancora la prima opzione. - εΔω 16:19, 9 giu 2019 (CEST)[rispondi]
Ok (avevo anch'io riflettuto e scartato l'ipotesi di transcludere le singole poesie in sottopagine). Purtroppo la struttura nella pagina principale dovrà essere "anomala", non credo che mediawiki regga oltre mille tl|Testo in una singola pagina e autons0 andrà anche lui in crisi. Non ho ancora le idee chiare su come automatizzare almeno un po'... comunque ho una tabella excel con tutti i dati (numero, numero romano, autore, titolo, volume, pagina), qualcosa dovrebbe venir fuori. Già l'identificazione accurata di tutti gli autori (con creazione degli elementi wikidata mancanti e aggiunta degli alias quando necessario) sarà un bel lavoraccio. Per ora mi limito a correggere i titoli e a riempire i campi Sommario. --Alex brollo (disc.) 00:09, 20 giu 2019 (CEST)[rispondi]
@OrbiliusMagister La struttura di sonetti dei lirici arcadici mi piace moltissimo. Nella transclusione per gruppi, potremmo anche riordinare le poesie per autore, anche se sono sparpagliate.... magari usando il tag include di pages, che permetterebbe di raccogliere tutte le poesie di un autore comprese in ciascun volume con un singolo pages. In aggiunta, la legittima soddisfazione di portare un bel po' di pagine principali a SAL 100%. Alex brollo (disc.) 09:56, 20 giu 2019 (CEST)[rispondi]

Contributori[modifica]

memoRegex[modifica]

{"\\\t":[""," ","g"]}