Progetto:Trascrizioni/Orlando furioso

Da Wikisource.
Jump to navigation Jump to search

Fonti per la conversione proofread[modifica]

  • Qualità grafica delle immagini: buona
  • Qualità dell'OCR: limitato dalla presenza di s lunghe
  • Complessità di formattazione: notevole per i due primi volumi con le edizioni 1516-1521 a fronte
  • Testo in ns0 da valutare per un M&S: Orlando furioso sec. l'edizione 1532

La parte più complessa: trascrizione dei volumi I e II[modifica]

I volumi I e II presentano nella stessa pagina, a confronto su due colonne parallele, la versione del 1516 e del 1521.

Pagina 50 del volume I


IMHO la cosa migliore, dal solo punto di vista della trascrizione pignolesca del testo, sarebbe riuscire a replicare la struttura a due colonne in Ns pagina e dividere poi le due versioni in Ns0. Qualcosa tipo Orlando furioso (1516) e Orlando furioso (1521) che racchiudano:

  1. Le parti comuni (Frontespizio? Indice? Introduzione?)
  2. La versione specifica (solo quella del 1516 da una parte e solo quella del 1521 dall'altra]]

È fattibile una cosa del genere? Ci sono combinazioni particolari di tag come <noinclude> o <includeonly> che permettono una cosa del genere tenendo un unico Ns Pagina come fonte? --L0ll0 (disc.) 18:54, 30 mag 2016 (CEST)

@L0ll0, OrbiliusMagister, Xavier121 Tecnicamente è possibile - una semplice tabella a due colonne a una cella, all'interno della cella una section con un nome che identifichi in tutte le pagine canto e versione tipo section begin="III 1516", dopodichè in ns0 basta un tag pages onlysection="III 1516" per estrarre le sole strofe del canto III, versione 1516.
Tuttavia non inizierei con questo lavoro, darei la precedenza al proofreading della versione 1532 che è più semplice perchè corrisponde alla versione definitiva in 46 canti, che abbiamo già in ns0: Orlando furioso. E anche se è più semplice, ci sono delle cose da decidere prima di iniziare.
  1. facciamo una trascrizione diplomatica stretta (con conservazione dell'ortografia e dei caratteri), una versione "critico-modernizzata", rinunciando alla ortografia e ai caratteri antichi, oppure entrambe?
  2. facciamo un M&S conservativo (ossia: non "distruggiamo" Orlando Furioso ma lo cloniamo in un Orlando furioso (1532) e da quello facciamo il M&S e lo convertiamo in versione proofread?
A chi viene qui senza essere stato pingato, scusatemi della mancata pingatura, confido nel passaparola infettivo. Alex brollo (disc.) 21:33, 30 mag 2016 (CEST)
@Alex brollo, OrbiliusMagister, Xavier121 Domande più che legittime... Premetto che mi fido di più del parere di chi ha calcato WikiSource in modo più continuativo e quindi conosce bene la strada che il progetto sta percorrendo, sia quella percorsa che dove si tende ad andare. Detto ciò la mia opinione da informatico è: conservare sempre, tutto, il più possibile. :-p
Traducendo in pratica:
  1. Mi verrebbe da dire che una trascrizione diplomatica sarebbe sempre da fare (in modo da lasciare a chi ne ha magari bisogno la possibilità di attingere all'originale).
    • Anche se questo comporta una doppia manutenzione: la manutenzione della trascrizione diplomatica e la manutenzione della trascrizione "critico-modernizzata"
  2. Sono d'accordo col cominciare dal terzo tomo in quanto è il più semplice da affrontare e quello più "definitivo".
--L0ll0 (disc.) 22:43, 30 mag 2016 (CEST) [Ufficio complicazione affari semplici]
Per il nome pagina in ns0 del volume III proporrei Orlando furioso (1532, Ermini) che identifica in breve sia la versione che l'edizione, attraverso il curatore Filippo Ermini (che non ha al momento nè una voce wikipedia, nè una voce wikidata).
Per la versione diplomatica, ho cominciato ad analizzare la grafia del testo, sarà dura; varia radicalmente la punteggiatura, l'ortografia, l'uso della s lunga è sistematico, non esistono vocali accentate, oltre alle "solite" abbreviature vocale+n/m ve ne sono per varie combinazioni di qu+vocale, per pre, per per, perfino per re, abbondano le h, esiste la cesura di vocali tipo ’l, ch’ ma trovo stranezze come gliuomini senza spazio.... per chi ci è abituato, la lettura corre abbastanza bene, facilitata anche dal senso, dal ritmo, dalle rime, ma per chi non è abituato è una lettura veramente dura. Urge - se affrontiamo l'opera - un protocollo estremamente dettagliato e rigido a cui attenersi.
Potremmo affrontare la doppia versione coma ha fatto talora @Xavier121 e come sta attualmente facendo @Naamar su Vasari, ma mi pare molto, molto dura già sul "semplice" volume III, non oso pensare a cosa succederebbe nei volumi I e II dove ogni pagina dovrebbe contenere quattro versioni (due diplomatiche e due critiche) o_O Alex brollo (disc.) 00:10, 31 mag 2016 (CEST)
Come in diverse altre occasioni la compresenza di edizioni moderne con quelle antiche mi trova favorevole alla eliminazione di quelle moderne, per due m:otivi discutibili ma chiari:
  1. Copyright: la presenza di una edizione moderna con quelle antiche può solleticare l'editore moderno a denunciare il fatto che abbiamo copiato qui totalmente una loro opera. Sappiamo bene che è una accusa ridicola, ma ricordate quanti anni abbia penato Wikimedia Italia per un'accusa risibile e miseramente fallace, in cui però dato che l'accusatore chiedeva un risarcimento di venti milioni di euro era impossibile essere sereni finché la legge non ha fatto il suo corso dichiarando dopo molto tempo l'inconsistenza dell'accusa. Ecco, io desidero che nessun testo possa solleticare anche da lontano tali pruderie in chi ah avvocati e tempo dalla sua parte.
  2. Statistica: ebbene sì, guardo con invidia Francesi e polacchi che hanno provveduto a fornire di immagini a fronte i molti testi che non le avevano. Vorrei dunque che in ogni caso in cui abbiamo possibilità di effettuare un M & S ci liberiamo di un testo senza fonte cartacea.
Se questi due motivi poi concorrono insieme sono doppiamente convinto. εΔω 06:41, 31 mag 2016 (CEST)

Proposta operativa passo passo[modifica]

Preso atto del parere di OrbiliusMagister (ed approvandolo incondizionatamente) procederei quindi con alcune operazioni preliminari.

  1. rinominerei Orlando furioso in Orlando furioso (1532, Ermini;
  2. eliminerei il riferimento all'edizione LiberLiber sostituendola con quella a Ermini in Infotesto, mi spiace eliminare del tutto Infotesto perchè sarebbe rullato il campo Primi contributori (ma restano ovviamente in cronologia e si può fare in un attimo successivamente);
  3. aggiungerei il riferimeno alla pagina Indice un "Url....";
  4. procederei a un primo "adeguamento tipografico", senza tentativi di conversione critica->diplomatica (iniziali maiuscole, formato della numerazione strofe....)
  5. aggiungerei una qualche forma di "fine pagina" fra le strofe per predisporre un M&S "truccato".
  6. a questo punto clonerei il testo "critico" (che costituirebbe la "versione critica") e cercherei di applicare ogni possibile trucco per ottenere una versione "pre-diplomatica" (s->ſ, v->u, haver per aver....); da valutare se è opportuna una ripulitura completa o quasi della punteggiatura (salvando forse i soli punto), mi pare più semplice introdurre da zero la poca punteggiatura presente che cancellare, elemento per elemento, tutta quella aggiunta all'originale cinquecentesco.

Se mi viene l'ispirazione e trovo il tempo sto pensando a un "tool abbreviatore" che funzioni su per giù come Diacritici (ma senza alcun box di scelta) ossia: posizionamento immediatamente dopo i caratteri da trasformare in abbreviazione, click, finito (al tool il compito di valutare i caratteri che precedono il cursore e azzeccare l'abbreviatura giusta; in fondo non sono molte: am, an-> ã; qua -> q̃ ..)

In conclusione, farei un grosso lavoro prima del "travaso" in nsPagina, con il vantaggio di operare (via bot o con un text editor esterno) in modo coerente sull'intera opera. Che ne dite? Alex brollo (disc.) 08:24, 31 mag 2016 (CEST)

Ermini 1532? Non è meglio usare Ermini 1913? Io eviterei di creare confusione al lettore. --Accurimbono (disc) 09:26, 31 mag 2016 (CEST)
@Alex brollo sottoscrivo la procedura. Se vogliamo fare i pignoli prima di cancellare il vecchio infotesto si potrebbe aggiustare il link a LiberLiber (che al momento è rotto da un 404) in modo da tenerne una versione funzionante nello storico. Quello utilizzato dai primi contributori dovrebbe essere questo.
@Accurimbono vogliamo dare più risalto alla data della versione originale (1532) o alla data della pubblicazione curata (1913)? Ma soprattutto: a questo punto al lettore interessa qualcosa? Perché ora che abbiamo deciso per la sostituzione si potrebbe tenere Orlando furioso e basta, senza ulteriori suffissi. Oppure solo Orlando furioso (1532). Sono d'accordo sul fatto di non creare confusione al lettore.
Comunque una pagina Orlando furioso, che sia sotto forma di disambigua o che sia sotto forma di redirect ad una delle versioni, secondo me ci vuole. --L0ll0 (disc.) 10:16, 31 mag 2016 (CEST)
Va fatta una pagina Opera:Orlando furioso, analoga alle altre pagine Opera.
Secondo me, visto che stiamo trascrivendo l'edizione del 1913, dobbiamo essere corretti e comunicare quello che è, cioè 1913. Che poi il curatore dica sia identica a quella del 1532 è tutto da dimostrare... --Accurimbono (disc) 10:30, 31 mag 2016 (CEST)
Sono una vera capra letteraria, ho scoperto ieri che l'Orlando furioso è opera particolare, simile ai Promessi sposi nella loro relazione con Fermo e Lucia; la versione 1532 è quella definitiva, assai diversa dalle prime due, con ben sei canti in più. Inoltre, Ermini identifica perfettamente l'edizione, perchè non ne ha curate altre. In questo senso 1532, Ermini idendifica perfettamente, e sinteticamente, sia la versione dell'Orlando che l'edizione; e poi, 1516, Ermini e 1521, Ermini faranno la stessa cosa. Al contrario, Ermini, 1913 non dice nulla sulla versione del poema che tratta. Alex brollo (disc.) 15:56, 31 mag 2016 (CEST)
  • Pictogram voting oppose.svg No. Concordo con Accurimbono. In Ns0 titoliamo così: Orlando furioso (Roma, 1909) o Orlando furioso (La Società, 1909) che riprende in parte l'Indice: Ariosto - Orlando furioso, secondo le stampe del 1516 e del 1521, Roma 1909, I.djvu. Nessun riferimento al curatore ma SEMPRE all'edizione. --Xavier121 13:09, 1 giu 2016 (CEST)
@Accurimbono, Alex brollo, OrbiliusMagister, Xavier121 faccio un riassunto delle varie proposte alla luce della convenzione "Edizione, non curatore".
Questo se vogliamo risolvere da subito il problema dell'univocità con eventuali altre edizioni.
Altrimenti, per semplicità, (come già fatto anche in Opera:Dei delitti e delle pene) si omette "Roma" e procrastiniamo la decisione su come chiamare le eventuali altre edizioni che saranno inserite in futuro. --L0ll0 (disc.) 15:05, 1 giu 2016 (CEST)
Lascio a voi il compito di rinominare Orlando furioso, io mi occupo per ora di "manometterlo" lasciandogli il suo nome. Ho visto che il M&S funziona bene nonostante le differenze orto-tipografiche, ma richiede qualche ritocchino. Appena finito, ho bisogno della seguente informazione: tutti d'accordo di provare a fare una "doppia versione", pagina per pagina, una strettamente diplomatica e una critica-modernizzata, tali che poi possano essere transcluse separatamente o comunque visualizzate individualmente? vorrei infilare il codice opportuno (section, ecc) direttamente nel testo ns0 "matchato", così che lo split poi infili il tutto nella pagina giusta. Alex brollo (disc.) 16:24, 1 giu 2016 (CEST)
Ho creato la pagina Opera:Orlando furioso e vi ho inserito le edizioni fino al 1540 compreso che sono presenti in SBN. Come si vede la situazione è molto complessa :) --Accurimbono (disc) 16:59, 1 giu 2016 (CEST)

Per questo si dovrebbe dividere secondo le versioni, dentro cui inserire le varie edizioni, sia in pagina autore, sia in pagina Opera. Non mi convince la doppia data in Ns0:

Versione del 1516[modifica]

    1. [[Orlando furioso (Bondeno)|Orlando furioso, ed. Giovanni Mazocco dal Bondeno, Ferrara, 1516]]
    2. ... Altre, ecc.
    3. [[Orlando furioso (La Società)|Orlando furioso, ed. Società filologica romana, Roma, 1909]]

Versione del 1521[modifica]

    1. [[Orlando furioso (Pigna)|Orlando furioso. ed. Giovanni Battista da la Pigna, Ferrara, 1521]]
    2. [[Orlando furioso (Rusconi)|Orlando furioso. ed. Elisabetta Rusconi, Venezia, 1524]]
    3. ... Altre, ecc.
    4. [[Orlando furioso (La Società)|Orlando furioso, ed. Società filologica romana, Roma, 1909]]

Versione del 1532[modifica]

    1. [[Orlando furioso (Valenza)|Orlando furioso, ed. Francesco Rosso da Valenza, Ferrara, 1532]]
    2. ...Altre, ecc.
    3. [[Orlando furioso (La Società)|Orlando furioso, ed. Società filologica romana, Roma, 1913]]

Edizioni successive[modifica]

      1. ... Altre precedenti (dal 1533 al 1540), ecc.
      2. [[Orlando furioso (Pasini & Bindoni)|Orlando furioso, ed. Mapheo Pasini & Francesco di Alessandro Bindoni, Venezia, 1540]]
      3. ... Altre successive al 1540, ecc.

--Xavier121 19:58, 1 giu 2016 (CEST)

Partenza[modifica]

  1. scaricato tutto su un editor esterno,
  2. fatte alcune sostituzioni massicce omogenee (numeri strofa, indentatura versi, iniziali maiuscole),
  3. cominciato a sostituire il testo dei canti in ns0 (per ora il I e il II) con il testo "critico riformattato".

Se l'obiettivo fosse la pura e semplice realizzazione di una versione "critica" si potrebbe partire con il M&S; invece vi prego di aspettare il copiaincollaggio definitivo, poi tenteremo la "antichizzazione massiva", e solo alla fine spero di poter produrre, in nsPagina, la doppia versione alternativa "pre-diplomatica" e "critico-modernizzata" pronte per il proofreading (non so ancora se conviene lavorare in ns0 o in nsPagina per l'ultimo passo, forse in nsPagina dopo im M&S) Alex brollo (disc.) 00:27, 1 giu 2016 (CEST)

Io con Verga mi sono gradatamente evoluto così:
  • Inizialmente prendevo un'edizione digitale qualunque (magari già presente qui) e la confrontavo con le pagine djvu; effettuavo l'antichizzazione in ns0 e poi il M&S, dopodiché portavo le pagine a SAL 75%
POI ho capito che per quanto si osservino le pagine prima di ogni M&S ci sono sempre sempre degli interventi che sfuggono alla preparazione del testo e che si fanno DOPO, pagina per pagina. Eppure bisognerebbe che le macchinosità venissero limitate al minimo. A maggior ragione se l'opera in ns0 è divisa su tante sottopagine.
INFINE ho deciso che l'ultimo romanzo lo elaboro pesantemente e tutto insieme offline in modo da ottenere un blocco il più possibile formattato secondo le convenzioni di nsPagina, poi inserisco le pagine una alla volta a mano senza M&S ponendole direttamente a SAL 75% e controllando eventuali distrazioni, imprecisioni e irregolarità pagina per pagina. Più laborioso offline ma più veloce online, sospetto che sia la tecnica con cui @Lino Marco ha inserito così bene i testi di Boccaccio. - εΔω 15:07, 1 giu 2016 (CEST)
Io uso una strategia leggermente diversa, come si vede dal Canto I: faccio il match, poi lo aggiusto (indifferentemente se offline o online) per correggere i piccoli sbagli di fine pagine, salvo, e poi NON lancio lo split riservandomi di farlo dopo che avrò "lavorato" il testo intero (per Canto) inserendo qualsiasi cosa ma conservando i tag patch intatti. Qualsiasi modifica faccia, anche pesante, lo split "obbedirà" senza porsi il problema se il testo è, o non è simile, all'OCR.
Molto dipende da che editor txt si ha e quanto l'editor è potente e lo si conosce; il mondo degli editor Apple non lo conosco, gli editor Linux sono potentissimi ma non facili, sotto Windows io mi trovo bene con Notepad++ (accoppiato a qualcosina di python). Di certo, queste esperienze andrebbero condivise a fondo. Impareremmo parecchio dagli altri.... Alex brollo (disc.) 22:09, 1 giu 2016 (CEST)
Alex, tu sei una scheggia e dunque lasciare i tag Match in ns0 per te è questione di minuti. Io non mi fido molto delle mie tempistiche e temo di lasciare a lungo sotto gli occhi dei lettori di passaggio pagine abbruttite da incomprensibili tag Match. preferisco agire sottocoperta e poi fare una mossa da Wikidrago. Oppure lavorare con calma in nsPagina lasciando al comtempo fino all'ultimo una versione leggibile in ns0. εΔω 19:10, 3 giu 2016 (CEST)

Fase 1[modifica]

A questo punto, pre.formattato tutto, procedo con un Match di prova sul Canto 1. Metterò un WIP, per favore NON lanciate lo Split, riflettendo mi sembra comodo lavorare sul testo "matchato". Alex brollo (disc.) 08:01, 1 giu 2016 (CEST)

Lavorati una decina di Canti, passo al tentativo di sdoppiare ogni pagina (nel testo match) in due section, ciascuna delle section avrà un nome comune per tutto il capitolo + una indicazione standard diplomatica/critica tipo:
<section  begin="I d"> ... <section  end="I d">
<section  begin="I c"> ... <section  end="I c">
per il capitolo I. Questo permetterà, ad esempio, di transcludere differenzialmente in ns0 la versione dislomatica del capitolo I con il codice:
<pages index="Ariosto - Orlando furioso, secondo la stampa del 1532, Roma 1913.djvu" from=39 to=49 onlysection="I d" />
Finita l'elaborazione e lanciato lo split, dopo verificato che tutto funzioni su un canto test (il canto I), compresa la verifica di quanto tempo ci si mette a fare il doppio proofreading, potremo fare il punto ed eventualmente cambiare programma. Alex brollo (disc.) 09:33, 2 giu 2016 (CEST)

Fase 2: "antichizzazione"[modifica]

Fino a che punto inoltrarsi nella "diplomazia"?

Qui di seguito metto una tabella con tutte le stranezze del testo originale cinquecentesco, aggiungetene se ne trovate, per predisporre le specifiche "convenzioni di trascrizione" per l'opera.

im, in ī
am, an ā
em, en ē
ed &
om, on ō
um, un ū
con 1
che
pre
per p 2
re
que-, qua-, qui- q̄ in alcuni casi
-que qꝫ ?
qui ꝗ o q
quando qn̄
s ſ
vostr- vr̃-
prode pr̃e
vocale accentata vocale non accentata
h moderne h antiche (es huomo, haver)
u e v v se iniziale, u se interna con eccezioni
  1. Unicode small letter con, 0xA76F (a76f)
  2. vedi fr.source
@Candalua, L0ll0, Samuele Papa Ok, il tool "abbr" esiste e sembra funzionare. Ultime due funzioni abbr() e alex.abbrRun di mul:User:Alex brollo/common.js, il BAT; un tentativo in Utente:Alex brollo/abbr.js, ma non ho "testa" per trasformarlo in un gadget. Il funzionamento è quello che immaginavo: ponendo il cursore subito dopo una serie di caratteri che possono essere abbreviati e cliccando il pulsante "abbr" viene lanciata alex.abbrRun e la abbreviazione viene eseguita. Per dire, se sta scritto mamma e voglio che sia trasformato in māma, mi posiziono dopo la seconda m e clicco - il cursore resta al suo posto, ma i caratteri am vengono convertiti in ā. Se avete voglia e freschezza, si può farne un gadget "antichizzante". Stasera comincio a scrivere (in python) quello che serve per le conversioni che possono essere automatizzate per ottenere in parte la versione diplomatica. Alex brollo (disc.) 22:12, 3 giu 2016 (CEST)

Fase 3: pronto per rilettura test il I canto[modifica]

@L0ll0, OrbiliusMagister Adesso si tratta di provare.... il Orlando furioso/Canto 1 ha avuto il suo M&S, ogni pagina ha il testo "sdopppiato" in una versione diplomatica e in una critica che sono state transcluse separatamente. Vediamo come va. Alex brollo (disc.) 00:35, 4 giu 2016 (CEST)

Ho due domande:
  1. Ho trovato l'abbreviazione di "acque" con quella specie di 3 finale attaccato alla q. Come mi comporto? Esiste già qualcosa di fatto? qꝫ ?
  2. Usiamo il Template:Colonna per riprodurre le due colonne? Ho paura che non ci stia in larghezza a meno di diminuire un po' il font.

Infine una proposta dato che siamo qua a discuterne: se c'è interesse a mandare avanti il progetto "versioni Diplomatica/Critica" si potrebbe cominciare a ragionare su un'interfaccia grafica per mostrare alternativamente le due versioni anche in nsPagina. Se secondo voi i tempi sono maturi per cominciare la discussione faccio le mie proposte nel bar delle trascrizioni. --L0ll0 (disc.) 10:08, 4 giu 2016 (CEST)
Un prototipo c'è già, lo ha provato @Xavier121, ma essendo basato su javascript ha un difetto grosso, fintanto che non sarà maturo ePub3: non può essere esportato. I tempi sono quindi maturi, proponi pure, ma tieni anche presente questo problema. Tanto per "giocare" sul primo canto, possiamo provare una tranclusione appaiata, basta ficcare le due transclusioni in due grosse celle di una tabella.
Un piccolo ostacolo alla visualizzazione con Template:Colonna in nsPagina è che poem di default ha un margine sinistro che occupa spazio; qualcosa si guadagnerebbe, modificando il css di poem (magari per il solo caso "poem dentro una tabella").
Per i caratteri molto speciali (fra cui il "Latin small letter con", ꝯ ) ci sono problemi di font; ci vogliono font che rendano bene l'unicode. Alex brollo (disc.) 14:41, 4 giu 2016 (CEST)
  • Pictogram voting oppose.svg IMO inutile perdere tempo con le colonne in nspagina. Nel caso specifico sembra più una scelta dell'editore per uniformare l'aspetto del testo ai precedenti volumi e, con i canti in più dell'ultima versione, per non costruire un libro voluminoso o diviso in due tomi (economia!). Queste edzioni non sono pensate per un pubblico generico ma per gli addetti ai lavori; è nostro dovere ripensarle per una diffusione universale. --Xavier121 15:07, 4 giu 2016 (CEST)
Concordo con Xavier nel caso specifico dell'Orlando furioso (però in altri casi potrebbe essere utile aver risolto il problema) Alex brollo (disc.) 16:12, 4 giu 2016 (CEST)

Aggiornamento 2019[modifica]

@OrbiliusMagister, Xavier121, L0ll0, Accurimbono Preso atto che:

  1. abbiamo un nuovo testo autorevole per la conversione proofread di Orlando furioso, con ortografia moderna e quindi privo delle enormi difficoltà della versaione diplomatica secondo la stampa 1532;
  2. l'esperimento su Indice:Ariosto - Orlando furioso, secondo la stampa del 1532, Roma 1913.djvu, ossia la doippia trascrizione diplomatica/critica, è stato interessante ma si è "spento" da tre anni;
  3. abbiamo nuovi strumenti per caricare rapidamente in nsPagina un OCR pre-elaborato ed eventualmente corretto per confronto con un testo di riferimento
  4. mi ero completamente dimenticato di questo progetto e ho "sparso" qua e là proposte e discussioni per rivedere l'argomento

vi propongo:

  1. scollegare Indice:Ariosto - Orlando furioso, secondo la stampa del 1532, Roma 1913.djvu da Orlando furioso e procedere con una trascrizione fedele del testo (quindi, solo diplomatica) in Orlando furioso (sec. la stampa 1532);
  2. caricare l'OCR pre-elaborato sui tre indici di Orlando furioso, collana Scrittori d'Italia (Vol. I, Vol. II, Vol. III);
  3. utilizzare l'edizione Scrittori d'Italia per la conversione proofread di Orlando furioso.

Da valutare l'alternativa di eseguire un M&S dalla vecchia versione naked di Orlando furiososui volumi Scrittori d'Italia piuttosto che lavorare sull'OCR, dipende dal numero delle piccole e traditrici differenze che caratterizzano edizioni diverse. Alex brollo (disc.) 14:24, 16 mag 2019 (CEST)

Ho confrontato la versione LiberLiber utilizzata per l'edizione naked di Orlando furioso con il testo Scrittori d'Italia: sono pressochè identici con differenze sistematiche (accenti, formattazione del numero strofa) che possono essere corrette con modifiche globali; è quindi possibile utilizzare il testo Scrittori d'Italia per la conversione proofread di Orlando furioso, sia con M&S classico che con Match and Fix. Procederei quindi con la definitiva conversione di Indice:Ariosto - Orlando furioso, secondo la stampa del 1532, Roma 1913.djvu in trascrizione diplomatica pura e con il caricamento di un buon testo nei tre indici Scrittori d'Italia. Alex brollo (disc.) 14:57, 16 mag 2019 (CEST)
Vai alla grande! εΔω 00:19, 17 mag 2019 (CEST)
Effettuata una prova di pre-elaborazione offline del magnifico OCR dei volumi Scrittori d'Italia, mi sono deciso: niente M&S, caricamento dell'OCR pre-elaborato, e rilettura, con sostituzione proofread delle pagine di Orlando furioso. Facendo così, c'è una rilettura da fare, ma preferisco cercare gli errori OCR (pochi) che le varianti "invisibili" (anche se poche) fra due diverse edizioni. In più... per la prima volta in vita mia leggerò Orlando furioso....
Nella cronologia delle pagine di Indice:Ariosto - Orlando furioso, secondo la stampa del 1532, Roma 1913.djvu sarà conservata la "storia" dell'eroico tentativo di farne una doppia versione diplomatica e "critica"; nella cronologia di Orlando furioso sarà conservata la traccia del tentativo, altrettanto eroico, di realizzare una doppia transclusione. Vado. Alex brollo (disc.) 11:44, 18 mag 2019 (CEST)

Versione diplomatica 1532[modifica]

Ho buone notizie sulla possibilità di correggere l'OCR della versione 1532 "sistemando" una alta percentuale degli errori f->ſ e anche di parecchi caratteri speciali indicanti abbreviature; se le cose vanno come penso, la rilettura sarà faticosa ma non inumana. Alex brollo (disc.) 10:56, 22 mag 2019 (CEST)