Discussioni utente:OrbiliusMagister

Da Wikisource.
Jump to navigation Jump to search
OrbiliusMagister è in Wikisinghiozzo permanente per motivi di famiglia e lavoro...
chiedete pure, ma non abbiate troppa fretta di ricevere risposta.
Archivi
Dall'iscrizione al 07/11/07......a maggio 2008......a novembre 2008......ad aprile 2009......a novembre 2009......al 15 maggio 2010......al 3 novembre 2010......al 26 maggio 2011...
...al 5 novembre 2011......al 1° maggio 2012......al 9 novembre 2012......al 6 maggio 2013......a fine 2013......a fine 2014......a fine 2015...a fine 2016
...a fine 2017 ...a fine 2018
Questi archivi sono "link permanenti". per vedere a che periodo facciano riferimento passaci sopra il puntatore. Se vuoi creare link a uno specifico messaggio nell'archivio basterà aggiungere un'ancora (#titolo_del_messaggio) dopo l'indirizzo completo dell'archivio.
Esempio: iPork il 22 dicembre 2007 mi scrisse un ringraziamento: il link al messaggio all'interno dell'archivio è Speciale:LinkPermanente/246069#Grazie
Cornelis Norbertus Gysbrechts - Quodlibet.jpg Buchladen.jpg
Scatolotte dal passato
Aubrey · iPork

Benvenuto[modifica]

se non lo vedi, clicca qui!
Benvenuto su Wikisource!

Ciao OrbiliusMagister, un saluto di benvenuto su Wikisource, la biblioteca libera!

Per iniziare la tua collaborazione, leggi come prima cosa cos'è Wikisource, la pagina delle linee guida ed i manuali contenuti nella sezione aiuto. Se hai domande, dubbi o curiosità non esitare a chiedere al Bar, a un amministratore o a qualsiasi utente vedessi collegato seguendo le ultime modifiche.

Buon lavoro e buon divertimento da tutti i wikisourciani.


Naturalmente benvenuto anche da parte mia e se avessi bisogno non esitare a contattarmi. IPork 11:46, 7 gen 2006 (UTC)

Convenzioni nomi pagine Indice[modifica]

Dove stanno? Non le trovo! Magari un utente inesperto ha più fortuna..... :-(

Intanto Ruthven sta aiutandomi per Progetto:Trascrizioni/Illustrazioni, e nel frattempo ho oltre 700 immagini tl|Ritaglio già realmente croppote e salvate in locale che aspettano di essere sistemate graficamente e poi caricate. Dopodichè la bella, ma temporanea avventura di Ritaglio si chiude :) --Alex brollo (disc.) 14:50, 3 gen 2019 (CET)

Pope! /2[modifica]

Ciao Edo! In questo periodo ho deciso di battezzare il Pope come mia rilettura, proprio per poterlo finire, dato che aspetta la convalida da tempi ancestrali, quindi, come direbbe Crozza... Yessa, conta su di me! Lo concludo io (ovviamente in base alle mie esigenze lavorative, ma si fa). -- Modafix (disc.) 16:28, 8 gen 2019 (CET)

Salgari e una vecchia richiesta[modifica]

Salgari ha un M&S molto problematico, si incanta spesso in corrispondenza delle illustrazioni (due pagine dimancato match confondono l'algoritmo). Nella cronologia della pagina Utente:Alex brollo/Salgari vedi i numerosi lanci di Match che ho dovuto fare, facendolo ripartire ridando un codice Match là dove si era incantato.

Mi sono deciso a studiare il codice python di Match per farlo lavorare offline. Ho qualche barlume di speranza di farcela, sto modificando le cose generali per farlo lavorare in locale e poi (sarà dura....) devo capirlo riga per riga. Vediamo! --Alex brollo (disc.) 22:12, 11 gen 2019 (CET)

PS: forse lo script si orienterebbe meglio inserendo nel testo, prima del match, le didascalie delle illustrazioni, in questo caso il numero delle pagine senza corrispondenza calerebbero da due a una. Serve inoltre un "estrattore di testo ns0" che crei un unico file testo accodando i testi dei capitoli ripuliti dalle monnezze. Questo non è difficile. Tu puoi lanciare in una tua cartella locale uno script python? --Alex brollo (disc.) 22:17, 11 gen 2019 (CET)
Ahem.... ho un terminale, ho python, ma tutto lì :D
Se ci organizziamo con una sessione "live" via chat, telegram, Hangout o simili e mi segui passo passo posso farlo. - εΔω 23:51, 11 gen 2019 (CET)
Può bastare, tanto ce ne vuole di tempo.... la parte ostica dell'algoritmo sta cedendo, imparerò parecchio dalla sua autopsia, ma prima di capirlo riga per riga (e forse migliorarlo per permettergli di superare i problemi Salgari) ce ne vuole. Tu sai che sono lento...... :-). Nel codice c'è un commento, ad un certo punto, messo lì da chi ha ereditato lo script: "No idea about what it means"... E' realmente un algoritmo duro. --Alex brollo (disc.) 07:36, 12 gen 2019 (CET)
Hurrà. --Alex brollo (disc.) 22:33, 12 gen 2019 (CET)

Prospettive M & S locale[modifica]

Lo script funzia, non solo: non fallisce là dove (per eccesso di pagine "fuori testo") il M & S canonico si pianta. Adesso c'è Ruthven che lavora per il djvu, anche se mi pare azzoppato dall'uso di un Mac (tu ne sai qualcosa), e si profilano cose notevoli. Prossimo passo per il M & S locale: farlo lavorare anche con i testi pdf. Di certo è possibile; forse sarà addirittura facile :-) --Alex brollo (disc.) 10:43, 14 gen 2019 (CET)

Fatto, effettivamente era facile, il M & S locale corre anche sui pdf (Internet Archive).
Che ne dici, comunico la cosa a Phe, o la passo pr ma a Ruthven, che certamente sa muoversi meglio di me nel magico mondo del debugging? --Alex brollo (disc.) 11:13, 14 gen 2019 (CET)
@Alex brollo, passa la palla prima a Ruthven, che è meglio.
P.S. Dai un'occhiata alla cartella Dropbox "Djvu files Edo" che condividi con me. Ci ho caricato la fonte di L'insegnamento della vita e massimamente del parlare, un libello di una trentina di pagine da trasformare in Djvu. Mi arrangerei del tutto se non fosse che l'originale ha una sacco di noterelle che nel nostro testo non sono state trascritte e che richiederebbero diverso tempo da trascrivere da zero. Si tratterebbe di un altro piccolo tassello di M&S. - εΔω 13:57, 14 gen 2019 (CET)
Mi stai chiedendo se è possibile integrare nel Match il nostro testo con i testi aggiuntivi della fonte che non sono stati trascritti? Se questa è la domanda, a naso direi sì, è possibile, ma è un problema tutt'altro che banale.... ci devo riflettere. L'ho già incontrato in Salgari, dove le didascalie delle foto sono presenti solo nel'OCR ma sono totalmente assenti nel nostro testo da matchare, mi ero infastidito ma le didascalie sono brevi e avevo scrollato le spalle.
Bella sfida, grazie! --Alex brollo (disc.) 11:43, 15 gen 2019 (CET)
Per dirla tutta a me basta anche solo un OCR delle note utilizzabile, mentre il testo preesistente lo elaborerei a mano. Non voglio farti usare tempo prezioso che ti serve per progetti più ambiziosi (come ad esempio... che ne so, la Storia della letteratura italiana di Tiraboschi) ^_* - εΔω 19:26, 15 gen 2019 (CET)
Meno male.... stavo per dirti che è impossibile, per la logica di Match; per capirla bene mi è servito un tremendo intoppo in La Città dell'Oro. Ci ragionerò. Forse qualcosa si può fare, ma non attraverso Match. Intanto, appena recupero FineReader, micci metto (prima però vorrei andare avanti con Salgari: hai furia?) Alex brollo (disc.) 01:01, 16 gen 2019 (CET)
Aimè, non trovola cartella su dropbox, ho fatto pulizia e forse l'ho scollegata. Puoi rispedirmi la condivsione? Nel frattempo, un occhio a c:Category:Salgari - La Città dell'Oro (1898) e sua sottocategoria Illustrations from...., controlla se le categorizzazioni (seguendo i suggerimenti d Ruthven) ticonvincono e poi...vedi che utente ha caricato le illustrazioni...? :-) BrolloBot (disc.) 22:48, 16 gen 2019 (CET)
https://www.dropbox.com/s/08m2y53y159qlzl/L_insegnamento_della_vita_e_massimamente.pdf?dl=0 --εΔω 00:13, 17 gen 2019 (CET)

Indentatura[modifica]

Per favore mi aggiusti l'indentatura del brano iniziale di questa pagina, grazie --Susanna Giaccai (disc.) 15:46, 14 gen 2019 (CET)

Ultima pagina[modifica]

Puoi portare questa pagina al 100% così si può chiudere la rilettura. Per di più la pagina sarà visibile solo nel 2030. --Luigi62 (disc.) 22:51, 21 gen 2019 (CET)

Tesi e copyright[modifica]

Senza mettere troppa carne sul fuoco, ma inizia col leggere il mio commento su Discussioni progetto:Tesi. L'idea è di, pian pianino, sanare la situazione. --Ruthven (msg) 11:57, 25 gen 2019 (CET)

Tiraboschi su IA[modifica]

Ecco la tabella degli item trovato con tiraboschi storia letteratura italiana su IA, dopo (faticoso) completamento dei metadati essenziali: Utente:Alex brollo/Tiraboschi

A te! Alex brollo (disc.) 19:28, 28 gen 2019 (CET)

Passo II:; scaricati tutti i volumi linkati a GB nella pagina Autore:Girolamo Tiraboschi, II edizione modenese. Sto verificando cosa succede a fare una trasformazione diretta in djvu con pdf2djvu. Ho anche dato un'occhiata al testo OCR di Google, come si estrae con pdftotxt, e non è malaccio. Impressionante il corretto riconoscimento dei caratteri ſ. Mancano però gli hyphen, il che è un problema.
Secondo me va fatto un serio pensiero all'edizione 1822 e succ. di IA, che ha grafia moderna e di cui sono disponiobili scansioni multiple (di esemplari diversi) elencati sotto "Classici" nella tabella linkata, che corrisponde all'editore Milano: Società tipografica de' classici italiani. Le scansioni sono molto buone, penso che l'OCR sia altrettanto buono, la disponibilità di scansioni diverse dovrebbe essere una garanzia per pagine mancanti/fallate ecc. Aspetto feedback. --Alex brollo (disc.) 12:35, 29 gen 2019 (CET)

Primo tentativo Tiraboschi[modifica]

Indice:Tiraboschi - Storia della letteratura italiana, volume I, 1822.djvu, ma non mi soddisfa, in corso altra conversione djvu. --Alex brollo (disc.) 15:20, 7 feb 2019 (CET)

Ricaricato. --Alex brollo (disc.) 09:38, 8 feb 2019 (CET)
Pensi di tentare un M&S da LiberLiber? --Alex brollo (disc.) 15:53, 7 feb 2019 (CET)
Mi secca ossessionarti, ma ho bisogno di conferma.
Dopo alcuni test seguo questa procedura:
  • accodamento in unico PDF del vari PDF di un volume
  • estrazione della sequenza immagini con pdfimages
  • pre-elaborazione immagini (divisione, raddrizzamento, cropping e memorizzazione TIFF colore 300dpi) con Scan Tailor
  • elaborazione sequenza TIFF con FineReader e produzione djvu
Sono caricati i primi due djvu. Dimmi se ti sembrano decenti.
A questo punto sistemerò i campi Sommario e fatto questo occorre predisporre una strategia di caricamento. Io tenterei, come dicevo, un Match offline sui testi ricavati da LiberLiber, ma fatto il Match prima di lanciare lo Split vorrei passarti i file per verifica/eventuale raffinamento. Ce la fai a fare tu questa verifica? --Alex brollo (disc.) 09:37, 8 feb 2019 (CET)
Caro @Alex brollo, l’idea di prendere LiberLiber mi piace, però ho imparato dal lavoro su Satira e antisatira che partendo da un'edizione moderna è richiesto prima del M&S un grosso lavoro di "antichizzazione del testo" ora banale ma in qualche caso (in particolare quando si consideri la punteggiatura) francamente ineseguibile. Liberliber si basa sull'edizione Molini-Landi, che spero non abbia differenze rilevanti rispetto a quella da noi utilizzata, mentre scopro che dietro la trascrizione su Liberliber c'è Utente:F.Chiodo, persona esperta e molto accurata. Passami i txt e darò loro un esame approfondto per vedere cosa differisca e cosa manchi. - εΔω 10:23, 8 feb 2019 (CET)
Bene, mi organizzo per fare un test sul Volume I, così vado anche un po' avanti con il progetto "Match offline". Alex brollo (disc.) 11:50, 8 feb 2019 (CET)
Primi test deludenti, il testo delle note (numerose nella parte I, Etruschi) non viene esportato nel txt ottenuto dall'ocd LiberLiber e il match automatico si inchioda. La vedo brutta. Alex brollo (disc.) 23:32, 10 feb 2019 (CET)

Particolare Tiraboschi con Match and Fix[modifica]

Vewdo che l'edizione originale non usa i caratteri latini combinati æ, œ mentre il testo di riferimento LiberLiber li usa. Io li lascerei come ae, oe rispettando la grafia del testo a fronte. Sei d'accordo? Se sei d'accordo, modifico il testo LiberLiber prima di lanciare Match and Fix, e ottengo il risultato. Ma lo stesso risultato si può ottenere anche che un colpetto di memoRegex. --Alex brollo (disc.) 14:53, 15 feb 2019 (CET)

Match and Fix caricabile con split[modifica]

Mi sono permesso di caricare in Utente:OrbiliusMagister/9 l'output alternativo di Match and Fix, dovrebbe essere pronto per essere caricato con Split, previa eventuale correzione manuale. Il comando che ho usato è stato: maf(ini=111,fin=131, load=False), load=False disattiva il caricamento via bot pagina per pagina. Fai dei test se vuoi; naturalmente puoi copiarne e caricarne solo dei piccoli pezzi di poche pagine, per prova.

IO al momento "salto" questo gruppo di pagine e inizio con la sezione successiva (Magna Grecia se non ricordo male). --Alex brollo (disc.) 16:36, 15 feb 2019 (CET)

Ricaricato Utente:OrbiliusMagister/9 previa modifica del testo di riferimento, adeguandolo per alcune differenze sistematiche fra edizioni: scioglimento dei caratteri latini æ, œ e sostituzione della finale in j con ii (studj->studii). --Alex brollo (disc.) 08:45, 16 feb 2019 (CET)
Ricaricato ancora Utente:OrbiliusMagister/9 dopo ripassata con Match and Fix, versione 2. Vedo che sei impegnato altrimenti; aspetto lasciando in sospeso quel gruppo di pagine. --Alex brollo (disc.) 14:22, 21 feb 2019 (CET)
@Alex brollo, la mia attuale settimana è piuttosto infernale quanto a impegni lavorativi; Scusa se non ti ho risposto prima. Immagina di rivolgerti a un analfabeta: leggendo Aiuto:Match and Fix il comando che hai usato prevede l'installazione offline di uno script da lanciare via linea di comando: da dove scarico tale script? - εΔω 22:46, 21 feb 2019 (CET)
Immaginavo che tu fossi stra-impegnato.
Pert quanto riguarda le pagine che ti ho preparato in Utente:OrbiliusMagister/9 non serve nulla: guardale, eventualmente fa qualche piccola correzione, e poi lancia il solito "Split".
Per quanto riguarda invece lo script Match and Fix, può essere scaricato da Progetto:Bot/Programmi in Python per i bot/matchAndFix.py, ma negli ultimi giorni c'è stata una forte accelerazione nella sua messa a punto.... per ora il consiglio è, lascia perdere, guarda il risultato dal file Split come Utente:OrbiliusMagister/9 in poi. --Alex brollo (disc.) 07:54, 22 feb 2019 (CET)

Lavori su Split[modifica]

@Xavier121, Candalua, Ruthven Dopo il lavoro su Match, Xavier121 mi ha sottoposto un caso che suggeriva un intervento su Split. La cosa è stata più facile del previsto ed è totalmente scroitta in javascript: in pratica, lanciando la funzione da una pagina in edit, contenente codici split (tipo ==[[Pagina:....]]==), lo split viene eseguito immediatamente. La funzione crea le pagine nsPagina, ma anche le sovrascrive se già presenti (era questo il problema di Xavier: vedi colloquio nella mia pagina di discussione).

Il problema è la potenza dello script, che corre a una velocità inumana (in pochi secondi, il tempo che lo Split normale utilizza per una-due pagine, ha lavorato su centinaia di pagine). Non vorrei che i "piani alti" lo vedano come un problema o che la mitragliata di edit attivi qualche allarme. Al momento non ha costruito un'interfaccia utente ma mi domando se - oltre a tutte le prec auzioni per limitare il rischio di errori - sia opportuno implementare un meccanismo di rallentamento del lavoro.

Naturalmente, il fatto che Match and fix produca, opzionalmente, una pagina testo con i codici Split già pronti costituisce un raccordo funzionale fra il "nuovo Match" e il "nuovo Split", che testerò con Tiraboschi. --Alex brollo (disc.) 11:51, 18 feb 2019 (CET)

Per me il nuovo Split è fondamentale nel lavoro off line e permette di gestire interi testi approcciando uno studio totale della formattazione. Direi che, vista la potenza dello strumento, dovrebbe essere abilitato solo per utenti esperti (non necessariamente anche amministratori). --Xavier121 12:46, 18 feb 2019 (CET)
@Alex brollo Per la velocità d'esecuzione, non penso che sia un problema maggiore. Però fai queste cose con l'utenza bot, a scanso di equivoci (e magari usa il parametro -pt perché quello che rischi è di perdere alcuni "salvataggi"). --Ruthven (msg) 14:43, 18 feb 2019 (CET)
@Ruthven Grazie. Lo script dovrebbe essere "per tutti", con le opportune cautele, quindi personalmente posso usare l'utenza bot ma non tutti ne dispongono. Per gli utenti normali ci vuole una soluzione diversa. Ma.... cos'è il parametro -pt? Non ne ho la minimissima idea... Dammi un link che mi tolga dal buio.... --Alex brollo (disc.) 16:01, 18 feb 2019 (CET)
@Alex brollo Quando lanci un bot, gli puoi dire ogni quanti secondi salva una modifica. Questo è essenziale per 1) non intasare le ultime modifiche 2) non avere bot che girano all'impazzata. Di solito, si fanno fare modifiche ogni tot secondi... bisogna andarsi a rivedere le raccomandazioni di WM. @Valerio Bozzolan aveva avvertito sui pericoli delle modifiche troppo fitte (temporalmente). --Ruthven (msg) 10:38, 19 feb 2019 (CET)
@Ruthven Non stiamo parlando di un bot python, ma di un gadget javascript. Per quello la menzione del patrametro -pt mi confondeva. Ci penserò. --Alex brollo (disc.) 13:55, 19 feb 2019 (CET)
@Alex brollo Ahhh il poblema si era posto su Commons, tempo fa, per il cat-a-lot. Non ricordo che sia stata apportata una soluzione, alla fine. --Ruthven (msg) 15:50, 19 feb 2019 (CET)
@Ruthven Bene. Siccome comincio a usare cat-a-lot e vedo che è velocino o_O, fintanto che cat-a-lot resta così veloce non me ne preoccupo :-) Alex brollo (disc.) 18:37, 19 feb 2019 (CET)

Osservazioni e sviluppi di Match and fix[modifica]

Sono sempre più soddisfatto di M&F!

Due osservazioni:

  1. dà il meglio dove OCR dà il peggio (testi latini, francesi, abbreviazioni ecc). Esempio: Pagina:Tiraboschi - Storia della letteratura italiana, Tomo I, Classici italiani, 1822, I.djvu/652.
  2. se, come in LiberLiber, si dispone di un pdf, si può usare direttamente come testo di riferimento il pdf, M&F può occuparsi serenamente dell'estrazione del testo. --Alex brollo (disc.) 12:06, 24 feb 2019 (CET)

Il punto su Match and Fix[modifica]

Sono preso dalla messa a punto di Match and Fix, che pone interessanti e difficili problemi (aumentare il numero di correzioni giuste e diminuire il numero di correzioni sbagliate). Dovrei essere al punto di estendere le correzioni ai casi di erroneo splitting di parole singole nell'OCR (per dire: ampia mente, invece che ampiamente) che è al momento il più frequente errore non riconosciuto e non corretto.

Non riesco bene a capire se Match and Fix - modellato su Tiraboschi - può avere un uso più ampio e generale, al momento mi basta che serva per Tiraboschi, certamente ne valeva la pena; poi vedremo. Grazie ai caricamenti su Tiraboschi la statistica annuale dice che abbiamo di poco superato (come caricamenti totali, SAL 25% compreso) gli amici polacchi :-) --Alex brollo (disc.) 08:33, 7 mar 2019 (CET)

Un esempio della "intelligenza" di M&F, ogni tanto chiede conferma se è incerto:
[u'bindelli', u'lineai', u'liis'] [u'tandem', u'finem', u'his']
sequenza molto diversa, confermi match?
--Alex brollo (disc.) 17:23, 7 mar 2019 (CET)

Tiraboschi news[modifica]

Come avrai visto, ho completato una prima fase dei lavori (alcuni tomi li ha prenotati Xavier, ma ne ho a sufficienza per farmi un'idea generale).

A questo punto passerei a una rilettura "ortografica" del tomo IX, Indice generale, con qualche esperimento di linkaggio.

Un paio di problemi:

  1. granularità della suddivisione in livelli ns0. Ho rinunciato per ora alla suddivisione in Capi ma sento la mancanza di link almeno fra gli Indici e sommari e i singoli capi. Si potrebbe pensare a un uso smodato di tl|§.
  2. tomi multi-indice. Ho riunito i tomi in ns0, il peggiore, come sai, deriva dalla fusione di 4 diversi indici. Per ogni tomo ho riunito le pagine Indice e sommario dei vari volumi in un'unica pagina. Non è fedelissimo alla fonte ma mi sembra logico e funzionale (in fondo è solo una ricollocazione).
  3. indice generale. Ho intenzione di stressare i nostri strumenti - come tl|Pg - ma è possibile un fallimento, potrebbe essere necessario inventarsi qualcosa di nuovo. Esiste poi il problema: le singole voci possono essere collegate semplicemente a livello pagina, o è necessario "puntare", nella pagina, al singolo "bersaglio" con un'ancora?

In breve: ci hai affidato una bella gatta da pelare..... --Alex brollo (disc.) 23:46, 12 mar 2019 (CET)

Riguardo al test sul tl|Pg (senza ancora puntuale, solo recupero link alla pagina) vedi primi test es. in Pagina:Tiraboschi - Storia della letteratura italiana, Tomo IX, Indici, Classici italiani, 1826, XVI.djvu/5. Può andare? Alex brollo (disc.) 22:50, 14 mar 2019 (CET)
Rispetto ai problemi:
  1. L'uso smodato di qualunque template allo stato attuale della tecnologia ci è precluso, oltre un certo numero non così esorbitatne di chiamate a uno stesso template la pagina si impalla;
  2. Ottimo lavoro: nulla da ridire e complimenti.
  3. Meglio accontentarsi di mirare a livello di pagina: per me sarebbe già un guadagno notevole. A proposito: il test sull'inizio dell'indice da te linkato qui sopra è un gran successo, pensavo però la problema del sovraccarico di template pg in ns0: abbiamo indici con molte pagine transclusi in ns0? come si comportano?
Avanti tutta: vedo la fine del lavoro sporco tecnico. - εΔω 23:11, 15 mar 2019 (CET)
Mi era sfuggita la risposta, l'ho adocchiata solo dopo aver aggiunto l'ultimo messaggio,grazie. Per quanto riguarda il template Pg, effettuata la trasclusione in nso di pagine veramente grosse del volume (suddiviso per lettere iniziali), come la A, di una quarantina di pagine, tutto OK: il sistema regge, il limite di impallo è lontano (attorno alle 150 pagine). Naturalmente Titaboschi è un lavoro pesante, assorbe quasi tutte le mie energie.... ma come dice la storiella cinese: e chi dice che sia un male?.... mi resta meno tempo per fare danni.... :-) Alex brollo (disc.) 07:12, 29 mar 2019 (CET)

aiuto[modifica]

Mi puoi aiutare per questo problema?, Ciao --Susanna Giaccai (disc.) 21:14, 17 mar 2019 (CET)

Passaggio da Verona[modifica]

Ciao! Passerò da Verona martedì, per un corso a docenti di scuola superiore: possiamo sentirci nei prossimi giorni? --Mirko Tavosanis (disc.) 19:34, 22 mar 2019 (CET)

Tiraboschi[modifica]

Quando "passo" la metà di un libro, sento che ce la posso fare. Ebbene, ho "passato" la metà del terrificante Volume XVI di Tiraboschi. Spero che le scelte che ho fatto per i linkaggi siano passabili, anche se ho sempre l'impressione che si potrebbe fare qualcosa di più. --Alex brollo (disc.) 07:00, 29 mar 2019 (CET)

m:WikiClassics User Group[modifica]

Hi OrbiliusMagister! :-) There is a WikiClassics User Group under construction at meta. So far, it's a place for users who are interested in Classics and want to help each other. I'd appreciate if you would join us. And when you like, please help spread the word. Best, DerHexer (disc.) 00:37, 30 mar 2019 (CET)

I'm back for Bandini![modifica]

Hiya, I know, it's been ages since I last worked on Discorso economico sopra la Maremma di Siena. I haven't forgotten it, life just got very busy for me! I remember how helpful you were to me. :) Can you help me again? You previously linked me to a very clean scan of the text - much better than the one I uploaded. Does it make sense for me to keep working on this fuzzy one? Is there a way to replace the scan with the more clear one? What do you recommend? Thanks! And sorry for using English. Julia\talk 22:56, 4 apr 2019 (CEST)

Dear @Julia W, there is no actual need for a replacement: any Italian reader can understand that DjVU and the link to the cleaner copy is useful in case of doubt. As you may have noticed, if you can go on and transcribe as best as you can, we (or at least I) are going to format and proofread the reamining pages, leaving the honor of validating them to you. - εΔω 12:07, 5 apr 2019 (CEST)
Thank you! I will keep adding pages. :) Is it okay to be marking my transcriptions as 75% or should I mark them 50% so I know when they have been checked by an Italian speaker? Validating refers to marking them as 100, is that correct? Many thanks, sorry I am not more familiar with Wikisource. Julia\talk 21:07, 5 apr 2019 (CEST)

Tiraboschi XVI a SAL 75%[modifica]

Ho il piacere di avvisarti che il terribile Volume XVI di Tiraboschi è passato a SAL 75%. Non lo metto in Nuovi arrivi perchè... è una sottopagina. Un mese di lavoro da pensionato....

Ti prego, quando hai pochi minuti, di aprire l'Indice in visualizzatore, e di rovistarlo con la funzione Ricerca. Per fortuna il bug di CirrusSearch è risolto e la Ricerca funziona di nuovo.

Seconda cosa: ti propongo anche di guardare questa pagina, di Paperoastro: ha superato difficoltà di formattazione (testo e grafica) veramente notevoli. Lo propongo per una "stelletta" adeguata. --Alex brollo (disc.) 23:53, 7 apr 2019 (CEST)

PS: vedo una deflessione verso il basso del grafico delle riletture, straordinariamente corrispondente a quella degli amici polacchi. Lascio per un po' Tiraboschi e mio dedico a "casi semplici" per vedere se riesco a muovere la curva. Dimmi pure, comunque, se ci sono altre attività più utili per il progetto. --Alex brollo (disc.) 10:48, 10 apr 2019 (CEST)

La curva si è mossa.... un effetto piccolissimo ma si è mossa. Vedo di persistere :-) --Alex brollo (disc.) 09:53, 14 apr 2019 (CEST)
Torno a Tiraboschi; sempre con la strategia "prima le rogne", ho formattato i quattro "Cataloghi" che chiudono i volumi I-IV e adesso con pazienza li rileggerò. Appena torno ai testi veri e propri cercherò di fare qualche "pensata" per i link autori. :: PS: Sarebbe interessante verificare quanti, fra i testi antichi nominati da Tiraboaschi nei quattro Cataloghi, sono online da qualche parte.... Alex brollo (disc.) 17:14, 22 apr 2019 (CEST)
PS molto corretto. Tiraboschi cita una tale miriade di autori (non meno di Leopardi nel suo Zibladone) per cui è opportuno capire quali sicuramente vadano rilevati mediante categorie e quali lasciare repribili con la normale casella di ricerca.

Altra applicazione di Match and Fix[modifica]

Guardando Wikisource:Scrittori d'Italia, mi sono accorto che abbiamo a disposizione due OCR: quello "incorporato" nel pdf originale BEIC, e quello prodotto da Internet Archive e incorporato nel djvu. Controntando i testi a campione, l'OCR djvu è migliore, tuttavia contiene errori che in genere non sono presenti nell'OCR pdf. Nell'uno e nell'altro gli errori sono pochi; la punteggiatura nel djvu è ben riprodotta, nel pdf è un disastro (per probabili errori di conversione di qualche simbolo interno del pdf). Nessuno dei due può servire come "testo di riferimento" per Match and Fix.

Sto riflettendo sulla possibilità di inserire nell'OCR djvu le parole discordanti, affiancate una all'altra con qualche trucco che consenta di scegliere, in rilettura o in pre-elaborazione, l'una o l'altra con un click. Una cosa come affiigevano#affliggevano basterebbe.

L'idea generale comunque, a parte i tecnicismi, è quella di trasformare quanti più possibili testi BEIC in "SAL 25% pieno" invece di lasciarli là come "SAL 25% vuoto", e chiedo il tuo parere sull'opportunità di farlo; se mi dai l'OK io procederei in modo sistematico nell'elenco Wikisource:Scrittori d'Italia --Alex brollo (disc.) 15:01, 4 mag 2019 (CEST)

@Alex brollo, Un buon 25% pieno è un invito sempre migliore del link rosso, dunqeu hai il mio bene palcito immediato. Prendi il Canone della letteratura italiana e vedi se ci sono opere che hanno la precedenza in quanto mancanti o bisognose di un invito. - εΔω 18:51, 4 mag 2019 (CEST)
Ottimo suggerimento! Il primo testo utile è: Scarica in formato ePub Storia d'Italia 75%.svg  di Francesco Guicciardini (1540), ideale per Match and Fix (edizioni differenti), per un po' non farò danni software :-) --Alex brollo (disc.) 20:23, 4 mag 2019 (CEST)

Orlando furioso[modifica]

La prima galoppata è finita. Sia Orlando furioso, che Orlando furioso (sec. la stampa 1532), entrambi proofread, dovrebbero essere rupuliti e bluificati. Logicamente, SAL 25%, ma almeno dovrebbe esserci un po' d'ordine: non mi ripromettevo di più. --Alex brollo (disc.) 19:04, 26 mag 2019 (CEST)

Dichiarazione e pasticci[modifica]

Caro OrbiliusMagister, oggi ho importato un testo da Wikipedia e l'ho formattato a dovere: Scarica in formato ePub Dichiarazione dei diritti della donna e della cittadina 75%.svg  di Olympe de Gouges (1791), traduzione dal francese di Francesca Di Donato (2004). Andandolo a linkare su Wikidata, scopro che esistono delle sottopagine "volanti" (in pratica, le sottopagine di Speciale:Prefissi/Dichiarazione_dei_diritti_della_donna_e_della_cittadina/) create anni fa da @Giaccai da una traduzione di Francesca Di Donato, autrice vivente e quindi in copyviol. Devo ammettere che del testo importato da Wikipedia non sono stato capace di verificare l'autore e che, avendolo trovato quasi ovunque in Rete, l'ho taggato ottimisticamente come "anonimo", ma potrebbe essere lo stesso identico testo. Come risolviamo questo pasticcio (sia di formattazione che di diritti)? Per precauzione, io cancellerei tutto. --Ruthven (msg) 18:38, 27 mag 2019 (CEST)

Scusa il doppio messaggio, caro. Sia Susanna che io siamo salvi dall'infame marchio del copyvioler! Ho trovato la fonte del testo di Francesca Di Donato a https://archiviomarini.sp.unipi.it/589/1/decla.pdf Riproduciamo la nota di copyright come richiesto e siamo in regola. Rimane la formattazione della pagina e delle sottopagine (e l'eventuale caricamento su Commons del testo). Questo è più campo tuo.... --Ruthven (msg) 18:47, 27 mag 2019 (CEST)

Domanda su Orlando Furioso[modifica]

Daresti una rapida occhiata a IA, per suggerirmi - fra le moltissime edizioni disponibili - una con note attendibili? vorrei un aiuto per individuare autori e personaggi storici a cui spesso Ariosto accenna con espressioni che per me sono molto peggio di quiz enigmistici.... e nè l'edizione Laterza, nè tantomeno quella letterale aiutano.

PS: avrai notato che il SAL 75% per almeno uno dei due Orlandi furiosi è ormai a portata di mano.... :-) --Alex brollo (disc.) 08:19, 9 giu 2019 (CEST)

Re: Un saluto[modifica]

Ciao, tutta "colpa" dell'Edithaton a Nesso! (Sono tornata anche attiva su Wikipedia...) Vediamo quanto riesco a conciliare tutto con la vita fuori da qui... :) Grazie per il saluto!!! Inskatolata (disc.) 18:02, 16 giu 2019 (CEST)