Wikisource:Bar

Da Wikisource.
Benvenuto nel Bar di Wikisource!
il punto d'incontro e discussione dei wikisourciani
archivio
Filing cabinet icon.svg
2016
gen feb mar apr mag giu lug ago set ott nov dic

Cat Categoria: Wikisource Bar Bar 

Il Bar di Wikisource è il punto d'incontro e discussione dei wikisourciani. Qui si possono porre domande, fare osservazioni o inserire comunicazioni di carattere generale a proposito di it.wikisource. Per favore, tieni conto che questo non è un forum né un blog. Tratta quindi argomenti il più possibile inerenti Wikisource e il suo progetto complessivo.

Se hai quesiti specifici riguardo a determinati argomenti, dai un'occhiata ai bar tematici, se hai domande tecniche lascia un messaggio nel bar tecnico.


Desideri...
...un appetitoso Smørrebrød danese?

No? Ti propongo qualcos'altro?

Hai appena conosciuto Wikisource e hai domande su cos'è, come funziona e cosa si può fare?

Leggi le domande frequenti.

Non trovi un'informazione?

Fa' una ricerca e esplora it.wikisource: se ancora non trovi nulla,
scrivi un messaggio sul Bar.


T-shirt su meta[modifica]

Conoscete m: Merchandise giveaways/Nominations? L'avevo segnalata a wikivoyage ma poi c'ra stato un picco di utenze italiane e mi ero fermato. Io ho avuto la maglietta mesi fa, anche Orbilius... chi manca all'appello? Ho lasciato una nomina di incoraggiamento, divertitevi... --Alexmar983 (disc.) 10:33, 1 mag 2016 (CEST)

Ottima idea! Ho supportato le candidature di @Alex brollo: e @Candalua:. Aubrey (disc.) 11:18, 1 mag 2016 (CEST)
Grazie della nomination... anche se forse meriterei una nomination particolare come creatore di bordelli... ;-) --Alex brollo (disc.) 10:54, 2 mag 2016 (CEST)
non ringraziare troppo Alex brollo, ti contatteranno fra più di sei mesi e qualunque cose vorrai non l'avranno... in sintesi è solo svuotamento di magazzini. Lo so ci sono passato... ma se sei perfido come me puoi a tua volta nominare qualcun altro :D--Alexmar983 (disc.) 15:42, 2 mag 2016 (CEST)
Ce l'avranno una t-shirt con il famoso motto "Cave pediam"? Altro non voglio.... :-) --Alex brollo (disc.) 16:26, 2 mag 2016 (CEST)

Statistiche: il ritratto della nostra comunità[modifica]

Wikisource - pages it.png

Oggi ho riguardato le statistiche di attività, in particolare quella che mostra la consistenza delle nostre pagine nsPagina per SAL nel corso del tempo. E' un ritratto fedele, vedo all'opera una comunità operosa e stabile, che da anni mantiene salda la propria "politica" e che nel tempo incrementa regolarmente, anche se leggermente, la sua attività. Una comunità "in equilibrio". Mi piace :-)


Volendo nella linea del SAL 100% si possono visualizzare dei piccoli, ma significativi scalini... cascano sempre in novembre, guarda caso ;-) --Alex brollo (disc.) 16:50, 2 mag 2016 (CEST)

Secondo te vale la pena di usare una politica francopolacca ed importare miriadi di libri e pagine SAL 25% pur di forzare il M&S e diminuire i testi non proofread? Secondo me sì, dato che negli anni fr. source e pl.source hanno raggiunto risultati impressionanti in tal senso. Ne approfitto per incitare @Mizardellorsa: a privilegiare le opere proofread ;) - εΔω 19:28, 2 mag 2016 (CEST)


La cosa che mi piace è che mi pare stiamo proprio arrivando ad una curva parabolica, il che dimostra una comunità in crescita. Speriamo bene :-) Aubrey (disc.) 19:25, 2 mag 2016 (CEST)
Umilmente: secondo me vale veramente la pena importare miriadi di libri e pagine SAL 25% pur di forzare il M&S se si vuole essere, come spesso dichiariamo, differenti dalle altre biblioteche on line. Ci siamo sempre dichiarati di essere qualitativamente unici o, per lo meno, questo è l'obiettivo per il quale IO NOI facciamo parte di questa comunità. Nell'ottica di ciò proporre sempre più testi Proofread aumenta questa qualità. Certo è che bisogna gestirla: ricerca testo digitalizzato, importazione, M&S, rilettura, ecc. So che ci sono molti testi no proofread e per qualcuno mi ero ripromesso di metterci mano alla fine del lavoro che sto seguendo. Adesso però che ci penso, non saprei come rintracciare la categoria dei testi non proofread. Si potrebbe inserire la categoria in HomePage come sono ben evidenziati i testi per SAL? Poi, si potrebbe creare un progetto dedicato al M&S? Sarebbe un bell'aiuto se gli utenti attivi ben consolidati, dedichino un periodo (a propria scelta o definito dagli amministratori) anche di pochi giorni o addirittura un vero e proprio dal - al per l'avanzamento del progetto M&S. Se questo progetto esistesse, io mi sentirei obbligato, in quanto utente attivo ed abituale a parteciparvi/impegnarmi. --Stefano mariucci (disc.) 13:41, 3 mag 2016 (CEST)
Io non faccio mistero di muovermi con obiettivi diversi: Per i testi in lingua ladina, con l'appendice in lingua romancia lo scopo che mi prefiggo, con l'aiuto della sezione ladina dell'Università di Bressanone, è di raccogliere e pubblicare tutti i testi disponibili scritti in tali lingue liberi da diritti. Tutte le volte che c'è un testo a stampa free si può seguire la strada del proofread, ma molti testi scritti nel secolo XIX o all'inizio del secolo XX compaiono in edizione a stampa spesso solo in riviste o libri editi recentemente con a fianco la traduzione tedesca coperta da copyrigt. Nel caso di opere presenti nella biblioteca Tessemann si può aggiungere un link alla pagina esatta, ma non realizzare una copia prooferad perchè l'Istituto ladino della Val Badia e la Biblioteca provinciale rilasciano le loro opere in CC, ma con la clausola NC. La soluzione più semplice è appunto caricare il solo testo ladino e tutte le volte che è possibile, mettere un link al sito dove è presente. Il nostro scopo è di diffondere la conoscenza, non battere record statistici.-Mizar (ζ Ursae Maioris) (disc.) 15:31, 3 mag 2016 (CEST)

Tech News: 2016-18[modifica]

22:09, 2 mag 2016 (CEST)

Franco Fochi[modifica]

Come si può constatare i libri su wikisource sono spesso "vecchi"... e allora mi son detto qualche giorno fa... facci(am)o qualcosa!

Ho scritto a w:Gianni Fochi, figlio di w:Franco Fochi, a cui linkerò questa discussione. Di entrambi curai la voce su wikipedia (fra l'altro in w:Franco Fochi c'è una ripetizione di testo, qualcuno di voi può provvedere?)

Ebbene dopo aver scritto alla sorella, mi ha fato sapere venti minuti fa che i due avrebbero acconsentito a cedere i diritti di alcune opere edite di padre, che abbiano superato i vent'anni di durata del loro ultimo contratto editoriale. Queste sarebbero:

  • "Piccoli scrittori", manuale di composizione per le scuole medie inferiori (con belle illustrazioni umoristiche), Edizioni Scolastiche Mondadori, 1963.
  • "Pedalare e vedere", manuale di cicloturismo, Centro Turistico Giovanile, 1958.
  • "Pisa e il suo verde piano", S.E.I., 1961.
  • "Lingua in rivoluzione", Feltrinelli, 1966.

Gianni Fochi è certo modesto quando parla del padre di cui teme le opere non possano suscitare un grande interesse nei lettori moderni. Io dico che è un timore infondato, anzi penso che siano volumi di pregio. Conclude Fochi Se la cosa ti sembrasse sensata, noi rinunceremmo volentieri per queste opere alle (del resto nulle) possibilità di sfruttamento economico ulteriore.

Fochi è giornalista e conosce bene le norme del copyright editoriale in Italia, il che è un vantaggio. Bisogna come sempre passare per il sistema di ticket OTRS, fra l'altro con doppia autorizzazione (sua e della sorella), ma mi proverò a occupare io al 100% di questo noioso passaggio.

Spero nel caso di confidare su un buon supporto da parte della comunità di wikisource, mi semplificherebbe la vita. Soprattutto mi farebbe piacere avere un po' di supporto perché sarebbe un bel precedente per wikisource in italiano, da citare anche in futuro. Ci sono molti famigliari di letterati o accademici che avrebbero interesse a anteporre la diffusione di certe opere ai loro diritti commerciali. Questo gesto, se ripetuto, ci permetterebbe di introdurre in wikisource testi vecchi di "soli" 50-60 anni rispetto ai 75-100 attuali.--Alexmar983 (disc.) 16:09, 3 mag 2016 (CEST)

temo comunque che per il manuale di composizione, non avendo dettagli su di chi siano le illustrazioni umoristiche, ci siano meno chance. In ogni caso vedremo in dettaglio su quali libri non c'è il problema del diritto d'autore di eventuali illustrazioni non fatte da Fochi. --Alexmar983 (disc.) 16:40, 3 mag 2016 (CEST)
Complimentoni, mi sembra un'ottima notizia. Appena viene perfezionato il permesso tramite OTRS credo che la comunità di darà il dovuto sostegno. --Accurimbono (disc) 17:12, 3 mag 2016 (CEST)
Complimenti davvero, mi pare un'ottima notizia e un ottimo precedente (abbiamo avuto qualche donazione in passato, ma non tante, e sono sempre belle e importanti). Wikimediani che bazzicano l'OTRS ne abbiamo, per cui chiedi pure. Ovviamente, sarebbe fantastico se loro:
avessero file digitali (non credo)
potessero prestar(ti?ci?) copie cartacee da digitalizzare. Aubrey (disc.) 17:58, 3 mag 2016 (CEST)
Il piano sarebbe questo: mandiamo al servizio OTRS la lunga e noiosa richiesta e vediamo se ci sono problemi (tipo vogliono sapere meglio i dettagli di diritti dell'editore) e ce la prendiamo "con calma". Nel frattempo passa minimo un mesetto, si fa estate e quando torno in Italia provo a passare da Fochi a prendere i libri di persona, magari una deviazione mentre torno dall'aeroporto. A fin agosto ricorre l'anniversario della morte, sarebbe bello riuscire a digitalizzare un'opera (la meno controversa, suppongo una di quelle senza immagini) entro quella data. Io posso scansionare a casa, basta che poi mi diate indicazioni precise su formato. --Alexmar983 (disc.) 05:03, 4 mag 2016 (CEST)
Riguardo alle autorizzazioni necessarie per OTRS, le informazioni necessarie penso siano:
  • l'autore ha ceduto i diritti all'editore oppure no?
  • chi sono gli eredi?
  • le autorizzazioni di chi di dovere.
Quali diritti sono stati ceduti all'editore e quali no è una cosa che possono sapere solo l'autore (i figli) e l'editore. Se l'autore ha mantenuto abbastanza diritti da poter rilasciare il testo sotto licenza libera, al punto di vista di OTRS mi aspetterei che ci scrivano i figli dicendo che:
  • sono i figli ed eredi;
  • hanno mantenuto i diritti;
  • rilasciano i testi sotto la licenza tale (e questa è la parte più standard).
Se invece l'autore non ha mantenuto abbastanza diritti, allora serve l'autorizzazione anche dell'editore, ed è più dura (non impossibile, ma dura). - Laurentius (disc.) 11:34, 22 mag 2016 (CEST)
Grazie Laurentius.
A quanto ho capito, ed essendo Fochi abbastanza esperto professionalmente in materia, l'editore penso non abbia "mantenuto dei diritti". Gli eredi sono Gianni Fochi e la sorella, che io sappia la loro madre è morta prima di suo marito (non ho chiesto mai esplicitamente per rispetto, ma me l'avrebbe detto Fochi). Spero che basti una dichiarazione e che non si debba ripescare i documenti originali del contratto editoriale dall'archivio di famiglia, ma se è necessario lo posso chiedere. Entrambi, Fochi e la sorella, hanno indirizzi professionali quindi mi sembra abbastanza chiaro che sono loro che scriveranno a OTRS. Io comunque farei scrivere a OTRS il prima possibile, poi d'estate guardo l'originale delle opere e possiamo discutere se sono caricabili o meno come scansione. In effetti anche se c'è solo testo alcune pagine all'inizio e alla fine forse sono considerabili di proprietà creativa dell'editore ma l'impaginazione semplice non è in nessun modo originale per quanto riguarda il nucleo centrale del testo. Riscrivo a Fochi.--Alexmar983 (disc.) 12:00, 22 mag 2016 (CEST)
Ho scritto una mail ho iniziato a chiarire meglio la necessità di una licenza per il riuso anche commerciale. Questo è un punto sempre molto critico ed è sempre meglio chiarire la cosa fin dai primi passaggi. Ho suggerito di procedere con un OTRS singolo per ogni opera che vogliano cedere, in modo da spezzettare il lavoro e gli eventuali problemi (sono di editori diversi, del resto).--Alexmar983 (disc.) 12:40, 22 mag 2016 (CEST)
Non credo necessario inviare a OTRS i contratti, basta che loro siano sicuri del contenuto. - Laurentius (disc.) 16:39, 22 mag 2016 (CEST)

Avviso memoRegex[modifica]

Ho iniziato l'aggiornamento di memoRegex, i pulsanti sono stati rinominati in "salva regex", "carica regex" e "esegui regex" e la pagina Aiuto:MemoRegex è stata aggiornata. L'aggiornamento è parziale, implementa solo alcune novità "di base", ci vado cauto ma sono script traditori.... sappiatemi dire. --Alex brollo (disc.) 00:06, 4 mag 2016 (CEST)

BAT man[modifica]

Come vi ho accennato alle volte, personalmente NON uso gran parte dei gadget ma ho raccolto tutto ciò che mi serve in un Big Anonymous Tool (BAT) che ha alcune caratteristiche:

  • ha "tutto dentro" ed è indipendente da qualsiasi gadget o script locale (tranne quelli generali)
  • è indipendente dal progetto (ossia, funziona, quasi completamente, in qualsiasi progetto source; io lo uso su mul.source e su it.source)
  • è completamente sotto controllo dell'utente registrato, senza necessità di ulteriori "privilegi" e senza utenza Amministratore (sysop), perchè non tocca il nsMediaWiki ma solo sottopagine della pagina Utente.
  • è unico e centralizzato su mul.source.
  • opzionalmente è fortemente personalizzabile attraverso una pagina personale di puro testo (la mia configurazione personale qui sta in Utente:Alex brollo/PersonalButtons)

La pagina doc originale sta su mul.source, dove ho sviluppato il tool in un lungo periodo di sosta e riflessione, oggi l'ho clonata qui: Utente:Alex brollo/BAT man. Non è aggiornata con le ultime novità ma approfitterò degli sviluppi recenti su memoRegex ed altro per aggiornarla.

Beninteso: il tool nasce proprio per essere personale ossia: per darmi la possibilità di provare e di pasticciare SENZA disturbare il progetto e gli altri utenti; quindi NON vi spingo minimamente a provarlo; ma mi pare giusto condividerlo. --Alex brollo (disc.) 08:20, 4 mag 2016 (CEST)

PS: Se visitate la pagina Utente:Alex brollo/BAT man lasciate un commento o almeno la vostra firma in Discussioni utente:Alex brollo/BAT man: grazie! --Alex brollo (disc.) 17:36, 4 mag 2016 (CEST)

Riforma costituzionale Boschi-Renzi[modifica]

Ho creato la pagina sulla Disposizioni per il superamento del bicameralismo paritario, la riduzione del numero dei parlamentari, il contenimento dei costi di funzionamento delle istituzioni, la soppressione del CNEL e la revisione del titolo V della parte II della Costituzione (cd. riforma costituzionale Boschi-Renzi). Il titolo non rispetta lo standard delle leggi costituzionali e non può rispettarlo perché non è stata ancora promulgata (lo sarò dopo l'eventuale sì al referendum). Magari ci possono essere titoli migliori ma non mi venivano in mente. La formattazione invece è sicuramente migliorabile. In ogni caso mi pare utile che fosse presente. --Jaqen (disc.) 18:55, 4 mag 2016 (CEST)

Grazie Jaqen. Ma perchè mi viene in mente automaticamente la famosa e brillante, ancorchè sintetica, recensione de La corazzata Potëmkin, fatta dal rag. Fantozzi? Alle volte queste associazioni di idee sono veramente inspiegabili. --Alex brollo (disc.) 20:15, 4 mag 2016 (CEST)

Un breve saluto[modifica]

Salve ragazzi, rubo qualche byte di questo bar per un saluto; scusatemi se non sono stato presente (ma ho seguito tutte le discussioni) e spero di essere operativo a breve. Da una breve occhiata mi accorgo di dover togliere molti bottoni che non funzionano più: sarà cambiato qualcosa, immagino.
P.S. Devo ammettere di non aver ben capito queste regex, ma mi riprometto di studiarle meglio appena possibile. :-)
Buon lavoro wikisourciano!--Barbaforcuta (disc.) 20:36, 7 mag 2016 (CEST)

Grande @Barbaforcuta:, bentornato! Dai ragazzi che ci siamo tutti ormai :-D Aubrey (disc.) 11:44, 9 mag 2016 (CEST)
@Barbaforcuta: bentornato anche da parte mia! :) --Accurimbono (disc) 14:02, 9 mag 2016 (CEST)
Io sono "piccolo" ma leggendo i tuoi interventi so che sei un grande. Ben tornato anche da parte mia. --Stefano mariucci (disc.) 14:42, 9 mag 2016 (CEST)
Grazie a tutti! @Stefano mariucci: Beh tutti siamo grandi nel nostro piccolo; spero solo di non essermi arrugginito.--Barbaforcuta (disc.) 23:59, 9 mag 2016 (CEST)

Statistiche di visite su Wikisource[modifica]

Il grande MusikAnimal, ha fatto una cosa che mancava da tempo: ha inserito nel tool di visualizzazione anche la possibilità di vedere le visite a tutto il sito. Per cui si possono fare interessanti comparazioni come questa. Il sito ci sarà molto utile per i nostri "contest" e campagne, è sempre bene misurare l'impatto. Aubrey (disc.) 11:44, 9 mag 2016 (CEST)

in effetti prima o si usava la hom page o amen. Non che desse un'idea anche quella, ma tutto il sito è un'altra cosa.--Alexmar983 (disc.) 14:09, 9 mag 2016 (CEST)
Per curiosità, qualcuno riesce scoprire cosa sia successo su mul.source ad inizio aprile? εΔω 07:15, 11 mag 2016 (CEST)

Il problema Internet Archive: urge decisione pdf/djvu[modifica]

Che famo con i pdf di IA? Ne abbiamo già parlato, ci sono tre vie:

  1. cominciare a utilizzare direttamente i pdf di IA e non pensarci più
  2. creare laboriosamente i djvu con tecniche manuali (tipo passaggio del PDF a FineReader11; cosa riservata ai pochissimi fra noi che hanno il programma)
  3. scovare un metodo per produrre dei buoni djvu dai file IA (recuperando anche il loro OCR) con un tool che faccia tutto da solo.

Per sfida sto esplorando la terza via (se avrò qualche risultato lo riporterò in Bar tecnico), che non è affatto semplice, ma rinuncerei prontamente se la maggioranza di noi propendesse per la prima soluzione (MOLTO più user-friendly). --Alex brollo (disc.) 12:34, 9 mag 2016 (CEST)

Sinceramente, io propenderei senza grossi patemi per la prima soluzione. Il tempo dei nostri utenti più esperti è prezioso, va rispettato e usato con parsimonia, e per quanto anche io provi affetto per il djvu è una tecnologia che ha perso. Il PDF funziona, il tool IA upload lo carica senza problemi, di fatto a noi non cambia nulla (se non che vengono caricati PDF su Commons e la gente può leggerli meglio...). Il djvu è morto, lunga vita al djvu. Aubrey (disc.) 13:07, 9 mag 2016 (CEST)
@Nemo bis: Mi spiace un pochino per il tempo impiegato a penetrare nei misteri del djvu, ma già mi sono procurato qualche attrezzo per maneggiare i pdf (ai cultori della materia suggerisco di esplorare xpdf; accetto altri suggerimenti). Proporrei di partire subito con la sperimentazione utilizzando i tasti ancora non convertiti in djvu con tecniche artigianali, nella collezione caricata su IA a cura di Nemo dalle biblioteche milanesi. Alex brollo (disc.) 13:25, 9 mag 2016 (CEST)
Ho sempre salvato in djvu perché formato vincente in un certo periodo della nostra avventura, ma quello che desideravo era maneggiare le scansioni perché piene di errori e wm non graditi. Spesso, come su OPAL, anche senza OCR. Se i pdf di IA saranno buoni si caricheranno così come sono; se non rispondono per qualche motivo alle nostre aspettative si protranno (dovranno: mi aspetto anche una decisione sulla qualità del nostro progetto) lavorare e ricaricare su commons. A quel punto salvarli in un formato o nell'altro è mera questione di spunta nelle opzioni di salvataggio. --Xavier121 13:40, 9 mag 2016 (CEST)
Ma, non ho capito: supponendo di usare d'ora in avanti solo i pdf, stiamo parlando di rinunciare al text layer? O vogliamo comunque generare un OCR e ficcarlo in qualche modo nel pdf? Oppure salvarlo per conto suo? Mi sembra che in ogni caso ci siano comunque dei passaggi da fare a mano... P.S. Comunque prima di prendere decisioni avventate cerchiamo di scoprire cosa stanno facendo i francesi... e se riescono a far fare l'ocr al tool ia-upload. Can da Lua (disc.) 14:04, 9 mag 2016 (CEST)
@Candalua: Chiariamo un equivoco: i pdf di IA hanno il loro bravo OCR e dal punto di vista dell'utente comune non c'è alcuna differenza con i djvu (tanto, l'immagine a fronte in nsPagina è in entrambi i casi un jpeg derivato). E' opportuno fare un po' di verifiche per controllare che non si "incanti" qualche tool avanzato che si aspetta un nome nsIndice e un nome nsPagina che termini con .djvu invece che con .pdf, tutto qui.
Là dove casca l'asino sono alcune procedure molto particolari che richiedono di "sbisigare" a fondo nella struttura del testo mappato; ma sono cose che al 99% (e più) degli utenti non interessano affatto.
I pdf Google hanno una struttura diversa, il che potrebbe provocare l'assenza dei trattini per le parole spezzate a fine riga; anche qui, bisognerebbe provare. Occorre fare una bella pagina di aiuto per illustrare i (parecchi) programmi che consentono di manipolare i pdf (es. cancellare o aggiungere pagine, rioprdinarle, estrarre il testo, estrarre le immagini, cropparle....). Ottima l'idea di vedere che fa fr.source, scandaglierò le loro pagine discussione, ma invito anche voi a farlo, ed eventualmente a chiedere a qualche utente che conoscete. (alex sloggato) 193.43.176.15 14:54, 9 mag 2016 (CEST)
Ecco il primo: Indice:Tarchetti - Paolina.pdf. L'uploader di Tpt funziona senza battere ciglio: avvisa solo che verrà caricato come pdf. Però.... i problemi ci sono, eccome se ci sono.... :-(
Aprite una pagina qualsiasi e li constaterete.
Procedo nella terza via. --Alex brollo bis (disc.) 15:41, 9 mag 2016 (CEST)
Solo per non generare panico, comunico che qualche giorno prima su richiesta di Edo si era creato questo, ed è la qualità minima richiesta per ogni scansione che si desidera insierire su questo progetto, pena l'abbandono generale della pagina indice. I derivati di IA da tiff o da altre sorgenti sono terribili, anche sui djvu qualche volta la compressione era eccessiva. Io penso sia un DOVERE occuparsi del lavoro offline sui testi, perché le buone scansioni fanno buono anche il progetto in generale e una pagina chiara stimola i contributori. Come Aubrey, anch'io penso che il tempo sia importante, ma ritengo che spenderlo in queste cose non sia perso. Se esiste un tool meglio, altrimenti procurarsi un buon programma. :) --Xavier121 16:05, 9 mag 2016 (CEST)
Il mio spirito ecoinformatico piange a vedere un testo così banale produrre un djvu di oltre 50 Mby, fra l'altro con un bel po' di fatica e buttando via un OCR già fatto; lascio a Xavier la seconda via e procedo con la terza :-)
Il file Indice di prova lo marcherei con un chiaro messaggio "FILE TEST" e lo conserverei a futura memoria della schifezza che vien fuori. --Alex brollo (disc.) 16:34, 9 mag 2016 (CEST)
Secondo me la cosa migliore è parlarne in wikisource-l o nei Bar dei progetti più grossi. Non ho ben capito l'orrore che descrive @Alex brollo: non ho visto cose che non vedevo anche in altri libri. Spezzare il testo a fine riga può essere risolto da un postOCR come al solito? Idealmente, comunque, bisogna lavorare sul tool IA Upload, perchè viene usato da tutti e si risparmi un bel po' di tempo a far le cose lì invece che ognuno per sè (sempre che si riesca a lavorare "a monte"). Aubrey (disc.) 17:27, 9 mag 2016 (CEST)
Fatica non direi :) Però i 50 MB si potrebbero ridurre a 15/20 senza significativa perdita di qualità (uso impostazioni predefinite sia per testi brevi che lunghi e non vado oltre i 50/60 MB in genere, ma nel caso di testi piccoli la dimensione potrebbe apparire eccessiva. La banda mi assiste, caricarli non è un problema, Commons fino a 100 MB! Ricordo che spesso nelle immagini, come negli OCR, compare la fastidiosissima digitized by Google: lavorarli diventa inevitabile. --Xavier121 18:41, 9 mag 2016 (CEST)
Ciao a tutti, giusto domani cominceremo a scansionare e caricare i testi di Cesare Battisti, per un progetto GLAM della Biblioteca comunale di Trento. Quale è dunque la nuova procedura? Cambia qualcosa nella produzione delle scansioni? In quali formati e in che definizione è opportuno farle? Penso che io e @Susan bibtn: saremo spesso qui a chiedere aiuto! Grazie --EusebiaP (disc.) 22:14, 9 mag 2016 (CEST)
Ho notizia di un tool per la conversione pdf->djvu di Phe, Tpt mi ha dato questo link: https://tools.wmflabs.org/phetools/hocr_cgi.py ma non riesco a capire come "chiamarlo".
@Aubrey: Ma tu hai aperto una pagina qualsiasi di Indice:Tarchetti - Paolina.pdf? Ti piacciono le immagini delle pagine, ti piace l'OCR.... o_O ? Sono solo io che vedo immagini illeggibili e un testo che fa pietà (e non solo per spaziature di parole e di linee, ci sono anche inspiegabili spostamenti di parole)? Alex brollo (disc.) 23:58, 9 mag 2016 (CEST)
PS: a questo punto getto la spugna e ritorno all'edit e al mio amato BAT per uso personale. Aspettando che i francesi facciano qualche miracolo. Certo che IA ci ha tirato un bel bidone.... che peccato. Alex brollo (disc.) 00:02, 10 mag 2016 (CEST)
@EusebiaP, Susan bibtn: a noi va benissimo la qualità dei testi di OPAL (per praticità), in pdf. Se poi avete tempo di creare anche cartelle zip con dentro tiff alta qualità, meglio, ma non è indispensabile. --Xavier121 11:00, 10 mag 2016 (CEST)

Tech News: 2016-19[modifica]

01:22, 10 mag 2016 (CEST)

Pensiero in libertà sulle immagini delle pagine[modifica]

Cos’è l’immagine di una pagina? Una scansione o una foto di una pagina. Ma cos’è l’oggetto rappresentato da questa immagine? Una pagina. Bianca, all’origine; escludendo le immagini a inchiostri colorati, nel 99% dei libri antichi è una pagina bianca con "macchie" di inchiostro nero.

Quindi: la migliore e più fedele rappresentazione dell’oggetto-pagina dovrebbe essere un’immagine in bianco e nero.

Qual è il nostro scopo: importare la migliore rappresentazione della scansione, o la migliore rappresentazione dell’oggetto? Io propendo personalmente per la seconda; e quindi continuerò a lambiccarmi il cervello - a tempo perso - sulla migliore trasformazione possibile delle immagini delle scansioni in B/N. Via con lo studio dell'adapting threshold--Alex brollo (disc.) 09:15, 10 mag 2016 (CEST)

Però, Alex, bisogna che ci si metta d’accordo: prima dicevi che la qualità dei PDF di adesso è tropo bassa (ed effetivamente è più bassa), adesso dici che vuoi compiere trasformazioni per togliere il colore naturale dell’immagine.... Secondo me sono in contraddizione. Per quel che mi riguarda, io sono per la via più semplice che porta al risultato più naturale e allo stesso tempo leggibile: io credo che non ci siano utenti che vengono in Wikisource e usino il nsPagina per leggere un libro guardando solo le scansioni.

Credo che la Proofread extension sia stata un’ottima invenzione per aumentare la qualità dei nostri testi e anche per rassicurare il lettore che stava leggendo un’edizione particolare, dandogli la possibilità di controllare lui stesso. Con il pdf secondo me c’è il rischio che la gente si scarichi quello e se lo legga senza di noi. Per quanto anche io preferisca una bellissima scansione a supporto di un testo, mi interessa molto di più che il nuovo OCR non faccia schifo, e che non rallenti il lavoro della comunità, che, a mio parere, è quello di trascrivere e rendere leggibili (e interconnessi) testi. Aubrey (disc.) 10:17, 10 mag 2016 (CEST)

  • Pictogram voting oppose.svg Ma sempre con tutta la stima del mondo per il lavoro che hai fatto e che farai! A me dispiace perdere info grafiche dalla fonte perché è lavoro buttato dell’operatore che ha creato il file immagine. Abbiamo sempre a che fare con libri: il b/n è freddissimo e irreale, mi allontana. --Xavier121 10:50, 10 mag 2016 (CEST)
@Xavier121: Non ho una risposta precisa; ma tu immagini che veramente che Paolina sia stata stampata su carta grigio-scuro? E se è stata stampata su carta bianca come è piuttosto probabile, con inchiostro nero, è più fedele al libro un’immagine grigio-scura o un’immagine BN? Rispetto molto la fatica di chi ha scensionato, ma rispetto di meno gli artefatti che ha infilato nella scansione. Una buona scansione dovrebbe essere al massimo color carta di fondo con caratteri belli neri ben contrastati e ben dettagliati.
@Aubrey: La prima cosa che fa un programma OCR tipo FineReader è quella di trasformare (faticosamente) le immagini in B/N per poi passarle agli algoritmi di riconoscimento carattere. Dandogli ottime immagini B/N il tempo di elaborazione si riduce moltissimo senza alcuna perdita di informazione testuale. Su certe paginacce prodotte a colori ad altissima risoluzione da C.R. (6000px, talora 12000 px di lato) il povero FineReader11, per caricarne una, stava parecchio più di un minuto.... la stessa immagine in BN richiedeva pochissimi secondi. Stessi tempi enormi per le elaborazioni (raddrizzamenti, deskewing ecc); stessa cosa con ScanTailor. Alex brollo (disc.) 11:16, 10 mag 2016 (CEST)
@C.R.: Beninteso.... paginacce riguarda solo le loro enormi dimensioni, nap.source è stata un’avventura magnifica, e non è detto che sia finita :-) Alex brollo (disc.) 12:13, 10 mag 2016 (CEST)
IMHO: il file della scansione ha una sua vita autonoma in Commons e deve essere della miglior qualità grafica possibile, la trascrizione che da questo deriva dovrebbe essere facilitata dalle elaborazioni di questo file, ma senza per questo compromettere la qualità della scansione iniziale.
In altre parole a me, come utente, piace avere la possibilità di scegliere tra il leggere il libro originale scansionato al meglio (avendo la possibilità di "sfogliarlo" virtualmente) e leggere la sua trascrizione testuale derivata con il bonus di avere collegamenti ad autori e testi citati, la comodità di poter fare una ricerca testuale, portabilità su ebook reader, etc.. --Accurimbono (disc) 14:13, 10 mag 2016 (CEST)
Proprio di questo stiamo parlando; le immagini originali delle scansioni non hanno la miglior qualità grafica possibile, una fedelissima conversione (perchè le immagini originali sono sempre convertite, compresse ecc) riproduce con la stessa esattezza l’oggetto e gli artefatti. Secondo me, ricostruire l’immagine della pagina, com’era appena stampata, sarebbe la migliore rappresentazione dell'edizione. Certo, se invece dell’edizione volessimo riprodurre l’esemplare, il libro concreto individuale, allora anche la muffa, l'ingiallimento delle pagine, le macchie di sugo di pomodoro avrebbero la loro bella importanza ..... ;-) resterebbero però da correggere, anche in questo caso, le deformazioni prospettiche, la planarità, e l'irregolare illuminazione, che nei vecchi libri è estremamente fastidiosa. Alex brollo (disc.) 15:29, 10 mag 2016 (CEST)
Paolina.djvu
Esempio, imo, straordinario: prima edizione delle Novelle rusticane, testo caricato il 9 maggio 2016 da Ruggeri! La qualità è discreta e risponde alle nostre esigenze: l'OCR in queste condizioni sarà ottimo e complessivamente, non inserendo alcuna compressione aggiuntiva, ne verrà fuori un file da 10/15 MB fedele all'originale. Come si può rinunciare a tutto questo? N.B. Se sfogliate il testo linkato troverete una chicca pazzesca! --Xavier121 19:02, 10 mag 2016 (CEST)
Ma infatti bisogna capire se il PDF di quella cosa viene bene o meno. Che sia djvu o pdf a me ne cale: con Xavier anche io penso che sia bello e naturale, per l'utente, vedere il colore vero della carta. Poi, che il nostro software, per sè stesso, se lo converta in binario o b/n o esadecimale, è una cosa da software, per lui: credo che l'utente necessiti di una foto a colori. Aubrey (disc.) 19:34, 10 mag 2016 (CEST)
Guardate questa immagine a destra derivata da quell'orrendo pdf di IA. Non è B/W, è "B/carta ingiallita" e scegliendo meglio il colore potrebbe diventare un "color wikisource", il migliore sfondo possibile per "riposare gli occhi" durante la rilettura, sempre lo stesso. E' ottenuta dal djvu (locale) File:Paolina.djvu. E' un file fatto di una sola pagina, ma guardate il suo peso: 9 kbyte. Questo significa - arrotondando in eccesso - che 200 di queste pagine peserebbero 2Mbyte, invece che 50Mbyte; non solo, ma IMHO sono pagine migliori. Proseguo ancora un po' - al 90% resterà uno delle mie divagazioni senza esito. Alex brollo (disc.) 22:06, 10 mag 2016 (CEST)
@Alex brollo: quello che è possibile riprodurre con una scansione è solo l'ESEMPLARE, che esiste come oggetto reale. L'"EDIZIONE" è un concetto astratto che non esiste materialmente e quindi non è possibile scansionare. Volerla recuperare a ritroso a partire da una o più scansioni dei singoli esemplari, credo IMHO che sia velleitario e una sorta di POV. Esempio: tu puoi sostenere (in base a cosa?) che la carta originariamente fosse stata bianca, io potrei sostenere (in base a cosa?) che la carta originariamente fosse stata gialla, qualcun altro potrebbe sostenere una delle mille sfumature intermedie... sarebbe in ogni caso un intervento posticcio e gratuito sulla scansione dell'esemplare. Che la scansione vada fatta tecnicamente al meglio (luce, a fuoco, margini, planarità, allineamento, risoluzione, etc..) è giusto, ma ulteriori elaborazioni sinceramente non le vedo come migliorative al fine di avere su Commons la migliore scansione possibile. --Accurimbono (disc) 09:30, 11 mag 2016 (CEST)
@Alex brollo: cmq nulla vieta di fare dei file derivati ed elaborati della scansione originale. Le finalità e gli usi di questi possono essere diverse. E' il bello di wiki. --Accurimbono (disc) 09:31, 11 mag 2016 (CEST)
@Accurimbono: Quasi tutte le scansioni sono più o meno elaborate rispetto alla "scansione iniziale". Lo stesso FineReader, in fase di trasformazione delle scansioni originali e di allestimento dei file derivati con strato OCR, si "prende delle piccole libertà di default" indispensabili alla corretta interpretazione del testo (divisione delle facciate; raddrizzamento) e alcune elaborazioni non automatiche sono indispensabili per la produzione dell'OCR mappato (correzione di artefatti da curvatura), oltre alle libertà maggiori di default per la compressione delle immagini. Che per produrre un file immagine con testo mappato occorra qualche post-elaborazione dell'immagine scansionata originale non è in discussione; stiamo discutendo su quanto può essere post-elaborata, in termini quantitativi, non qualitativi. Se non lo teniamo presente la discussione da pratica diventa teorica, di principio, e non ne usciamo vivi :-) Alex brollo (disc.) 11:23, 11 mag 2016 (CEST)
Ho il sospetto che la carta "bianca" come quella che si usa attualmente sia un prodotto della chimica moderna e che il "bianco" del '700 fosse molto meno "bianco" di ora. --Carlo M. (disc.) 12:10, 11 mag 2016 (CEST)
Mi sembra che i pareri siano comunque allineati: purchè l'OCR sia buono, ok a qualche decina di mByte in più tanto su Common c'è posto e la banda che si usa per il proofreading è la stessa. Ho sottomano anche quello che serve per la struttura djvu "photo", tipo Xavier, cercherò di battere anche questa strada. Prima di abbandonare tutto cercherò di documentare un po' del magico mondo in cui mi sono addentrato. Magari la discussione la continuiamo in qualche pagina dedicata. Alex brollo (disc.) 13:14, 11 mag 2016 (CEST)
@Xavier121, Accurimbono, Aubrey: Ho furiosamente approfondito la questione, e sono riuscito a ricavare, dai file IA, un djvu eccellente (qualità foto) di Paolina, che ho caricato in locale qui: File:Digitami LO10534041.djvu. La cosa interessante è che lo strato testo è quello di IA, e tutto il processo di derivazione NON necessita di FineReader, ma solo di programmi "liberi" (DjvuLibre e applicazioni grafiche tipo ImageMagick o simili). Una conclusione importante: NON bisogna usare il file IA PDF perchè le immagini sono compresse in modo eccessivo e già rovinate irremediabilmente; bisogna partire dalle immagini raccolte nello zip _jp2.zip, NON dalle immagini originali _images.zip perchè NON combaciano con l'OCR. Altra nota tecnica: il visualizzatore IA NON usa nè il djvu (ora inesistente) NE' il pdf; le immagini sono quelle del file _jp2.zip; quindi il djvu che si produce da quelle immagini ha - almeno potenzialmente - la stessa definizione grafica (eccellente) di quella del visualizzatore.
L'intero processo di trasformazione _jp2.zip + _djvu.xml -> file djvu con strato OCR può essere totalmente automatizzato; l'unico dato che serve è l'id di IA e i programmi che servono esistono sia in ambiente Windows che in ambiente Linux/Unix. Alex brollo (disc.) 08:54, 12 mag 2016 (CEST)

Riassumento e visualizzando...[modifica]

Qui sotto lo stesso particolare della pagina 4 di Paolina, in tre immagini ottenute dal pdf di IA, dal mio djvu e da quello di Xavier121: Tarchetti pdf.png Tarchetti alex djvu.png Tarchetti xavier121 djvu.png

Come vedete, meglio lasciar perdere il pdf di IA, fa leggermente ribrezzo, mentre i due diversissimi metodi che io e Xavier121 abbiamo usato danno risultati pressochè identici e ad "alta fedeltà". Alex brollo (disc.) 16:42, 12 mag 2016 (CEST)

[] Accetto il discorso della qualità, ma credo che la direzione della soluzione sia sbagliata. Nel senso non tecniclo, ma politico-sociale: secondo me non possiamo pensare che la soluzione sia dare altro lavoro a Xavier o Alex. Se fosse così, peggioreremmo ulteriormente la situazione di un progetto già "difficile". La soluzione deve essere condivisa e discussa con tutti gli altri: con i francesi, con Tpt che gestisce il tool IA Upload, con tutti quanti. Altrimenti abbiamo perso in partenza, IMO. Proverò a scrivere in lista. Aubrey (disc.) 19:28, 12 mag 2016 (CEST)

Non so se è questo il thread e il posto dove proseguire questa discussione, però vorrei aggiungere qualcosa a quanto detto da Aubrey. La mia biblioteca sta contribuendo a Wikisource ormai da un paio d'anni; fra qualche giorno/settimana inseriremo una decina di opere, fra cui qualche inedito che conserviamo nel nostro archivio storico, di Cesare Battisti; proseguiremo poi con altri fondi nei prossimi mesi e anni. Come la mia, anche altre biblioteche stanno facendo questa scelta e costruiscono progetti GLAM che coinvolgono Wikisource. Quando parlo con i bibliotecari, anche pubblicamente come ho fatto al Convegno delle Stelline a Milano a Marzo, presentando il nostro progetto, non dimentico di ricordare su quanto accogliente, gentile, disponibile sia la comunità di Wikisource e quanta forza dia al progetto. Quindi bene, e grazie davvero per tutto il supporto. Le istituzioni si fidano, proprio per questo è necessario secondo me che Wikisource sia un progetto più solido e "standardizzato" dal punto di vista delle procedure. Questo problema con i djvu, per esempio, se grazie a voi si può risolvere immediatamente, e di fatto non è un problema, lo diventa nel momento in cui io devo spiegare alla mia istituzione che per un'azione fondamentale del progetto che siamo realizzando dipendo dalla disponibilità (che c'è sempre) di qualcuno. E' difficile da spiegare per chi non conosce bene - e forse non è tenuto a conoscere bene, come i dirigenti e i finanziatori dei progetti - Wikisource e le dinamiche partecipative dei progetti wiki. Per questo il discorso "politico-sociale" che fa Aubrey mi trova d'accordo.--EusebiaP (disc.) 20:24, 12 mag 2016 (CEST)
Cioè, quale processo avete usato? In particolare, siete partiti dai TIFF o dai JP2? Nemo 20:08, 12 mag 2016 (CEST)
@Nemo_bis, Xavier121: L'immagine a sinistra è una "istantanea" del pdf IA originale visto con Adobe. Quella centrale è un ritaglio di un djvu ottenuto con c44 (ossia: modalità foto) dalle jp2 di IA dopo conversion jpg. Quella a destra è ottenuto con FineReader, a cui è stato dato in pasto qualcosa che ti dirà Xavier. Alex brollo (disc.) 11:29, 13 mag 2016 (CEST)
@Nemo_bis, Alex brollo: La mia immagine è stata ottenuta scaricando la cartella zip con i jpg e lavorata direttamente senza pre-elaborazione da FR. L'OCR prodotto non è quello di IA, ed è stato inserito in un djvu con compressione minima, ecc. --Xavier121 17:48, 14 mag 2016 (CEST)
@Aubrey, EusebiaP: ho parlato in modo un po' sincopato.... ma nonostante il risultato sia così simile, le due strategie xavier-alex sono opposte, io miro a un tool totalmente automatico, un click e finito. Probabilmente quando ci riuscirò "quelli bravi" avranno fatto una cosa molto migliore, ma a me serve a verificare che può essere fatto (e a allenarmi a risolvere problemi). Quindi, sarò soddisfatto solo quando la procedura potrà essere avviata da chiunque, in modo altrettanto semplice dell'IA uploader di Tpt (o ancora più semplice), e io non saprò nemmeno quando corre e quando non corre. (rifirmo per ripingare) Alex brollo (disc.) 10:48, 13 mag 2016 (CEST)

Inversione di pagine[modifica]

Ciao a tutti, mi trovo 2 pagine ancora da creare invertite cioè:

  1. [la pagina djvu 282] deve essere pag. 271 del testo;
  2. [la pagina djvu 283] deve essere pag. 272 del testo.

Gentilmente che è la pia persona che può invertirle? Grazie e buona giornata. --Stefano mariucci (disc.) 06:29, 11 mag 2016 (CEST)

@Stefano mariucci: Stasera te lo faccio, se nessuno interviene prima. --Alex brollo (disc.) 10:28, 11 mag 2016 (CEST)
@Stefano mariucci: Non ho dimenticato ma non ho avuto ancora tempo.... :-( --Alex brollo (disc.) 10:33, 12 mag 2016 (CEST)
Io già ti devo ringraziare per i servigi che mi dai, figurati se ti dò fretta. L'intervento non è bloccante quindi hai tutto il tempo anche perchè mi sembra leggendo quà e là che stai seguendo alcune cosucce. ;)--Stefano mariucci (disc.) 20:40, 12 mag 2016 (CEST)
@Stefano mariucci: Djvu in caricamento..... diti incrociati.... connessione lumachesca.... ✔ Fatto. --Alex brollo (disc.) 23:12, 12 mag 2016 (CEST)
ENNESIMO GRAZIE ALEX --Stefano mariucci (disc.) 13:45, 13 mag 2016 (CEST)

Manoscritto "La città del sole" di Tommaso Campanella[modifica]

La Biblioteca comunale di Trento possiede un manoscritto del 1602 con il testo dell'opera di Tommaso Campanella "La città del sole". Il manoscritto è particolarmente prezioso, per il fatto di essere coevo alla prima edizione dell'opera. Se ne parla in questo articolo [16]. Vorremmo contribuire a una serie di iniziative sull'Utopia, che si tengono in Trentino per tutto il 2016, con la digitalizzazione e il caricamento su Wikisource di questo manoscritto. Ho caricato su Commons una pagina perché si possa qui capire meglio di cosa si tratta [17] La volontaria di servizio civile che lavora in biblioteca, @Susan bibtn:, insieme naturalmente a chi della comunità ha voglia di farlo, potrebbe occuparsi della trascrizione, anche con l'aiuto di altre edizioni trascritte. Non ho ben chiare però alcune cose: intanto, se è utile/interessante per Wikisource avere questa edizione dell'opera in formato manoscritto (ne esistono altre tre versioni ottocentesche); poi non mi pare di avere visto altri manoscritti in Wikisource e dunque non so se sia il posto giusto in cui metterlo; infine, non ho idea di quali problemi tecnici possiamo incontrare. Sarei felice di un vostro parere. Grazie --EusebiaP (disc.) 13:45, 11 mag 2016 (CEST)

Qualche manoscritto c'è anche su wikisource. La qualità grafica dell'immagine è magnifica; previa verifica che la conversione in pdf multipagina (con gli opportuni parametri di risoluzione/compressione) non la rovini per nulla, io il manoscritto lo caricherei su Commons. Può essere utile, anche solo per utilizzare qualche immagine sia su wikipedia, che su altri progetti (wikiquote, wikiversity....) e chissà, forse anche su wikisource, il confronto fra manoscritto e stampa coeva sarebbe molto interessante, e si potrebbe tecnicamente eseguire uno "split dopo match manuale". --Alex brollo (disc.) 10:38, 11 mag 2016 (CEST)
Data la particolarità dell'opera, sono d'accordo anche io con Alex che si possa caricare direttamente su Commons, per non perdere le sfumature di una bella immagine (nulla vieta anche di caricarla su Archive, ci mancherebbe: solo, l'immagine che noi vogliamo usare deve essere la più bella possibile). Non credo ci siano conflitti per il caricamento di un manoscritto su Wikisource: l'unica difficoltà sarà rileggerlo :-D Aubrey (disc.) 17:13, 11 mag 2016 (CEST)
Questa è una grande notizia, non possiamo che essere felici dell'inziativa e della preferenza verso il nostro progetto. I manoscritti sono oggetti affascinanti, qui un altro esempio favoloso in corso di trascrizione (nello specifico, il testo pone alcuni problemi di varianti, puntualmente segnalate e trascritte diplomaticamente, ma rappresentate in Ns0 in modo chiaro e facilmente fruibile, esempio qui). Per cose di questo tipo, lo dico chiaramente, non accetto alcun tipo di compressione o formato di covenienza: per me vale sempre la migliore immagine possibile da caricare su Commons (disponibile immediatamente a offrire il mio tempo per la lavorazione offline e il caricamento e la trascrizione). P.S. Se (vi fidate di noi e non di IA) non volete occuparvi della ricomposizione del testo in pdf o altro formato, potete condividere una cartella zip con dentro i tiff o i jpg delle singole pagine alta risoluzione, al resto, anche caricamento su commons, pensiamo noi. --Xavier121 17:42, 11 mag 2016 (CEST)
Grazie a tutti. Il manoscritto è ancora da fotografare, possiamo fare dei tiff o jpg ad alta risoluzione e caricarli su Commons; per tutto ciò che riguarda Wikisource invece avremo certamente bisogno del vostro aiuto un po' perché non siamo così esperte, ma anche perché è un testo particolare per cui le nostre conoscenze "di base" di Wikisource non sono sufficienti. Grazie per la vostra disponibilità, quando avremo le immagini torno qui ad avvisarvi--EusebiaP (disc.) 19:44, 12 mag 2016 (CEST)
@EusebiaP: Se possiamo permetterci, vi consigliamo di non caricare direttamente le singole pagine su Commons; se proprio dovete fatelo su IA in una cartella zip: esiste una procedura specifica. Altrimenti, preparate la cartella con i file tiff o jpg alta risoluzione e, prima di fare altro, contattateci :) --Xavier121 20:02, 12 mag 2016 (CEST)
Se ho capito bene, quello che interessa è che su Commons il manoscritto risulti nella sua integrità e non separato in singole pagine? Grazie accettiamo di buon grado il vostro aiuto; appena ho le foto torno a contattarvi e vi lascio fare :)--EusebiaP (disc.) 20:27, 12 mag 2016 (CEST)
@EusebiaP: Esatto, su Commons lo standard per le immagini dei testi a pagine multiple è il file "multipagina", djvu o pdf. Alex brollo (disc.) 08:39, 13 mag 2016 (CEST)

Il Corpus ladino[modifica]

Grazie all'impegno di Cristian Cenci, (coordinatore per il Trentino-Alto Adige di Wikimedia.it) e l'aiuto di Eusebia l'Istituto Ladino di Vigo di Fassa ha espresso la disponibilità a rendere per noi utilizzabile il Corpus ladino che raccoglie in particolare i testi delle province di Trento e Belluno (Fassa, Fodom, Ampezzano) L'Istituto di Vigo è anche editore della rivista Mondo Ladino di cui diverse annate sono digitalizzate e bisogna per prima cosa sapere se esiste analoga volontà di concederci anche tali testi. E' sicuramente prioritario trovare il modo di ufficializzare la disponibilità dell'Istituto e creare criteri certi su quali siano i testi che possiamo caricare su wikisource. Ad esempio: le saghe ladine tradizionali sono risalenti ai secoli passati e sono state raccolte da Hugo De Rossi, che è morto nel 1940 (Il Wolf ne ha fatta una trasposizione romanzata, molto fortunata editorialmente che è coperta da diritto d'autore). Il testo del De Rossi è stato poi pubblicato su Mondo Ladino con una edizione critica particolarmente accurata a cura di Ulriche Kindle. Per fare una versione proofread non basta disporre del testo che è sicuramente P.D., ma anche del consenso dell'editore dell'edizione cartacea.

Sulla scia, si potrà arrivare anche alla definizione dei rapporti con l'Istituto Ladino di Borca di Cadore e con la Sezione ladina dell'Università di Bressanone.

Quelli fin qui esposti sono compiti soprattutto di Wikimedia.it, ma ci sono tanti aspetti che sono propri della comunità di Wikisource: aprire un progetto che sia coordinato con quello romancio, definire gli argomenti , decidere se mantenere il fassano in una sola categoria o suddividerlo in tre idiomi. L'importante è iniziare ed iniziare bene.

Il mettere a disposizione in un sito facile da consultare come è Wikisource un Corpus completo del ladino letterario, soprattutto se inserito in un progetto complessivo delle lingue retoromanze, può contribuire a far conoscere una letteratura che in passato è stata particolarmente ricca e, indirettamente aiutare a salvare una lingua che ha un numero molto ristretto di locutori, per di più suddivisi in almeno 5 idiomi differenti--Mizar (ζ Ursae Maioris) (disc.) 05:32, 12 mag 2016 (CEST)

Indice e pagine[modifica]

Ciao a tutti, sono relativamente nuovo su questi lidi ed oggi ho caricato il mio primo file djvu e creato il mio primo indice.

La necessità è nata perché sto aiutando a trascrivere la Geografia di Strabone. Ora che ho fatto l'indice, mi rendo conto che le pagine non puntano al testo che avevo trascritto. Cosa dovrei fare per recuperare sia testo che scansione? Devo spostare quanto puntato in Geografia al nome corretto puntato da Indice:Della_geografia_di_Strabone_libri_XVII.djvu? --Ruthven (disc.) 16:12, 13 mag 2016 (CEST)

Intanto grazie e complimenti per il coraggio. Lavorare sulle pagine Indice è molto difficile, lavorare su un'opera così complessa, poi....
Una prima anomalia, nella sezione Sommario della pagina Indice, è che il link a ns0 deve contenere, sotto nome=, il nome esatto della pagina ns0, e se vuoi collegare Geografia devi usare il nome pagina (non è un bel nome, lo modificheremo, ma intanto quello è) e non il suo titolo, che è semplicemente quello che "appare". Corretto questo equivoco, molti link, nella pagina Indice, sezione Sommario, sono diventati belli blu. :-)
Restano dei link rossi, in ns0 curiosamente sembra che ci sia il Libro VII ma non i libri IV, V, VI; c'è sicuramente qualcosa da sistemare, in Geografia i link dovrebbero essere tutti blu ma proprio il link al libro VII è rosso.
In ogni caso: tutte cose sistemabili senza grossa fatica. --Alex brollo (disc.) 16:49, 13 mag 2016 (CEST)
Ho aperto alcune pagine rosse dallIndice e mi sono reso conto che il problema è ben più serio: il testo OCR NON corrisponde affatto all'immagine. Il problema sta nel djvu (ed è un problema del tutto inconsueto che mi lascia molto perplesso). Stasera lo affronto, ma invito i più esperti a dare un'occhiata anche loro. CHE SUCCEDE? --Alex brollo (disc.) 17:02, 13 mag 2016 (CEST)
Sempre più strano. Cliccando il tasto OCR, le cose si sistemano e viene caricato il testo giusto (almeno a me). CHE CAVOLO STA SUCCEDENDO? Qualcuno ai piani alti ha messo le mani sul software? Alex brollo (disc.) 17:10, 13 mag 2016 (CEST)
(conflittato) Quello da te caricato è solo il volume 2° di 5, giusto? Se è così, per prima cosa conviene spostare l'indice specificando il "2" nel nome del djvu (es. Indice:Della_geografia_di_Strabone_libri_XVII_Volume_2.djvu). Gli altri volumi li possiamo caricare anche in un secondo momento, ma conviene comunque compilare il campo Volumi con i link a tutti i 5 djvu. Can da Lua (disc.) 17:16, 13 mag 2016 (CEST)
Giusto, è il volume 2 (non sono riuscito a trovare gli altri in djvu) e questo spiega perché il libro VII sia presente in rosso (la pagina in ns0 è stata creata da un altro utente e quindi non saprei spiegare questo "salto"). @Candalua: Suggerisci di spostare il file su Commons per dargli una numerazione, ho capito correttamente? --Ruthven (disc.) 18:59, 13 mag 2016 (CEST)
(fuori crono) ✔ Fatto. --Ruthven (disc.) 11:25, 14 mag 2016 (CEST)
@Candalua: cerca di creare una pagina, per favore, e dimmi se vedi anche tui quello che vedo io.... l'OCR sembra disallineato alle immagini, eppure scaricando il djvu DjView lo vede nmormalissimo. Riprovo....Alex brollo (disc.) 23:00, 13 mag 2016 (CEST)
@Alex brollo: Si, si, lo stesso per me: il testo non corrisponde all'immagine, ma poi premendo OCR si corregge. In ogni modo, suppongo che bisognerà copiare il testo già scritto a mano da Geografia al posto dell'OCR… --Ruthven (disc.) 23:39, 13 mag 2016 (CEST)
@Ruthven: A mano....? Questo MAI! :-)
Lasciaci pensare un po' a questo serio problema.... Nel frattempo vedi se c'è qualche altro testo su cui puoi lavorare con soddisfazione. Questo testo ha un problema non da poco, bisogna capire assolutamente cosa sta succedendo e perchè. Alex brollo (disc.) 00:01, 14 mag 2016 (CEST)
Un indizio: quando ci siamo accorti del problema? Il 13 maggio. Poco più sopra ci avvisano, in una "News tech", che dal 12 maggio è attiva una nuova versione del software mediawiki. Vuoi vedere che.... i piani alti ne hanno combinata di nuovo una delle loro? Alex brollo (disc.) 00:06, 14 mag 2016 (CEST)
@Ruthven: Una buona notizia: il Match & Split funziona bene, e quindi almeno per quest'opera un sacco di pagine non hanno bisogno dell'OCR. L'ho lanciato sui primi 4 capitoli e il testo è molto buono. Per che fosse nuovo del "mestiere" questa la pagina di aiuto: Aiuto:Match and Split. Alex brollo (disc.) 15:23, 14 mag 2016 (CEST)
Meno male che l'hai fatto te, perché mi sembra una procedura un po' astrusa. Però ci tenevo a segnalarti che ci sono delle incongruenze: vedi ad esempio p. 111. --Ruthven (disc.) 17:20, 14 mag 2016 (CEST)
@Ruthven, OrbiliusMagister: I piani alti sono innocenti (stavolta), il problema sta nello stato testo del djvu. Lo risocstruisco con FineReader, e ricarico il djvu; se ho visto bene, si risolveranno sia il problema dell'OCR disallineato che il problema del M&S che erra. Alex brollo (disc.) 10:47, 15 mag 2016 (CEST)

Testo da inserire (problema djvu)[modifica]

Abbiamo digitalizzato e caricato su IA [18] il primo dei testi di Cesare Battisti che la Biblioteca comunale di Trento ha in programma di inserire in Wikisource nelle prossime settimane. Non ho idea di come si possa fare a trasferirlo in Wikisource senza il formato djvu. Mi aiutate? Grazie! --EusebiaP (disc.) 21:05, 13 mag 2016 (CEST)

Il caricamento su IA richiede regole molto precise.... è facile sbagliare. E quel caricamento è sbagliato :-)
Le regole sono:
1. scegliere un buon ID. Un buon ID è mnemonico pezzettino di titolo e del nome autore (pochi caratteri per ciascuno); una sigla dell'istituzione/gruppo che lo carica; un numero progressivo se serve. Verificare che su ID l'id sia "libero" (basta cercarlo, se non si trova va bene). Ipotizziamo che per quel caricamento l'id sia DiscorsoBatBibt (Discorso Battisti Biblioteca di Trento). Proviamo se c'è: https://archive.org/details/DiscorsoBatBibt .... no, non c'è. Bene. Pensate bene alla struttura dei vostri ID, e in particolare alla sigla istituzione. Vale la pena di perderci un po' di tempo, è tutto tempo risparmiato poi.
2. rinominare tutte le immagini usando l'ID come prefisso seguito da un numero progressivo "riempito con zeri", tipo: DiscorsoBatBibt-000.jpg, DiscorsoBatBibt-001.jpg, DiscorsoBatBibt_003.jpg.... Usare il prefisso ID è una raffinatezza; la cosa importante è che a un prefisso sempre uguale segua un numero progressivo riempito con zeri. Serve a IA per determinare la sequenza pagine.
3. zippare le immagini in un file zip il cui nome sia rigorosamente composto da l'ID prescelto + _images.zip. Nel nostro caso, il file zip DEVE chiamarsi DiscorsoBatBibt_images.zip
4. A questo punto si lancia l'upload e si dà l'ID come "nome file"
Alternativa: si monta le immagini dentro un PDF, si dà al pdf il nome corrispondente all'ID, e si fa l'upload del pdf; in questo caso tutto è automatico :-)
Se si sbaglia ID (come nel vostro caricamento) si scovano i forum di assistenza, e si chiede che cortesemente l'item sia cancellato. Non c'è modo di correggere un ID sbagliato.
Comunque.... ho scaricato lo zip e lo userò per derivare io un djvu con testo mappato... che diamine, il mio nullafacente FineReader deve pur lavorare :-) --Alex brollo (disc.) 22:43, 13 mag 2016 (CEST)
Che disastro! @Susan bibtn: sarà il caso di metterci a ri-studiare tutto dalle elementari :) Grazie Alex per la tua infinita pazienza --EusebiaP (disc.) 22:53, 13 mag 2016 (CEST)
Ma no.... è assolutamente normale sbagliare, le prime volte, nei caricamenti su IA. Non ti racconto cos'ho combinato io.... ;-) quello che ti ho raccontato (e spero di non esermi sbagliato) è solo il risultato di tentativi ed orrori personali. "Chi non sbaglia, ha già sbagliato", dice così il proverbio, no? Il djvu è pronto e te lo mando via email. Spedizione in corso. Alex brollo (disc.) 23:36, 13 mag 2016 (CEST)
Prendo spunto dalla discussione appena sopra per chiedere se ci potessero essere altri di questi casi, ossia c'è qualche altro utente che non sa più cosa fare non trovando più i file .djvu? In questo momento di definizione della strada da percorrere, è troppo creare un tool veloce veloce (tipo Segnalazione da utente esterno) per offrire, a quel potenziale utente, il servizio di raccogliere il file (segnalatoci tramite il link esatto ad esso riferito) (.pdf, .zip., ecc.), elaborarlo noi a casa con, ad esempio, FineRreader, creando anche il relativo OCR e uploadarlo su Commons segnalandogli, in fine, che il file pronto all'uso lo trova là oppure lo trova sulla casella postale qual'ora lui la fornisca? Forse ne non vale la candela? Forse no per... --Stefano mariucci (disc.) 12:49, 14 mag 2016 (CEST)
Non possiamo "istituzionalizzare" un'idea del genere (per quanto possiamo benissimo attuarla informalmente) perchè si rischia di creare un "collo di bottiglia" sovraccaricando alcuni utenti. Dobbiamo fare ogni sforzo per automatizzare tutto quello che può essere automatizzato, riservando le richieste di aiuto "pesante" a casi particolari. Alex brollo (disc.) 18:37, 14 mag 2016 (CEST)
Grazie per i consigli Alex, che pasticcio! :) Urge uno studio matto e disperatissimo, altroché! Riusciremo mai ad essere autonome nella conversione in .djvu? Non è una domanda retorica eh :) --Susan bibtn (disc.) 09:41, 16 mag 2016 (CEST)
La soluzione ci sarebbe. Si chiama FineReader11 (o 12, ma questa versione non la conosco affatto). Ma purtroppo è commerciale e quindi costa (non esageratamente; vedi http://italia.abbyy.com/finereader/professional/specifiche-tecniche/ da dove si desume che anche FineReader12 produce djvu in output). Gli si danno in pasto direttamente le immagini originali e lui produce quello che si vuole (dal PDF al DJVU ad altro). Alex brollo (disc.) 10:53, 16 mag 2016 (CEST)
Alex sono pienamente d'accordo con te: istituzionare un servizio simile sarebbe da folli se fosse l'unico esistente per poter implementare la nostra biblioteca. Ma anche se prima o poi una definizione a questo empasse, in cui ci troviamo, si troverà e che quindi tutto ritornerà come prima io, comunque, un pensierino alla fornitura anche di questo servizio non credo ci stia male. Sia dal punto di vista quantitativo (non so quanti utenti chiederanno di caricare per loro un testo), sia qualitativo (dobbiamo ammettere e mettere a preventivo che l'utente non sia capace di farlo o non ne abbia i mezzi ma che potrebbe portare il suo apporto di volontariato e di contribuzione alla causa se trovasse quanto di suo gradimento o quanto richiesto) e referendario in quanto chi se non WS ha l'accoglienza che ha rispetto agli altri?. I termini di questo servizio possono essere i più disperati: 1 mese, forse, fin tanto che, ecc. _ Spero che la discussione prosegua in tal senso. --Stefano mariucci (disc.) 16:50, 16 mag 2016 (CEST)
Al momento, penso che per un utente in difficoltà la via maestra sia chiedere qui in Bar. Questa è l'unica pagina che guardiamo in molti - alcuni di noi non si fanno sfuggire una virgola. Il messaggio potrebbe essere quindi semplice, e ripetuto in tutte la pagine dove un utente in cerca di aiuto potrebbe perdersi: in caso di difficoltà (qualunque) chiedete pure nel nostro Bar. Penso che il fatto che questa sia "la via maestra" possa essere confermato da qualsiasi utente che ha avuto qualsiasi difficoltà. Al contrario, richieste disperse in varie pagine speciali possono essere "perse" e la mancata risposta può essere interpretata male. Alex brollo (disc.) 17:37, 16 mag 2016 (CEST)

@Alex brollo: Ciao Alex, ho sistemato un po' il libello di Battisti, ma non riesco a capire come si faccia il rientro della prima frase dopo il titolo del paragrafo, ho provato vari simboli ma non trovo quello giusto. Questo è tutto sommato l'unico problema riscontrato, ne approfitto per ringraziarti per il bel frontespizio! --Susan bibtn (disc.) 14:43, 19 mag 2016 (CEST)

La soluzione ti stupirà. Basta NON lasciare, dopo il Centrato, un numero di righe vuote dispari. Bisogna che sia pari: 0, 2, 4.... Zero righe, indenta; una riga, non indenta. Ma ti suggerisco di fare un piccolo sforzo, e di usare sempre, per i titoli, il template Ct invece che il Centrato. Imparando il significato di tre-quattro parametri, potrai gestire completamente il font, la spaziatura fra lettere, ma sopratutto l'ampiezza delo spazio fra la riga e la successiva (parametro v=, seguito da un numero senza unità di misura che è il numero di pc). Così dsarai libera di spaziare le righe come meglio si sembra, SENZA lasciare una riga bianca e quindi SENZA cadere nel trabocchetto indenta-non indenta. Osserva bene il frontespizio di Battisti: vedrai che la spaziatura verticale fra righe segue il valore del parametro v=.

Forse trovato un inghippo sui pdf IA[modifica]

La prima pagina del pdf File:Tarchetti - Paolina.pdf è larga poco più di 300px. Adesso ne infilo davanti una più grande e vediamo cosa succede. --Alex brollo (disc.) 19:31, 14 mag 2016 (CEST)

Test rimandato, mi sono "perso" nell'editing dei file pdf :-( --Alex brollo (disc.) 08:17, 16 mag 2016 (CEST)

Scegliere nella collezione IA dalle Biblioteche di Milano[modifica]

@Nemo_bis, OrbiliusMagister, Accurimbono: Vi chiedo una mano per selezionare i più interessanti fra i testi di questa collezione di IA: https://archive.org/details/sbmilano (dieci-venti testi max)

In realtà mi interessano testi per vertificare se veramente tutto funziona nello script "creatore di djvu da IA", e migliorarlo; il primo testo che lo script ha prodotto da quella collezione è Indice:Torriani - Prima morire.djvu; ma ho bisogno di fare parecchie altre prove. Vi chiedo anche di verificare/correggere sia su Commons che qui eventuali template di segnalazione che l'opera proviene da quell'interessante progetto delle Biblioteche milanesi, con la collaborazione di Nemo. Purtroppo non avrò la testa per occuparmi altro, che di far camminare la mia "creatura". --Alex brollo (disc.) 16:25, 15 mag 2016 (CEST)

Avevo raccolto i link alle opere in milanese Wikisource:Collaborazioni/SBM nella speranza di catturare qualche altro contributore lombardo. Vedi tu se l'elenco ti può essere utile.-Mizar (ζ Ursae Maioris) (disc.) 19:40, 15 mag 2016 (CEST)
@Mizardellorsa: Grazie Mizar, per alcuni test quell'elenco va benissimo. --Alex brollo (disc.) 08:16, 16 mag 2016 (CEST)
Comincio qui:
Ce ne sarebero altri ma mi fermo. εΔω 09:07, 16 mag 2016 (CEST)
@OrbiliusMagister: Garzie anche a te.....di esserti fermato :-) Alex brollo (disc.) 09:31, 16 mag 2016 (CEST)
Non aggiungo altri testi, ma noto che ci sono diverse scansioni di opere ferroviarie... potrebbero interessare al nostro ferroviere di fiducia? @Silvio Gallio: --Accurimbono (disc) 10:15, 16 mag 2016 (CEST)
Farò qualche caricamento test (locale) dei file pdf, non mi rassegno all'idea che siano inutilizzabili. Alex brollo (disc.) 10:36, 16 mag 2016 (CEST)
Lo so che siete stufi di sentire annunci di mirabilie che poi finiscono in dimenticatoio o scoppiano come bolle di sapone, ma sta girando nel mio pc il seguente file elenco.bat:
python djvuCl.py digitami_LO10456286
python djvuCl.py digitami_CUB0126467
python djvuCl.py digitami_TO00634569
python djvuCl.py digitami_LO10403662
python djvuCl.py digitami_LO11286413
python djvuCl.py digitami_LO11091960
python djvuCl.py digitami_LO10418018
python djvuCl.py digitami_LO10774801
python djvuCl.py digitami_LO1E003647
python djvuCl.py digitami_PUV0557339
python djvuCl.py digitami_LO1E016035
python djvuCl.py digitami_LO11012553
python djvuCl.py digitami_LO11081799
e adesso vado a dormire; domani mattina (spero) troverò tutti i djvu dell'elenco di @OrbiliusMagister: e pure quelli di @Mizardellorsa:. Alex brollo (disc.) 23:38, 16 mag 2016 (CEST)
Ce li ho. Alex brollo (disc.) 06:25, 17 mag 2016 (CEST)

<- Grazie per il ping Accurimbono e scusa il ritardo. Mi era sfuggito in mezzo ad altre notifiche. Venendo al topic, al di là della mia situazione "personale" e dei relativi impegni, le opere "ferroviarie" che vedo sono relative alla ferrovia del Sempione che occupa una parte importante nella storia delle strade ferrate italiane ma è, almeno per ora, molto al di fuori del periodo che sto studiando più a fondo e che si ferma dalle parti del 1870-75. Forse la "collezione" potrebbe essere interessante per richiamare qualche "ferroviere" da 'Pedia. Di là sono sempre a piangere sulle fonti. Beh, potrebbero anche venire a "costruirsele"... :D Saluti a tutti Silvio Gallio (disc.) 08:17, 17 mag 2016 (CEST)

in merito ti ho battuto sul tempo. Ma mi sa che dovete lasciare anche un messaggio al progetto:trasporti.--Alexmar983 (disc.) 08:34, 17 mag 2016 (CEST)

Tech News: 2016-20[modifica]

18:01, 16 mag 2016 (CEST)

Questo temo ci possa dare qualche problema: Utilizzare tag autoconcludenti come <div/> e <span/> per indicare <div></div> e <span></span> non funzionerà in futuro. Di recente ho trovato anche un tag pages che non funzionava più (ma senza dubbio funzionava quando è stato scritto), perché gli mancava la chiusura, cioè terminava con to=6> invece che to=6/>. Per cui raccomando di fare sempre più attenzione ai tag che usate e a come li scrivete. Purtroppo MediaWiki sta diventando sempre più stringente su queste cose dopo anni di lassismo; e i piani alti non sembrano intenzionati ad aiutare i singoli progetti ad apportare le necessarie correzioni. Can da Lua (disc.) 11:24, 17 mag 2016 (CEST)
Usare tag html normalmente "doppi" con la sintassi "autoconcludenti" è cosa da geek. Immagino che il problema non esista per i tag normalmente "singoli", come e <br/> e <hr/>, spero che vengano accettati anche senza il carattere / di chiusura.
Proviamo: uno
due
tre sì, sembra siano accettati. Alex brollo (disc.) 14:42, 17 mag 2016 (CEST)

Primo Indice sperimentale creato in "automatismo"[modifica]

@Mizardellorsa: Con malcelata soddisfazione vi segnalo Indice:Anonimo - Raccolta di proverbi milanesi.djvu, il cui djvu è stato creato da IA con lo script djvuCl.py nuova versione (in automatismo integrale), e che è anche il primo djvu scaricato dal repository dropbox (vedi bar tecnico).

Fra l'altro, ho scoperto che il tool IA Upload di Tpt può essere usato come "acchiappatore di metadati", basta impostare l'ID IA e poi copiarsi (e modificare dove serve) il template Book che propone. Dopodichè, si scarica il djvu da dropbox, si entra in Commons e si carica correggendo il nome file e i pochi dati da correggere del template - una cosa rapida e veloce.

Pingo Mizar perchè il testo è uno di quelli segnalati da lui, in milanese. Alex brollo (disc.) 11:40, 17 mag 2016 (CEST)

A new "Welcome" message[modifica]

Hello everyone. Apologies for using English on this page. Aiutaci a tradurre nella tua lingua. Grazie!

This is a heads-up about a change which was announced in Tech News: Add the "welcome" dialog (with button to switch) to the wikitext editor.

In a nutshell, this will soon provide a one-time "Welcome" message in the wikitext editor which explains that anyone can edit, and every improvement helps. The user can then start editing in the wikitext editor right away, or switch to the visual editor. This is the equivalent of an already existing welcome message for visual editor users, which suggests the option to switch to the wikitext editor. If you have already seen this dialog in the visual editor, you will not see the new one in the wikitext editor. It won't say "Wikipedia" here ;)

  • The current site-wide configuration of the visual editor stays the same.
    • Nothing changes permanently for users who chose to hide the visual editor in their Preferences, or for wikis where it's still a Beta Feature, or for wikis where certain groups of users don't get the visual editor tab, etc.
    • This wiki features a Single Edit Tab system; if you're not sure you know or remember how that works, you can read the guide (which details, among other things, how to switch between editors from the buttons on the toolbar); you can change your editing settings at any time, by the way.
    • There is a slight chance that you see a few more questions than usual about the visual editor. Please refer people to the documentation or to the feedback page, and feel free to ping me if you have questions too! I had also written a very quick intro to the visual editor, in case anyone is interested.
  • Finally, I want to acknowledge that, while not everyone will see that dialog, many of you will; if you're reading this you are likely not the intended recipients of that dialog, so you may be confused or annoyed by it—and if this is the case, I'm truly sorry about that. Please feel free to cross-post this message at other venues on this wiki, if you think it will avoid that other users feel caught by surprise by this change.

If you want to learn more, please see https://phabricator.wikimedia.org/T133800; if you have feedback or think you need to report a bug with the dialog, you can post in that task (or at mediawiki.org if you prefer).

Thanks for your attention and happy editing, --Elitre (WMF) 17:41, 17 mag 2016 (CEST) (il succo sta anche su it.wp, questo testo ha info più specifiche per voi. Ciao!)

Ho ricordato a Elitre che in nsPagina VE non funziona. Se il messaggio comparisse anche lì confonderebbe e innervosirebbe gli utenti novelli, IMHO. Speriamo bene. Alex brollo (disc.) 08:51, 18 mag 2016 (CEST)

Oh Nemo, homo di poche parole....[modifica]

@Nemo bis: Impressionante quando Nemo sia concreto e sintetico .... bene, esso ha scritto:

Quill-Nuvola.svg
«OCR corretto manualmente: si può scaricare pagina per pagina dal sito digitami.it oppure in blocco da https://archive.org/download/digitami_ocr/digitami_ocr.txt.zip/ . Non cominciare la trascrizione da zero se non c'è un buon motivo! (da: prime righe di Collaborazioni/SBM)»

Questo significa che l'OCR già corretto dei testi di Wikisource:Collaborazioni/SBM può essere caricato in svariati modi sulle pagine dei testi della collezione, e che se può essere fatto, deve essere fatto. Studierò un qualche trucco per rendere la cosa agevole; immagino che uno dei sistemi più efficenti ma non semplicissimi sia precaricarli da qualche parte 1 per farci un M&S; ma se volete farlo a mano, pagina per pagina, seguite il link di Nemo, e scaricate pagina per pagina (usando "apri in altra scheda", ovviamente, per non perdere il link e "il segno" sulla paginona) il testo di ciascuna pagina, che comodamente copiaincollerete a destinazione. Alex brollo (disc.) 06:48, 19 mag 2016 (CEST)

Ho creato {{SBM}}, per ora genera solo una Categoria:Collaborazioni SBM, potrà essere rifinito e associato a qualche output carino in seguito, per ora servirà per "marcare" i testi che provengono da quella bella iniziativa, se siete d'accordo. --Alex brollo (disc.) 08:17, 19 mag 2016 (CEST)
Aggiornamento. Ho creato Wikisource:Collaborazioni/SBM/testi e caricato i testi; tentando il M&S sono cascato su casi molto sfortunati (come Indice:Albini - Le nostre fanciulle.djvu); proverò su testi meno problematici prima di rinunciare e scovare qualche altro sistema di caricamento. Alex brollo (disc.) 09:17, 20 mag 2016 (CEST)
  1. Ad esempio, si può immaginare di caricarli su sottopagine temporanee di Wikisource:Collaborazioni/SBM da sottoporre a M&S globalre.

Speciale:PuntanoQui[modifica]

Speciale:PuntanoQui/Autore:Cappella_Colleoni

Forse c'è un malfunzionamento nel template:W?

Sembra che produca un collegamento alla pagina Autore: correlata, ma non è così... Molti altri autori sono "affetti" da questo problema. Vedi Speciale:PagineRichieste --Accurimbono (disc) 17:28, 19 mag 2016 (CEST)

Il collegamento viene creato dal template, precisamente da {{#ifexist:Autore:Figuriamoci|esiste|non esiste, ovvio che non esiste}}, il quale, fuori nowiki, produce "non esiste, ovvio che non esiste".
Controlla Speciale:PuntanoQui/Autore:Figuriamoci e vedrai che il bar è l'unica voce dell'elenco :-)
La soluzione che propongo: "potare" quell'ifexist rinunciando alla categoria generata (fra l'altro, ifexist è funzione "parser expensive" e meno spesso la si usa, meglio è). Alex brollo (disc.) 17:58, 19 mag 2016 (CEST)
@Accurimbono: Potato (sperimentalmente) il template:W, il problema è svanito e Speciale:PuntanoQui/Autore:Cappella_Colleoni si è svuotata. Lasciamo così? Ovviamente si è svuotata anche la categoria Categoria:Link a Wikipedia presenti in Autore, ma è un caso "non si può avere la botte piena e la moglie ubriaca". Con quella sintassi, o entrambi, o nessuno. (per inciso: del toolbox ancora nessuna traccia....) Alex brollo (disc.) 08:22, 20 mag 2016 (CEST)
Non mi sembra una soluzione vantaggiosa: la categoria "Link a Wikipedia presenti in Autore" è molto utile per il lavoro sporco. (era vuota anche prima solo perché la svuoto periodicamente io altrimenti ci sarebbero centinaia di pagine con link non aggiornati...)
Non c'è un modo (sintassi diversa) per inserire quella categoria senza avere il PuntanoQui? Non capisco... --Accurimbono (disc) 09:28, 20 mag 2016 (CEST)
https://www.mediawiki.org/wiki/Help:Extension:ParserFunctions#.23ifexist
L'inclusione in PuntanoQui sembra essere una feature desiderata... per cui credo a questo punto, se non ci sono altre proposte, che ce la teniamo :) --Accurimbono (disc) 09:38, 20 mag 2016 (CEST)
Io alla botte piena preferisco la moglie ubriaca ;) Per cui ho ripristinato. Se e quando sarà possibile accedere a Wikidata "by page name", si potrà convertire in Lua il template in modo che prenda l'item WD e controlli se esiste un link a Wikisource. Can da Lua (disc.) 12:55, 20 mag 2016 (CEST)
C'è sempre l'alternativa di accoppare del tutto il template|W, cosa che io farei volentieri ma che non trova l'appoggio della comunità ;-P --Alex brollo (disc.) 15:29, 20 mag 2016 (CEST)

Piani alti.... yuuuu huuuu...[modifica]

Chi si è mangiato il toolbox, che è sparito in edit (a me ma temo anche a voi)?

Voi lo vedete, in edit? Alex brollo bis (disc.) 18:03, 19 mag 2016 (CEST)

Vedo tutto normale. Can da Lua (disc.) 12:56, 20 mag 2016 (CEST)
Modificando (in Preferenze->Casella di modifica) il "Modalità di modifica" dal default "Ricorda l'ultimo editor" a "Usa sempre l'editor sorgente" la toolbar mi è ricomparsa immediatamente. --Alex brollo (disc.) 15:27, 20 mag 2016 (CEST)
Caso simile: io uso il font DPCustomMono2 in nsPagina (vedasi gadget apposito) che distingue molto bene i caratteri ambigui tra elle minuscola e i maiuscole, zero e O maiuscola ecc.; a un certo punto il font per la rilettura è tornato quello di default del browser senza alcun intervento da parte mia... sono tornato alla situazione di partenza andando in preferenze e reimpostando lo Stile del carattere nella casella di modifica a "carattere a larghezza fissa". Sì, si tratta di bizzarrie che intervengono quando aggiornano l'interfaccia. - εΔω 17:14, 20 mag 2016 (CEST)

Classe di rilettura[modifica]

Sto facendo un corso all'Università di Parma, stanno rileggendo il Verga :-) BTW, non capisco perchè qui si visualizza Anonimo... --Aubrey (disc.) 13:32, 20 mag 2016 (CEST)

@Aubrey: mancava l'area dati Can da Lua (disc.) 14:19, 20 mag 2016 (CEST)
Grandissimi! Complimenti a tutti, avete terminato l'opera :) --Accurimbono (disc) 14:38, 20 mag 2016 (CEST)
@Aubrey: Se avete altro tempo, potreste continuare con Indice:Verga - Dal tuo al mio.djvu o Indice:Tarchetti - Racconti fantastici, 1869.djvu --Accurimbono (disc) 14:44, 20 mag 2016 (CEST)
@Candalua: In effetti ho visto che javascript "stenta" e che talora non aggiunge l'area dati dopo l'edit. Stessa cosa con il Match: il Match resta "inattivo", sia attiva solo dopo aver fatto un purge della pagina. Temo siano segni di sovraccarico di script e sospetto VE. Alex brollo (disc.) 15:39, 20 mag 2016 (CEST)

Wikidata[modifica]

Ciao amici, martedì parto per Berlino per meta:WikiCite_2016, conferenza supertecnica su dati, citazioni e Wikidata. Mi confermate per favore:

  • che it.source ha integrato solo gli autori?
  • che non conoscete altre source che hanno integrato anche i libri?

Aubrey (disc.) 10:34, 21 mag 2016 (CEST)

Cosa intenti per "integrato"? --Accurimbono (disc) 12:19, 22 mag 2016 (CEST)
Immagino che Aubrey intendesse, che abbiano adottato l'attribuzione sistematica di un elemento wikidata a ogni pagina wikisource. Al momento sono pessimista, vedo ancora circolare l'idea che se un'opera è presente in una sola edizione, allora basta un elemento wikidata per l'opera e per l'edizione; sarebbe come dire che se un autore ha una sola opera, basta una sola pagina, per l'autore e per l'opera. L'assurdità è identica, ma non mi sembra che questa consapevolezza sia diffusa. E' una delle classiche semplificazioni che portano poi a terrificanti complicazioni: tipo quelle di certi aspetti del markup wiki. --Alex brollo (disc.) 19:00, 22 mag 2016 (CEST)
Sai Alex che il tuo concetto di usabilità è molto diverso: per te tutto ciò che è logico è corretto, ma purtroppo la gente è solitamente illogica e se vogliamo farla partecipare ogni tanto si erra dalla parte dell'usabilità. Non difenderò mai le incoerenze del markup wiki (si poteva renderlo più coerente da subito), ma l'idea di non far scrivere in HTML fu importante.
Tornando a noi, nel momento in cui hai un libro ed una sola edizione, è molto più semplice per tutti avere un solo item. Sono d'accordo che sia necessario avere una procedura semplice per quando, magari, a quella edizione se ne aggiungerà un'altra, e allora sarebbe necessaria una mitosi in 3 item (opera e 2 edizioni), e trovare il modo di gestire i link pregressi in maniera diversa...
L'unica alternativa che mi viene in mente (e che va credo nella tua direzione) è avere un bot che automaticamente spacca in due item qualsiasi libro, per cui l'utente non deve pensare troppo ma trova Wikidata con un ordine definito.
Quello che credo sia necessario è una soluzione "procedurale" il più chiara e semplice possibile, che non complichi la vita alla comunità di Wikidata ma soprattutto agli utenti delle varie Wikisource... Ma credo che, al momento, manchino su Wikidata strumenti necessari come
  • copia le proprietà di questo item in un'altro
  • una modalità per far ereditare delle proprietà dall'item opera a quello edizione (autore, titolo, anno di prima pubblicazione?)
Spero di parlarne e trovare una bozza di soluzione la settimana prossima. (Aubrey sloggato)
Non ti vedo convinto dell'esempio "pagina unica per un autore che ha una sola opera"; pensaci ancora un po', e usa l'esempio (se e quando ti convincerà) per convincere i tuoi interlocutori che non è una buona idea avere un unico item per il work e l'edition. Che poi tutto possa, e debba, essere reso semplice per l'utente non ci piove; ma questo è una questione tutta diversa. Tieni conto che la correttezza formale della struttura dei dati è la base della semplificazione possibile futura. L'interminabile vicenda e l'inconcepibile complessità di Visual Editor dovrebbe pur insegnare qualcosa.... Alex brollo (disc.) 10:11, 23 mag 2016 (CEST)
Solo un appunto: "far ereditare delle proprietà dall'item opera a quello edizione"... ehm, questo in linea di principio non si fa, si usa l'arbitrary access.--Erasmo Barresi (disc.) 22:17, 22 mag 2016 (CEST)
Sono d'accordo con Alex. Ciò di cui gli utenti hanno bisogno non è "un solo item", ma "un solo posto dove inserire (e consultare) tutte le informazioni", indipendentemente da dove poi il sistema le vada a salvare. Su WD mi pare che sia il modello dati sia già stato delineato con sufficiente chiarezza, ma è sulla User Experience che siamo molto carenti. Idealmente, caricare un testo con tutte le informazioni di opera, autore, edizione non dovrebbe essere più complicato di compilare un template (anzi, dovrebbe essere più facile). Vi ricordate il WEF Editor di quell'utente russo? Quello era un buon passo nella giusta direzione, ma poi non è stato sviluppato. In mancanza di una interfaccia di questo tipo, installabile e configurabile sui singoli progetti Wikisource, interagire direttamente con WD rimarrà sempre parecchio ostico, anche se l'item fosse uno solo, semplicemente perché WD per sua stessa natura è obbligata a fornire un'interfaccia estremamente generica. L'item singolo può anche aiutare ma non mi sembra certo risolutivo per noi. Can da Lua (disc.) 14:18, 23 mag 2016 (CEST)
Grazie Candalua. Aggiungerò una considerazione: anche se il modello dati su Wikidata è delineato, wikidata è malmaturo per gestirli come si deve; non esiste un automatismo per evitare la ridondanza delle relazioni inverse. Esempio: nel momento in cui attribuisco a un autore, presente su wikidata, un'opera, DEVE essere automatico che nell'item autore venga creata la relazione inversa. Se Pinco è padre di Pallo, sull'item Pallo deve comparire automaticamente il dato reciproco "figlio di Pinco". La stessa cosa avviene anche in edizione e opera, anche loro legate da una relazione inversa (contiene vs è contenuta) . Ogni tanto chiedo se la funzione è stata implementata, per ora non ho avuto conferma. Ci sono novità? --Alex brollo (disc.) 14:56, 23 mag 2016 (CEST)

Musica[modifica]

Ciao, innanzitutto mi complimento molto affettuosamente con voi tutti per il successo della presentazione di WS giovedì scorso a Roma, all'Aula Magna della Sapienza, al convegno dei Bibliotecari: è stato bravo il relatore, certo, ma la struttura di Progetto che ha presentato ha riscosso un grande interesse, ha suscitato molte domande del pubblico (addirittura pertinenti, non ci siamo abituati! :-) ed è stato quel che si chiama davvero un bel risultato :-)
Vi scrivo però anche per segnalarvi un evento che descrivo al bar di WP, cioè la partecipazione al Congresso IAML 2016, i bibliotecari musicali. Come leggerete, è un ingresso in un settore dello scibile chiuso e particolare, potenzialmente di grande interesse anche sotto il profilo delle acquisizioni (stiamo lavorando anche su questo), perciò ci piacerebbe sfruttare al meglio l'occasione concessaci. Stiamo chiedendo suggerimenti ai WikiColleghi ed è inutile che vi dica quanto sarebbero utili i vostri. La nostra relazione (in inglese) non sarà molto lunga, dobbiamo concentrare in poco tempo molte cose, dovremo presentare anche (questa la dico in anteprima qui) un progettino per i cataloghi tematici musicali, dovremo parlare di acquisizioni e chiedere collaborazioni e cessioni. Grazie anticipatamente di tutto ciò che vorrete suggerirci :-)
Un carissimo saluto e buon lavoro :-) --Gianfranco (disc.) 20:21, 21 mag 2016 (CEST)

Una proposta, ma tutta in salita e difficile da raggiungere. Il Conservatorio di Milano, per merito dell'allora presidente w:Francesco Saverio Borrelli è da 8 anni all'avanguardia per la digitalizzazione della biblioteca. Li ho incontrati (Borrelli compreso) due anni fa al Palazzo delle Stelline nella stessa aula dove dopo un ora, anche Wikimedia aveva una presentazione, ma ho fatto un buco nell'acqua, perchè non volevano sentir parlare di licenze libere. Può darsi che, se si presentano esperienze concrete, possano mutare tipo di approccio. I contatti, però, dovrebbe tenerli qualcuno specialista sull'argomento--Mizar (ζ Ursae Maioris) (disc.) 10:13, 22 mag 2016 (CEST)
Supongo che sia in campo da esplorare cautamente; l'estensione per produrre righi musicali c'è, ma ci vogliono un paio di alfabeti musicali interessati (anche analfabeti in mediawiki) che lavorino insieme a un paio di alfabeti mediawiki (io sono analfabeta musicale). Occorre saper leggere, senza esitazione e cogliendo ogni problema come i migliori rilettori colgono uno spazio fuori posto, la musica. Quando ce li avremo, possiamo provarci, a fare il "proofread di uno spartito", cominciando da Fra Martino Campanaro ;-) --Alex brollo (disc.) 18:53, 22 mag 2016 (CEST)
Sì, sicuramente i problemi non sono pochi, c'è quello del copyright (Mizar, ti capisco benissimo, in una trattativa in corso sappiamo già che credono di averne su opere di parecchi secoli fa e ci stiamo preparando al tristo momento in cui verrà fuori...) e c'è anche il problema tecnico; al momento però stiamo andando a dire "venite su WP e su WS (ma anche, in prospettiva, su WikiData)", quindi potremmo chiedere collaborazione anche sotto l'aspetto pentagramma, anzi questa è un'ottima dritta :-) --Gianfranco (disc.) 08:49, 23 mag 2016 (CEST)
@C.R.: Segnalo l'interesse di nap.source (al momento ospitata da mul.source) sull'argomento musica, in particolare da parte del vulcanico C.R. che pingo, là ci sono già le scansioni di numerosi spartiti relativi alla canzone napoletana. Purtroppo anche su nap.source l'interesse non è proporzionale alle forze disponibili. Ci vorrebbero energie fresche.... Alex brollo (disc.) 10:00, 23 mag 2016 (CEST)
Su nap ho provato a dare una mano per risistemare tutta la messe di voci sulla canzone napoletana (compreso l'aggiornamento dei dati relativi su Wikidata), ma ho dovuto interrompere per mancanza di tempo. È un ambito su cui si potrebbe lavorare tantissimo, sia qua che là. --Sannita - L'admin (a piede) libero 16:17, 23 mag 2016 (CEST)
Visto che su nap.source/mul.source ci sono già gli spartiti e una palese dimostrazione di interesse, ioproporrei, per farci le ossa, di lavorare là ed esplorare la misteriosa estensione Score. Sempre che vengano fuori uno-due alfabeti musicali, ovviamente. Alex brollo (disc.) 16:25, 23 mag 2016 (CEST)
Vediamo se tutt'appost..

\relative c'' { \time 4/4 \key c \major 
c4 g8 g a4 g r b^> c^> r \bar "|." } 
\addlyrics { Shave and a hair -- cut: two bits. } sì, sembra di sì, anche per il caso ostico musica + parole. Alex brollo (disc.) 16:28, 23 mag 2016 (CEST)

Ricordo che qui avevamo fatto anche un esperimento con il Va, pensiero. Can da Lua (disc.) 10:24, 24 mag 2016 (CEST)

Curiosità dall'oriente...[modifica]

Cari amici,

guardando le statistiche ho notato un fenomeno nuovo nuovo dai contorni però eccezionali: guardando questa immagine ho capito che la riga nera che ci contende la crescita in termini di pagine validate non è quella della Wikisource in Telugu, ma quella della wikisource in bengali... bengali?, la lingua che si parla in Bangladesh e in India nordorientale? Sì... ma quello che non avevo notato è questa immagine: contate gli zeri nell'asse delle ordinate: ora sono decisamente incuriosito! Qualcuno mi riesce a indicare dove informarmi meglio? - εΔω 12:33, 23 mag 2016 (CEST)

Credo tu possa trovare info in wikisource-l (il che mi fa pensare che non ci fossi, e se è così, ti meriti delle bacchettate sulle dita...): dopo la conferenza di novembre a Vienna era emerso con forza il problema dell'OCR nelle lingue indiane, e pare che adesso siano riusciti a risolvere. Per cui stanno inserendo per la prima volta moltissimi testi. Fai conto che inoltre mi spiegavano che loro non hanno tradizione di biblioteche digitali, per cui Wikisource potrebbe essere per loro la prima vera biblioteca digitale nazionale. Aubrey (disc.) 15:06, 23 mag 2016 (CEST)
Caro @Aubrey:, ho le nocche ormai frantumate per tutte le bacchettate che mi merito ^_^
Sto sperimentando con l'uso dello smartphone che umanamente non riesco a seguire tutti flussi informativi che mi scorrono sugli schermi, non sempre con la mia volontà... e onestamente vedo che ho da tempo superato il tetto di dati per unità di tempo supportabili dal mio povero disco fisso mentale, dunque anche se vorrei essere aggiornato su quanto accade in giro per le Wikisource, mi trovo a fare il tonto e a chiedere lumi, convinto che anche ad altri faccia piacere riceverne. - εΔω 15:40, 23 mag 2016 (CEST)
Orbilius, una soluzione c'è, io l'ho trovata.... potare i flussi informativi; niente smatphone, che io non possiedo, niente tablet, niente social. Solo mail e pochi siti selezionatissimi (in pratica: solo it.wikisource e siti funzionalmente collegati. ;-)
Cogliendo un messaggio di un sourcio bengalese, io mi sono spinto fino a ipotizzare un contatto con la folta comunità bengalese qui a Monfalcone (sono migliaia); ma è una comunità piuttosto chiusa e guardinga, anche se molto pacifica, e mi è stato consigliato di procedere con circospezione, attrraverso un mediatore culturale. Se e quando ci riuscirò.... ti farò sapere. Alex brollo (disc.) 15:46, 23 mag 2016 (CEST)
@OrbiliusMagister:Intanto per puro caso aprendo la pagina di Phe per vedere se ha commentato la mia "strategia ia->djvu" trovo questo:messaggio da Bodhisattwa. Non è molto ma almeno è un indizio. Alex brollo (disc.) 16:34, 23 mag 2016 (CEST)

Tech News: 2016-21[modifica]

20:40, 23 mag 2016 (CEST)