Wikisource:Bar

Da Wikisource.
Benvenuto nel Bar di Wikisource!
il punto d'incontro e discussione dei wikisourciani
archivio
Filing cabinet icon.svg
2014
gen feb mar apr mag giu lug ago set ott nov dic

Cat Categoria: Wikisource Bar Bar 

Il Bar di Wikisource è il punto d'incontro e discussione dei wikisourciani. Qui si possono porre domande, fare osservazioni o inserire comunicazioni di carattere generale a proposito di it.wikisource. Per favore, tieni conto che questo non è un forum né un blog. Tratta quindi argomenti il più possibile inerenti Wikisource e il suo progetto complessivo.

Se hai quesiti specifici riguardo a determinati argomenti, dai un'occhiata ai bar tematici, se hai domande tecniche lascia un messaggio nel bar tecnico.


Desideri...
...una baguette farcita?

No? Ti propongo qualcos'altro?

Hai appena conosciuto Wikisource e hai domande su cos'è, come funziona e cosa si può fare?

Leggi le domande frequenti.

Non trovi un'informazione?

Fa' una ricerca e esplora it.wikisource: se ancora non trovi nulla,
scrivi un messaggio sul Bar.


Una serie di mattonate[modifica]

Alex dice che, sia pure con affetto, sono solito lanciare mattoni sulla testa della gente. Questa volta con ancora più affetto ne lancio tutta una serie in un colpo solo. Ho ripreso i contatti con alcuni docenti della facoltà di Agraria di Milano che collaborano anche al Museo Lombardo di Storia dell'agricoltura, che si sono dichiarati disponibili ad intensificare i rapporti. Come primo passo potrebbe esserci quello di caricare i testi dei professori che tra seconda metà dell'ottocento e primi decenni del novecento hanno reso famosa la facoltà. Su Archive.org ho trovato e copiato su commons (sperando di non aver fatto pasticci) opere di Gaetano Cantoni L'agricoltura italiana, Trattato completo di Agricoltura, I sussidi dell'agricoltura, Nuovi principi di fisiologia vegetale e inoltre di Molon Le yucche . La speranza è poi di coinvolgere qualche studente, dottorando ecc anche nel lavoro di trascrizione. Nell'anno di Expo 2015 forse il tema può suscitare interesse e forse anche qualche soldino--Mizar (ζ Ursae Maioris) (disc.) 17:25, 26 nov 2014 (CET)

I nomi dei file sono urrendiiiii! ;-) facciamoli rinominare su Commons, con il modello standard Autore - Titolo, anno.djvu prima di usarli per i nostri Indici! (alex sloggato)
+1 --Accurimbono (disc) 11:27, 27 nov 2014 (CET)
Vedo che i primi file sono rinominati su Commons. Ho creato una categoria commons:Category:Books by Gaetano Cantoni, figlia di commons:Category:Gaetano Cantoni e una voce commons:Creator:Gaetano Cantoni. Certo che su Commons non è mai finita. :-( --Alex brollo (disc.) 16:39, 28 nov 2014 (CET)
Le quattro pagine Indice dei testi di Cantoni sono state create in forma di bozza e linkate in pagina Autore sotto Autore:Gaetano Cantoni (ok il pagelist, mancano i sommari). Sono tre opere "toste" e un'opera breve; le tre "toste" lo sono perchè hanno immagini ma soprattutto molte, molte tabelle. Penso che farò uno sforzo per vedere se è possibile 'o miracolo di estrarle dall'hOCR, così come, in Adjecta, sono strate estratte alcune caratteristiche dei testi in versi. Un'ideuzza mi è venuta... ma bisogna verificare che funzioni. Penso che lavorerò su Indice:Gaetano Cantoni - Trattato completo di agricoltura, 1855.djvu; @Mizardellorsa:: occhio che non è l'opera completa, è il secondo volume di un'opera in due volumi. Bello sarebbe avere anche il primo volume. --Alex brollo (disc.) 17:28, 29 nov 2014 (CET)
Grazie, Alex. Il lavoro sarà lungo. Spero di reclutare aiutanti alla facoltà di agraria. Per il volume 1, sempre nel'edizione del 1855 ho trovato http://books.google.it/books?id=Z4sCICp1pyEC&printsec=frontcover&dq=Cantoni+Trattato+completo+di+agricoltura&hl=it&sa=X&ei=O316VPXLHMq9ygOt9YKQAg&ved=0CCkQ6AEwAA#v=onepage&q=Cantoni%20Trattato%20completo%20di%20agricoltura&f=false Spero che sia completa e avrei bisogno di aiuto per ricavare il pdf.-Mizar (ζ Ursae Maioris) (disc.) 03:20, 30 nov 2014 (CET)
Le scansioni non sono bellissime, ma meglio di niente. Lascia, me ne occuperò io della "trasformazione in djvu". --Alex brollo (disc.) 12:32, 1 dic 2014 (CET)
Messo al lavoro FineReader, ho potuto aggiustare alcune pagine "brutte" e l'OCR a prima vista non sembra malaccio. Appena ho il djvu, controllo che non manchino pagine e lo carico. Nel frattempo sto scervellandomi su un "costruttore di tabelle"; l'automatismo integrale è risultato un problema ostico (anche FineReader fallisce, piuttsto spesso...) ma sto pensando a come emulare gli strumenti interattivi di FineReader in javascript. --Alex brollo (disc.) 22:14, 1 dic 2014 (CET)
✔ Fatto. Il nome della pagina Indice del volume II non è soddisfacente ma non oso chiedere su Commons un altro spostamento.... :-( Alex brollo (disc.) 00:29, 2 dic 2014 (CET)

@Mizardellorsa:: il tuo professore riuscirebbe (come accennavi sopra) a reclutare studenti ecc.? Potrebbe decidere che vale un punto all'esame se rileggono almeno 20 pagine :-D O un altro incentivo del genere. Secondo me dobbiamo iniziare ad essere più audaci e chiedere ai nostr interlocutori un aiuto diretto almeno nella rilettura... Bastano poche persone in più e in poco tempo un libro viene fatto in breve tempo. Aubrey (disc.) 10:51, 16 dic 2014 (CET)

Edit di anonimi[modifica]

Non è una cosa da cambiare durante il contest, forse, ma perchè non diamo agli anonimi la possibilità di mettere i SAL fino al 75%? Aubrey (disc.) 15:27, 28 nov 2014 (CET)

  • Pictogram voting oppose.svg NO. Ritengo che la possibilità di valutare i testi o le pagine sia un giusto incentivo alla registrazione mentre in caso di valutazioni erronee o casuali un IP non ha una pagina di discussione con cui imbastire un discorso di ampio respiro. Peraltro gli anonimi possono comunque correggere e lavorare sui testi anche senza valutarli. Diciamo che considero la valutazione dei testi e delle pagine un plus riservato ai registrati, e chi ci legge una punta di snobismo o di esclusività non sbaglia del tutto. - εΔω 23:44, 29 nov 2014 (CET)
Io sinceramente non riesco a capire come su Wikisource lasciare agli anonimi questa possibilità sia più pericoloso che in Wikipedia: lì agli anonimi si lascia la possibilità di scrivere un'intera enciclopedia, e lì l'apporto degli anonimi è importantissimo.
Nel nostro caso, potrebbe non cambiare assolutamente nulla: magari non è certo il non avere le iconcine in basso a non fare editare le persone. Magari non editano perchè WS non è abbastanza interessante. In quel caso, la nostra modifica sarebbe completamente neutra.
D'altra parte, se invece non avere le iconcine confonde anche solo 4-5 utenti che altrimenti parteciperebbero, bhè, allora la cosa cambia. La nostra modifica sarebbe positiva, e anche solo qualche edit in più al giorno per noi è importante abbastanza, secondo me. --Aubrey (disc.) 19:29, 30 nov 2014 (CET)
Francamente non capisco quale sia la difficoltà/il fastidio di registrarsi sui progetti wiki. Non serve nemmeno una email! Registrarsi significa in pratica solo dichiararsi disponibili alla discussione (ossia, avere a disposizione una pagina Discussioni utente). Dobbiamo chiarirlo meglio? Possono esserci equivoci - malintesi - sospetti di violazione di privacy o quant'altro? (alex sloggato)
Reputo sinceramente divertente che tu affermi quello che stai affermando da sloggato :-) Le persone possono essere da mobile, da lavoro, o non avere voglia di registrarsi: è un loro diritto. Fate conto che nella wikipedia in giapponese il 70% degli utenti è anonimo... Quella che io propongo è una prova: se vediamo che c'è troppo patrolling da fare, possiamo tornare indietro. Aubrey (disc.) 16:35, 1 dic 2014 (CET)
Concordo con Edo; bisogna tener presente che noi, a differenza di altri progetti, abbiamo la necessità di verficare che le pagine siano formattate e rilette da utenti diversi, cosa impossibile da sapere tramite gli edit anonimi.--Barbaforcuta (disc.) 00:04, 2 dic 2014 (CET)
Quindi il problema è che se un utente anonimo porta tutto al 75% e poi si registra e lo porta al 100%? A me sembra un caso molto improbabile, vi urgerei a pensare seriamente al possibile guadagno della mia proposta e alla possibile perdita del vostro caso peggiore. Io credo che la comunità di Wikisource debba con ogni mezzo pensare a guadagnare utenti: siamo sempre gli stessi da nove anni e siamo cresciuti con una lentezza esasperante. Dal mio personale punto di vista, dovremmo fare ogni cosa per crescere. Aubrey (disc.) 10:05, 2 dic 2014 (CET)
L'ho fatto apposta... in genere, quando nelle "toccate e fuga" mi trovo sloggato e me ne accorgo solo dopo, rientro loggato e firmo; stavolta non l'ho fatto. Quanto alla crescita: sono un appassionato decrescente che aspira all’ equilibrio piuttosto che alla crescita; la parola stessa mi scatena l'orticaria. ;-) --Alex brollo (disc.) 10:46, 2 dic 2014 (CET)
Se Wikisource non cresce, muore. La mission dei progetti Wikimedia è "Imagine a world in which every single person on the planet is given free access to the sum of all human knowledge", ed è quello che personalmente a me interessa.
Avessimo, per paradosso, una Wikisource perfetta, strapiena di libri e strumenti perfetti, ma completamente inutilizzata se non da uno sparutissimo gruppo di amanuensi digitali, per me sarebbe completamente inutile.
La mia è una logica pienamente bibliotecaria: mi interessa l'accesso ai documenti che proponiamo, mi interessa che Wikisource sia bella da leggere e utile, che sia facile partecipare, che la gente ci si trovi bene e ci rimanga per farla crescere ancora. Il tutto col fine di offrire un servizio migliore ai nostri utenti.
Non mi interessa (anzi, mi spaventa) che Wikisource elabori una via tutta personale a quello che sta uccidendo Wikipedia: una comunità completamente autoreferenziata e non empatica che è interessata più allo strumento (Wiki) che al fine (che Wiki sia letta e utile). Per me non sono questioni di lana caprina, ma il fondamento del progetto.
So molto bene che non c'è neanche una punta di malizia in quello che dici, Alex: ma credo sia importante ribadire che questo non è un progetto mio o tuo, è un progetto che ha un obiettivo. Se lo fallisce, io personalmente non voglio più niente a che farci, ci sono cose che mi divertono di più che rileggere oscuri testi ottocenteschi. La crescita, IMHO, è parte dell'obiettivo.
Scusate la predicona ma ci tenevo a ribadire i punti per cui ho iniziato questa conversazione. se la comunità non è d'accordo con la mia proposta ma con il suo fine, non ho problemi (spiegatemi logicamente quali sono i problemi e accetto di buon grado :-). Aubrey (disc.) 14:12, 2 dic 2014 (CET)
Tieni conto che se avessero ragionato come te gli amanuensi medioevali, adesso avremmo perso tutto lo scibile riguardante i testi antichi. Loro facevano esattamente quello che hai detto: trascrivevano per conservare e tramandare, anche se i lettori erano un numero sparuto o nessuno, magari per secoli e secoli. Avrà ben un senso il fatto che l'oscuro amanuense campeggia nella nostra pagina principale... --Alex brollo (disc.) 17:17, 2 dic 2014 (CET)
(scusate i toni, ma oggi sono così) Alex, come dire, te prego: se ti interessa davvero la conservazione ti consiglio, da amico, di abbandonare immediatamente Wikisource e di chiedere a @Nemo: dell'Archive Team, di Internet Archive, e di tutti quei progetti che lavorano sulla preservazione digitale. Wikisource non ha la possibilità di restituire alle biblioteche, adesso, un formato decente del loro libro (niente XML, niente OCR corretto da umani rimappato dentro il DJVU). Facciamo, da pochissimo, l'EPUB (questo sì che è buono). Ma le nostre pagine HTML non sono ben collegate, e sono pure transcluse. Dal mio punto di vista, noi siamo qui per essere letti: per offrire alle persone una bella biblioteca digitale con più servizi possibili. La conservazione è importante, ma non è certo il nostro primo pensiero. Aubrey (disc.) 17:24, 2 dic 2014 (CET)
Abbiamo visioni plurali; ottima cosa. Sarebbe un male se queste visioni venissero in conflitto e si intralciassero a vicenda; se vedete questo rischio, avvisatemi perchè non voglio certo fare danni; ma se queste due diverse visioni possono essere complementari, tanto meglio. Scusatemi voi per il tono della reazione alla parola crescita; ma capitemi, ho una grave allergia, la reazione alla parola "crescita" è immediata e violenta. Pensate come mi sento nella lettura di qualsiasi quotidiano o nell'ascolto di qualsiasi telegiornale, allergico come sono.... avrete notato che tutti i miei sforzi "tecnici", da qualche anno, si orientano sempre di più all'obiettivo di affilare la penna dell'amanuense; procedo per tentativi ed errori, numerosi tentativi e numerosi errori, ma l'obiettivo è quello.
PS: grazie del consiglio da amico, ma non lo seguirò ;-) (a meno, appunto, che il mio lavoro non intralci quello di altri).--Alex brollo (disc.) 00:18, 3 dic 2014 (CET)
Scusate ragazzi, ma credo ci sia un po' di confusione sui vari argomenti trattati, secondo il mio parere. Importante è consentire l'accesso e la fruibilità dei nostri testi e su questo ci sarebbe molto da lavorare: l'epub sicuramente va in questa direzione, ma non basta. Altro aspetto è la possibilità di modificare le pagine: non credo che un anonimo sia respinto da questo progetto per l'impossibilità di porre un SAL, quanto può benissimo editare e migliorare il testo già adesso. Si dovrebbe, invece, migliorare l'interfaccia in nsIndice e nsPagina per rendere il lavoro più facile e veloce: basterebbe in nsPagina permettere la visione dell'opera a pagina singola, doppia pagina e formato fluido, oltre al testo con fonte scansionata, per rendere inutile il ns0. Un esempio, ben distante da quello che ho in mente, è book2scroll e anche il lavoro di Alex va in questa direzione. Purtroppo la mia scarsa conoscenza della programmazione non mi permette di passare dalla teoria alla pratica con tanta facilità quanto vorrei. Sicuramente VisualEditor faciliterà la rilettura delle pagine, ma è solo il primo passo. Non dimentichiamoci, infine, che noi siamo una biblioteca digitale impegnata a rendere fruibile i testi in formato digitale, ben lontano dalla semplice archiviazione che proponevi ad Alex, ma per l'appunto siamo una biblioteca e dovremmo essere invogliati a provvedere alla conservazione di tutte le opere, anche di quelle che attirano l'interesse di solo 5 persone su un miliardo nella migliore delle ipotesi. Questo è il mio umile pensiero e la mia speranza per uno sviluppo o progresso di Wikisource (se non vogliamo usare il termine crescita che, a essere sincero, irrita anche me per gli stessi motivi).--Barbaforcuta (disc.) 17:57, 3 dic 2014 (CET)

Domande e richieste[modifica]

Cari tutti, ma in particolare @OrbiliusMagister:, @Alex brollo: e @Candalua: (come da suggerimento di @Accurimbono:) :) avrei alcune domande da fare, visto che mi sto rimettendo a lavorare sull'almanacco-moloch Chi l'ha detto?.

La prima riguarda {{TestoAssente}}: al momento, il template permette soltanto di segnalare che un testo è, per l'appunto, assente, ma non permette (quando il titolo è riportato in altro modo) di indicare il titolo corretto e mantenere allo stesso tempo la grafia indicata nel libro.

Qui trovate un esempio: il Manuale della letteratura italiana di D'Ancona e Bacci viene riportato come Manuale della letter. ital.. Io ho inserito il template, ma come vedete adesso mostra il titolo per esteso e non ridotto come l'autore intendeva fare. Non voglio metterci mano perché rischio di fare casino, però... si potrebbe per favore inserire un secondo campo come per {{TestoCitato}}, per ovviare a casi come questo?

La seconda riguarda proprio queste abbreviazioni: ritenete sia il caso di creare un template che, similmente a {{Ec}}, mantenga l'abbreviazione in pagina, ma espliciti il titolo nella versione solo testo?

La terza riguarda i riferimenti ai vari libri e capitoli della Sacra Bibbia. Ora, io so benissimo che quel progetto si è purtroppo arenato (anche perché gestire tre versioni in pubblico dominio è una roba da far tremare i polsi), ma se mi capita un riferimento a una lettera di S. Paolo o a qualche altro libro di Vecchio o Nuovo Testamento... io che devo indicare? Perché io non mi ci raccapezzo più.

Ah, già che mi trovo: qualcuno può per favore darmi una mano con questa maledetta pagina? Sto cercando di riportare l'indentatura del capoverso "Dai libri è breve il passo alle biblioteche," nel corrispettivo testo a fronte, solo che non ci riesco e non so davvero cosa fare. :(

Grazie e scusate per la messe di problemi sollevati. :) Sannita - L'admin (a piede) libero 16:16, 1 dic 2014 (CET)

1) Sì, giusto
2) No, la versione solo testo deve essere uguale a quella su carta IMHO, abbreviazioni comprese
3) E' una questione che ho posto varie volte ma non credo di essere stato compreso dagli altri utenti. Bisogna distinguere il livello OPERA dal livello EDIZIONE. Se è citata l'OPERA in astratto, bisognerebbe citare la pagina dell'OPERA, se è citata una particolare EDIZIONE bisognerebbe citare questa. A questo proposito bisognerebbe creare una pagina OPERA per ogni testo che da una pare funga da disambigua per le diverse edizioni, dall'altra serva per raccogliere le citazioni all'opera, e inoltre venga linkata su Wikidata all'elemento corrispondente alla Voce su Wikipedia (che di solito riguardano le opere e non le singole edizioni). La creazione di queste pagine opera è un lavoraccio che nessuno credo avrà voglia di fare... :( ...ma secondo me sarebbe utile per fare chiarezza.
--Accurimbono (disc) 16:27, 1 dic 2014 (CET)
Per la tua maledetta pagina ho risolto con un <p></p>, poco elegante magari ma efficace. Probabilmente in qualche formattazione nelle pagine precedenti è rimasto aperto qualche paragrafo. --Luigi62 (disc.) 18:44, 1 dic 2014 (CET)
Rispondo solo ad @Accurimbono:, nel punto 3. Io credo che Curi tu qui confondi l'utilizzo dei livelli opera ed edizione, che sono utili a livello 'catalografico, ma non nel senso che dici tu.
Cioè: mentre è possibile per me parlare dell'opera Bibbia o Amleto in astratto, come "work", e possa dunque fissare alcuni metadati legati a quella (autore e titolo, per esempio), mi è letteralmente impossibile fare riferimento a pezzi singoli dell'opera, che è il punto di Sannita. Io non posso avere una Bibbia archetipica, come non posso avere un Amleto archetipico: non esiste, fisicamente, l'"opera-Amleto", ma è solo un concetto utile a livello letterario-bibliotecario. Non esiste, esitono le singole edizioni (nel caso dell'Amleto e della Bibbia, fra l'altro, non esistono edizioni orginiali).
L'unica risposta a Sannita sarebbe: prendi un'edizione che abbiamo e usa quella. O non fare niente. Oppure, terza ma quasi impossibile, chiedi ad Alex brollo se gli viene in mente un template-diavoleria per cui tutte le volte che richiami una lettera di San paolo ti va in una pagina di disambiguazione che va creata per quella stessa lettera in bibbie diverse... Aubrey (disc.) 23:47, 1 dic 2014 (CET)
Aubrey, nel caso della Bibbia hai torto: i singoli libri sono opere a se stanti, riunite in un secondo tempo. Non capisco quale sia l'impedimento (a parte la pigrizia) di creare per ogni opera una pagina di disambigua che elenchi tutte le edizioni presenti in Wikisource (anche se fosse una sola edizione) e far puntare verso di questa le citazioni che genericamente si riferiscono all'opera e non alla specifica edizione.
Su Wikipedia hanno (ad esempio di lettere di San Paolo) una pagina dedicata alla Prima lettera ai Corinzi, per quale motivo non potremmo averla noi? Proprio non capisco... --Accurimbono (disc) 09:39, 2 dic 2014 (CET)
OK stiamo dicendo la stessa cosa, non avevo letto bene. Per me la "best practice" dovrebbe essere far puntare la citazione alle pagine di disambigua, poi sarà il lettore a decidere quale edizione leggere, magari tutte, confrontandole. --Accurimbono (disc) 09:44, 2 dic 2014 (CET)
Infatti, anche io metterei una disambigua. Se siete d'accordo, potrei occuparmene io oggi. Ho una mezza idea in mente. -- Sannita - L'admin (a piede) libero 13:22, 2 dic 2014 (CET)


Scusate, è possibile creare un disambigua di questo tipo, in cui siano esaltati anche i contenuti grafici e i preziosi link ad altri progetti (non vi chiedo di adottare la mia idea ma solo di rifletterci sopra)? A me piace molto il modello francese della pagina autore ma riportato sulle OPERE ecc. . --Xavier121 13:42, 3 dic 2014 (CET)

Sì, ricordavo la tua pagina su I promessi sposi che era bellissima. --Accurimbono (disc) 15:52, 3 dic 2014 (CET)
Ottima idea quella di Xavier.--Barbaforcuta (disc.) 17:30, 3 dic 2014 (CET)
@Xavier121: Corri a sostituire la pagina dei promessi sposi con la tua! :-D
Io starei solo attento a mettere chiaramente i link alle opere, in modo che si vedano, per il resto mi sembra un'ottima idea, già così. Aubrey (disc.) 19:21, 3 dic 2014 (CET)
C'è un problema di impaginazione: risulta anche a voi? --Xavier121 23:29, 3 dic 2014 (CET)

Pagine SAL75% ma in realtà 25%[modifica]

Ciao a tutti, mi è capitato di vedere una serie di pagine portate a SAL75% ma ho notato che in realtà sono al 25% ossia frutto di quanto produce l'OCR e niente più. Non ho potuto portarle al 25% per mancanza di tempo quindi, se non dovesse essere già stato fatto posso solamente dirvi che le Ultime Modifche erano del 30 novembre (forse 1 dicembre) e non so neppure l'utente (tranne che era uno nuovo). Scusate se non sono abbastanza preciso :-( Auguro una serena giornata a tutti. --Stefano mariucci (disc.) 05:32, 2 dic 2014 (CET)

Dai, con calma dacci qualche indizio in più ;-). La cosa più urgente è avvisare, gentilmente, l'utente novizio della svista. --Alex brollo (disc.) 10:49, 2 dic 2014 (CET)
Penso che si tratti di queste: Pagina:Manuale 150 ricette di cucina di guerra.djvu/68 e dintorni. Le ho già portate al 100% ieri sera sistemando sia la formattazione che gli errori. --Luigi62 (disc.) 11:33, 2 dic 2014 (CET)
Altre pagine sono ad esempio questa e dintorni.--Federicor (disc.) 15:02, 2 dic 2014 (CET)
Ecco, ci sono grazie anche a Federicor. Confermo che le pagine sono dalla [106] alla [126]. Almeno quelle che ho visto io. --Stefano mariucci (disc.) 20:46, 2 dic 2014 (CET)
Riportate a SAL 25% e avvisato l'utente @Lilloteuì: del malinteso. --Alex brollo (disc.) 12:39, 3 dic 2014 (CET)
Mi sembra che anche l'utente Martymissi96, avvisato da Aubrey, non abbia riletto in maniera adeguata le sue pagine, visti i suoi contributi.--Barbaforcuta (disc.) 16:41, 4 dic 2014 (CET)

Numeri Contest[modifica]

Intanto li appoggio qui:

all pages not proof. problem. w/o text proofread validated all pages with scans w/o scans disamb percent
805 -485 -70 54 1306 2176 123 122 1 0 0.14

Per contare i vincitori, al momento nessuno sa come faremo: io non riesco a fare andare lo script di conteggio, e quindi siamo a piedi... --Aubrey (disc.) 14:40, 2 dic 2014 (CET)

Volevo provare a fare un conto utilizzando metodi semi-manuali, ma riesco ad estrarre solo 5000 modifiche. Anche filtrando il solo Ns pagina arrivo solo fino a circa le 22 del 24/11. In pratica mi manca quasi tutto il primo giorno. Come posso fare per andare più indietro? --Luigi62 (disc.) 00:19, 3 dic 2014 (CET)
Ho guardato lo script che hai linkato nella prima "richiesta di aiuto". Giusto per non impazzire con prove a vuoto: che difficoltà hai avuto? Non parte? Dà messaggi di errore? Stasera mi cimento, anche se lo script non è semplice e mi costerà stress, se non gira. --Alex brollo (disc.) 09:21, 3 dic 2014 (CET)
Premesso che sono completamente ignorante di Python, ho provato a far girare lo script. Ebbene, il programma processa tutte le pagine di ogni libro; ma ogni volta alla riga 60 lancia l'eccezione KeyError e, di conseguenza, non analizza nessura revisione. Che sia un problema nella gestione delle hash table? Negli indici con cui si accede agli elementi di data (o a quelli di data.values())? Da PythonWiki scopro Python raises a KeyError whenever a dict() object is requested (using the format a = adict[key]) and the key is not in the dictionary. Per il resto, non so nulla.--IlCapo (disc.) 12:01, 3 dic 2014 (CET)
Eventuali pyhonisti seri, aiuto! Che significa il contenuto dell'ultima quadra:
revs = data["query"]["pages"].values()[0]["revisions"][::-1]
che sta nella riga 60, proprio quella che dà errore? Non capisco quel [::-1] ! Capo, ci sono in giro altre copie dello script per verificare? --Alex brollo (disc.) 13:07, 3 dic 2014 (CET)
Test fallito immediatamente: lo script vuole pywikibot-core mentre io conosco e uso il pywikibot-compact. E certo.... è la "crescita", che scarta il vecchio per accogliere il nuovo.... e chi resta indietro, peggio per lui. Negli ultimi due anni c'è stata una politica evidente dei "piani alti": "se non state al passo, rinunciate". Da quel momento ho cominciato seriamente a stufarmi di correre. --Alex brollo (disc.) 16:17, 3 dic 2014 (CET)
L'anno scorso ci hanno aiutato i catalani; perché non chiedere nuovamente a loro?--Barbaforcuta (disc.) 17:29, 3 dic 2014 (CET)
E' una settimana che chiedo aiuto ai catalani, cioè a coloro che hanno scritto lo script. Avevano detto he mi davano una mano ma poi niente.
La versione che io ho adattato del loro script è qui:
https://gist.github.com/Aubreymcfato/445ae33d78ef58f3b49c 
Non sanno dirmi perchè non funzioni, ma concordiamo tutti su quello che dice @IlCapo:, il vulnus sta nella query. A me lo script gira ma non stampa nessun risultato, per cui legge legge ma non prende niente. Per quel che vale, @Alex brollo:, io ho installato in un secondo con pip il pywikipedia-core e non mi dà problemi.
L'anno scorso invece c'era un'altro script, che è qui. Andrebbe adattato con i nostri nuovi libri, che trovate nel link sopra. Aubrey (disc.) 19:18, 3 dic 2014 (CET)
Sommo giubilo. Ho sostituito alla riga 58 la riga
 data = pywikibot.data.api.CachedRequest(0, site=site, **params).submit()

copiata pari pari dallo script dell'anno scorso e lo script funziona. Ancora tuttavia non è perfetto: mentre scrivo è ancora in esecuzione ma dai risultati parziali vedo che non ha processato correttamente I colloqui di Gozzano e le Ultime lettere di Jacopo Ortis. Forse qualcosa non quadra nella loro definizione all'interno di llibres (sull'Ortis manca un .djvu, su Gozzano c'è un pipe di cui non comprendo il significato)--IlCapo (disc.) 20:27, 3 dic 2014 (CET)

In effetti, occorre correggere l'elenco, eliminando il pipe ed aggiungendo il .djvu. Provo a far correre una versione modificata con le due sole opere modificate (ho riesumato l'istruzione che chiama query e modificato la riga 58 e adesso lo script gira anche su compat) ma sono certo che non si impapererà. --Alex brollo (disc.) 21:54, 3 dic 2014 (CET)

Nuntio vobis gaudium magnum. Ho i risultati finali, ovviamente da controllare. Sono per ora qui. (Piccola nota: lo script dava due punti per la trascrizione e uno per la rilettura, qui ho rifatto i calcoli secondo la quota 3/1 come riportato nel Regolamento)--IlCapo (disc.) 01:07, 4 dic 2014 (CET)

Intanto, un grandissimo GRAZIE a te, IlCapo, per averci aiutato in un momento di difficoltà! E da parte mia, un grazie anche ad Aubrey, per quello che ha fatto e che farà, e a tutti i partecipanti, insieme alle mie scuse per non aver trovato il tempo e la passione per dare un contributo significativo all'evento. --Alex brollo (disc.) 07:32, 4 dic 2014 (CET)
Grandissimo @IlCapo:! Grazie davvero. Bene, abbiamo un primo vincitore, chiederei a chi può di fare un primo check a campione sulle pagine da lui formattate e rilette, in modo da capire se ha lavorato bene (non ne dubito, ma dobbiamo controllare). IlCapo, dato che hai queste meravligose skill ti faccio provare anche il vecchio tool per estrarre il secondo e il terzo posto :-D Aubrey (disc.) 10:28, 4 dic 2014 (CET)
Inoltre, sapresti contare esattamente quante pagine sono state formattate e quante rilette? io non riesco a trasformare in csv la tabella :-) Aubrey (disc.) 10:36, 4 dic 2014 (CET)

uhmm... ma il vincitore è chi ha fatto più punti (con meno pagine) o chi ha riletto più pagine in assoluto (nel nostro caso secondo a punti)? Penso non sarebbe sbagliato prevedere un riconoscimento per il miglior formattatore! --Xavier121 12:01, 4 dic 2014 (CET)

Direi che il regolamente parli chiaro, sui punti: li abbiamo messi per differenziare le cose e attribuire un peso diverso alle due azioni, e poterle confrontare. Io quindi direi il primo a punti. Contando che il primo si toglie dal sorteggio, spero tanto che la fortuna porti bene ai nostri grandi rilettori :-D Aubrey (disc.) 17:23, 4 dic 2014 (CET)
@Aubrey:: Va bene, posso provare con lo script per l'estrazione. Ma preferirei non farlo girare io, visto che potrei essere estratto. Per il resto, 824 pagine trascritte, 2218 rilette.--IlCapo (disc.) 20:32, 4 dic 2014 (CET)
AAAH!!! ho fatto un grave errore! Nella descrizione del concorso c'è scritto dal 23 novembre, e nel regolamento dal 24. Purtroppo domenica 23 avevo messo in cascina oltre 400 punti, ma adesso scopro "non validi". Imparerò a leggere meglio le regole per il futuro. --Luigi62 (disc.) 21:27, 4 dic 2014 (CET)
Spera nella fortuna, @Luigi62: :-)
Caro @IlCapo:, il codice è qui:
https://github.com/Aubreymcfato/wscontest
mentre il bellissimo tool fatto da Cristian è qui. Devo ancora trovare utente e password, ma sicuramente bisogna aggiornare i riferimenti con i punti, e poi darglieli in pasto. Poi se funziona l'estrazione vera la faccio io. Aubrey (disc.) 23:53, 4 dic 2014 (CET)

Le varie versioni della Bibbia[modifica]

Ciao a tutti, apro uno spinoff della discussione che ho iniziato ieri riguardo la Bibbia.

Dell'opera vengono citate tre versioni differenti: la traduzione "originale" del 1607 di Diodati, la traduzione riveduta del 1821 (a sua volta basata su una revisione del Diodati stesso del 1641) e la revisione a cura della "commissione Luzzi" del 1925. Tuttavia, solo la seconda versione è effettivamente presente con una versione con testo a fronte qui su Wikisource. Della prima è disponibile soltanto una copia su Google Books, mentre della terza dubito che possano esserci versioni riutilizzabili causa copyright.

Proporrei quindi di tenere la sola versione del 1821, ossia l'unica di cui abbiamo il .djvu. In alternativa, qualora si possa scaricare e utilizzare la scansione di Google, possiamo tenere anche la versione del 1607. L'unica che sicuramente non può rimanere è la Luzzi (ma, come dire, lì siamo avvantaggiati, visto che c'è solo il riferimento e nessuna pagina scritta).

Che ne dite? --Sannita - L'admin (a piede) libero 15:32, 3 dic 2014 (CET)

Hai fotografato l'attuale situazione. La Luzzi l'abbiamo già dolorosamente eliminata: dove ne è rimasto traccia? quanto alle altre ricordo che la Princeps del 1607 è in standby perché si è dato la precedenza all'aggiustamento con testo a fronte dell'edizione riveduta 1821 a causa della maggior facilità di formattazione ed economia di note in calce. - εΔω 19:01, 3 dic 2014 (CET)


epub[modifica]

La modifica suggerita da Curi e realizzata da Alex, che ve ne pare? --Xavier121 20:04, 3 dic 2014 (CET)

Direi che va bene. --Aubrey (disc.) 21:45, 3 dic 2014 (CET)
Grazie Alex! Penso che ora i download degli ePub aumenteranno.
Mi e vi chiedo se sia il caso di subordinare l'apparizione dell'icona verde al raggiungimento di un livello di qualità minimo (SAL>75%) oppure se mostrarla per tutti i testi indipendentemente dal SAL. --Accurimbono (disc) 10:10, 4 dic 2014 (CET)
Intanto che ci pensate, posso dirvi che la cosa - se decidete di farla - è fattibile, grazie al nostro antico e esotico, ma difficilmente superabile, sistema di "semantizzazione dei dati" :-)
Tuttavia questa scelta dovrebbe essere estesa con coerenza a tutti gli altri link per il generatore di epub - sia in sidebar, che nel box intestazione, e altrove (se compare altrove). --Alex brollo (disc.) 10:30, 4 dic 2014 (CET)
Secondo me sarebbe una bella idea. Credo che un template in Lua sarebbe la cosa migliore in assoluto, e in teoria, come dice Alex, il dato c'è... --Aubrey (disc.) 11:31, 4 dic 2014 (CET)
Prima o poi toccherà mettere mano alla conversione in Lua di moltissimi template, primi fra i quali quelli delle più banali formattazioni (tipo {{Centrato}}; mi disturba il dubbio che per interrogare dati semantizzati come li abbiamo noi (e nessun altro), Lua non sia l'ideale; bisogna pensarci. Non credo che Lua possa accedere direttamente alla transclusione selettiva, la lettura in Lua di pagine diverse da quella corrente è considerata operazione "server expensive; il travaso di tutti i nostri dati semantizzati in Wikidata è un lontano e confuso sogno. Ma potrei sbagliarmi! Corriggetemi se potete. --Alex brollo (disc.) 12:09, 4 dic 2014 (CET)
Direi che confermo quello che stai dicendo: su Wikidata, finchè non ci decidiamo a mettere i dati noi, non ci facciamo niente.
Se vi può consolare, ho iniziato un discorso importante che i bibliotecari delle BNCF a riguardo. Gli ho speigato che mettere dati bibliografici in Wikidata non è per niente facile e tutti abbiamo le idee un po' confuse.
In questi mesi, abbiamo tirato su un piccolo gruppo di arditi che lavorerà su questo progetto, che non è altro che un Wikibase locale dove fare esperimenti, trovare la quadra della catalogazione libraria e poi provare ad andare su Wikidata con le idee chiare.
Riguardo alle cose server-expensive, per una volta ti dò ragione, dato che come penso il template {{Testo}} è utilizzato dappertutto magari vogliamo essere sicuri di non esagerare. --Aubrey (disc.) 13:00, 4 dic 2014 (CET)

OT: @Aubrey: visto che sei a braccetto con i bibliotecari della BNCF, gli domandi se possono metterci a disposizione TUTTE le EDIZIONI NAZIONALI? (mi offro volontario) :) --Xavier121 13:38, 4 dic 2014 (CET)

Gli chiedo tutto quello che volete :-)

Fate conto che se come comunità decidiamo che il progetto ci piace e gli diamo "attenzione comunitaria" (creiamo le pagine indice, proviamo a formattare quantomeno un libro intero, lo promuoviamo come libro del mese, ecc.) secondo me settiamo un bel precedente, loro potrebbero essere più propensi a regalarci altri libri e quindi acquisteremmo visibilità, ecc. Secondo me vale la pensa provarci. IMHO, è quello che è successo ai francesi, quando Gallica gli ha regalato 1000 libri (ok, sono troppi, ma da mille a uno c'è una bella differenza :-)

Tu di quali edizioni parli, precisamente? Aubrey (disc.) 00:13, 5 dic 2014 (CET)

E' da capire se le DUE biblioteche Nazionali hanno i volumi delle Edizioni nazionali (anche non concluse) ecc. Giusto qualche nome :) :

  1. Giuseppe Cesare ABBA
  2. Vittorio ALFIERI
  3. Dante ALIGHIERI
  4. Pietro ARETINO
  5. Cesare BECCARIA (conclusa)
  6. Giuseppe Gioachino BELLI
  7. Antonio CANOVA
  8. Giosue CARDUCCI
  9. Carlo CATTANEO
  10. Camillo Benso Conte di CAVOUR (conclusa)
  11. CLASSICI DEL PENSIERO ITALIANO
  12. CLASSICI GRECI E LATINI
  13. Benedetto CROCE
  14. Gabriele D'ANNUNZIO
  15. Giovan Battista DELLA PORTA
  16. Francesco DE SANCTIS
  17. Antonio FOGAZZARO
  18. Ugo FOSCOLO
  19. Giuseppe GARIBALDI
  20. Vincenzo GIOBERTI
  21. Carlo GOLDONI
  22. Antonio GRAMSCI
  23. Giacomo LEOPARDI (conclusa)
  24. Niccolò MACHIAVELLI
  25. Angelo MAI (conclusa)
  26. Alessandro MANZONI
  27. Giuseppe MAZZINI
  28. Vincenzo MONTI (conclusa)
  29. Ludovico Antonio MURATORI
  30. Giovanni PASCOLI
  31. Francesco PETRARCA
  32. Antonio ROSMINI
  33. Renato SERRA
  34. Torquato TASSO
  35. Bernardino TELESIO
  36. TESTI Umanistici
  37. Giovanni VERGA
  38. LEONARDO DA VINCI
  39. Alessandro VOLTA (conclusa)

maggiori info qui. --Xavier121 14:03, 6 dic 2014 (CET)

Aggiornamento lista opere 75% e 100%[modifica]

Come sapete, sto lavorando da poco ad una biblioteca digitale, e sto facendo esperimenti su come estrarre i dati da Wikisource per infilarli da noi. Nella mia totale ignoranza (ma conoscendo Wikisource) ho deciso che volevo saltare l'OAI-PMH perchè lavora soltando con le pagine Indice, e quindi lavorare direttamente con le pagine in ns0, andare a prendere i dati che mi servono e collegarle eventualmente all'EPUB generato e al suo Indice, se esiste. Il mio (orribile) codice è qui, e avrebbe sicuramente bisogno di una ripulita, ma sono riuscito ad ottenere circa 800 testi (come detto, prendo direttamente il ns0 così lavoro con i "testi" come l vede e li cerca l'utente, non con l'indice che spesso ha un nome diverso). Uno dei miei problemi, dunque, è come aggiornare i miei dati: se fra un mese volessi aggiornare con i nuovi libri e documenti riletti o anche solo al 75%, come posso trovarli? Fate conto che a me basta una lista di pagine, il mio script lavora prendendo i suoi input da una semplice lista in txt. Ho iniziato a guardare anche la lista di membri di determinate categoria via API. Aubrey (disc.) 14:02, 4 dic 2014 (CET)

Sì, la strada è quella: richiesta API di lista di testi appartenenti a una certa categoria. Purtroppo ci sono due problemi: le raccolte e la difficoltà di discriminare fra testi proofread SAL 75% e testi non proofread SAL 75%, che sono di natura assai diversa; ma a fini scaricamento epub, non è che cambi molto. Per le raccolte la questione è seria, perchè il vecchio uso di creare "opere principali costituite da un solo sonetto", per fare un esempio, ingarbuglia moltissimo le cose. Come riconoscere questi micro-testi? Bisognerebbe trovare un trucco di categorizzazione. --Alex brollo (disc.) 14:56, 4 dic 2014 (CET)
Al momento, a meno che non mi sia sbagliato, le raccolte non mi stanno dando problemi: io interpreto ogni singola poesia come un'opera a sè, e carico tutti i metadati di conseguenza. Certo, dovrei essere sicuro di caricare anche la raccolta in sè, come libro unico.
Per il resto, come hai capito subito è un problema di categorizzazione: io non riesco a discrminare fra testi con scansioni e testi senza, e questo non è ottimale. Anche perchè se potessi farlo mi concentrerei pi sui testi solo con scansione, che la comunità continua a immettere.
Con DynamiPageList non si riesce a fare niente?
Avevo anche pensato ad un feed RSS della Sezione Ultimi arrivi, se questo fosse possibile... --Aubrey (disc.) 15:05, 4 dic 2014 (CET)
Spetta un attimo. Come definisci un'opera? Una pagina principale in ns0, oppure un componimento autonomo? per me, un sonetto è un componimento autonomo; un libro della Bibbia è autonomo, una novella è autonoma, un canto dell'Inferno non è un componimento autonomo, nè è autonomo uin capitolo dei Promessi Sposi; un articolo scientifico è autonomo, una lettera di un epistolario vero è autonoma, la stessa lettera in un epistolario di fantasia non lo è :-). Se poi andiamo su Zibaldone, è un caso disperato :-) Non è detto che tutte queste cose siano "pagine principali", ovviamente. --Alex brollo (disc.) 17:13, 4 dic 2014 (CET)
Sono d'accordo con te sulle definizioni, ma tu sarai d'accordo con me che su Wikisource, l'unico modo di indicare che un componimento è autonomo + dargli dignità di pagina principale in ns0. Li trovo nella categoria 100%, per esempio, e per me è un buon punto d'inizio. --Aubrey (disc.) 23:36, 4 dic 2014 (CET)
Il problema è che non c'è, ancora, un modo per "marchiare a fuoco" in ns0 quello che va considerato "opera autonoma". Non possiamo basarci solo sul fatto (che è puramente "tipografico" e di comodità di gestione) che sia "pagina principale" o no; bisogna che il sistema di marchiatura sia indipendente, coerente, e applicato sistematicamente. Chiarito questo, ne vengono delle conseguenze: l'opera autonoma dovrebbe avere un elemento wikidata suo proprio; dovrebbe appartenere a una categoria "opere"; dovrebbe avere immediatamente accessibile un set di metadati minimi e dovrebbero essere presenti dei meccanismi che ne segnalino le incompletezze; la natura di "opera autonoma" di in testo dovrebbe idealmente essere evidente già dalla sola struttura del titolo. Penso che a te, bibliotecario, spetti il compito di proporre una serie di criteri per distinguere con sufficiente semplicità cos'è "opera autonoma" e cosa non lo è; al gruppetto di noi che con più o meno fatica si districa in categorie, template, Lua, dati semantizzati e cose del genere implementare ciò che serve per rendere questa definizione operativa in pratica; e poi a tutti noi, nessuno escluso, di comprenderla e applicarla. Altrimenti non ne usciamo.--Alex brollo (disc.) 09:16, 5 dic 2014 (CET)
PS: ho guardato la "wikina dedicata" al problema e ne sono rimasto atterrito! o_O Buon lavoro.... --Alex brollo (disc.) 09:50, 5 dic 2014 (CET)
La responsabilità posso anche prendermela, ma vorrei risottolineare ancora una volta che non esiste un criterio per definire, in assoluto, un'opera autonoma dalle altre. E' la storia di quel testo che la rende autonoma, quello che i suoi lettori pensano e decidono. questa è roba di filologia e italianistica, dovresti chiedere a Xavier o Edo più che a me. Giusto per rimarcare che non esiste un criterio, e secondo me, caso per caso, è la comunità che deve e dovrà decidere cosa fare. Come su Wikipedia. Purtroppo non vedo alternative.
Gli stessi bibliotecari lavorano con i documenti che hanno sottomano, con i testi, li catalogano così, e solo a volte decidono di usare paradigmi come FRBR o simili (posso assicurarti che la catalogazione è un mondo molto meno ordinato di quello che pens :-).
E' anche per questo che su Wikidata abbiamo così difficoltà: è difficile capire come fare le cose, cioè in parte "reinventarsi" (noi che non siamo catalogatori professionisti) delle regole di una disciplina che è obiettivamente complessa, non c'è nulla da fare.
Se vuoi che buttiamo giù dei criteri, posso fare un brainstorming e dire quello che segue
  • componimento autonomo è ciò che è può essere letto come testo autonomo, e ritenuto "assoluto" piuttosto che relativo alla raccolta/antologia di cui fa parte.
    • es. un capitolo di un romanzo è tendenzialmente relativo al romanzo, quindi non è un componimento autonomo.
  • possono essere ritenuti componimenti autonomi quei testi che storicamente o nella pratica dei lettori sono diventati assoluti e a sè stanti, anche se inizialmente erano nati come relativi.
    • es. il capitolo del Grande Inquisitore nei Fratelli Karamazov.

Aubrey (disc.) 10:52, 5 dic 2014 (CET)

Guarda che non mi interessa tanto che il criterio sia giusto ma che sia applicabile e venga applicato. Al limite mi andrebbe benissimo il seguente criterio: "È opera autonoma quello che decidiamo noi/che decide Aubrey" :-) il che, talora, sarà frutto di una decisione arbitraria: ma vorrei che questa decisione, arbitraria o no, fosse registrata esplicitamente in ogni pezzo di testo. L'importante è che tale criterio venga applicato e tradotto almeno in una categoria SI/NO, a cui poi dovrà seguire, appena si può, la creazione di un item wikidata opera con il suo gruppetto di metadati. Solo allora avremo la possibilità di fare un "elenco di opere autonome" e due sotto-elenchi di "opere autonome con metadati completi" e "opere autonome con metadati incompleti". Io guardo la cosa esclusivamente dal punto di vista dell' inserimento dei dati funzionale alla loro estrazione; nient'altro che questo. --Alex brollo (disc.) 11:12, 5 dic 2014 (CET)
Sono d'accordissimo con l'idea di una Categoria ad hoc. In realtà, ho sempre pensato che questa categorie fossero
Da quello che ho visto, queste categorie vengono generate dalle pagine Indice e dalle pagine "principali" in ns0. Prendiamo le poesie brevi come esempio. A Dante Alighieri: poesia breve in pagina principale; genera la categoria nascosta Categoria:SAL 100%. Odi civili/A Dante: poesia breve del tutto analoga, ma presente come sottopagina: non genera la categoria nascosta Categoria:SAL 100%.
Occorre trovare un modo per affermare che entrambe le poesie sono opere principali e appartengono alla stessa "famiglia", con pari diritti e doveri; a prescindere di come sia costruito il loro titolo, e senza riempire wikisource di redirect. --Alex brollo (disc.) 18:27, 5 dic 2014 (CET)
Lavorare con gli argomenti/tipologie nel template Instestazione?
Se si parla di poesie, saggi, antologie, sicamo quasi scuri che anche le sottopagine sono opere principali. Aubrey (disc.) 11:05, 6 dic 2014 (CET)
Ero arrivato alla stessa conclusione, ma più che Intestazione, il template chiave è IncludiIntestazione. E' nelle sottopagine che occorre distinguere le opere principali dalle sezioni/capitoli. Trasformandolo in Lua, il template potrebbe "leggere" tutto il codice della pagina in un lampo, e quindi generare delle "cose" tenendo anche conto del contenuto del template Qualità e della presenza del tag pages. Forse basterebbe "innestare" uno script Lua in IncludiIntestazione, per fargli generare delle categorie utili...Devo assolutamente fare un esperimento.... ma sono parecchio arrugginito in Lua! :-( --Alex brollo (disc.) 22:35, 6 dic 2014 (CET)

template:Tabella da inserire[modifica]

Ho emulato più esattamente che potevo {{Immagine da inserire}} nel nuovo template {{Tabella da inserire}}. In entrambi i casi, la presenza del template è incompatibile con un SAL superiore al 50%, ma non c'è ancora un automatismo che lo garantisca (però sarebbe bella cosa scovare il sistema per farlo). --Alex brollo (disc.) 17:17, 4 dic 2014 (CET)

PS: L'idea è di "tirare avanti" saltando a più pari le tabelle, sperando che prima o poi si trovi il sistema migliore per non impazzirci. Bisognerebbe affrontare la cosa con un "gruppetto di lavoro", magari aprendo una pagina dedicata, ma mi rendo conto che tutti siamo impegnati e che il problema è ostico; in più, il software Mediawiki non ci aiuta :-( . Un obiettivo iniziale sarebbe trovare un sistema per formattare in un colpo solo una colonna di celle (allineamenti, indentature) ma il software mediawiki non riconosce e non accetta il tag col : "The <col> tag is useful for applying styles to entire columns, instead of repeating the styles for each cell, for each row." [1]. Noi cadiamo nel caso instead, e questo è estremamente frustrante e complica enormemente il codice, fino a renderlo illeggibile! --Alex brollo (disc.) 10:00, 5 dic 2014 (CET)


Un problema di aiuto (epub)[modifica]

Ciao a tutti. Grazie all'indefesso lavoro di Margherita (Grazieee!) ho visto che sono arrivati al 100% in "Documenti principali relativi alla Strada Ferrata dell'Italia Centrale". Giusto adesso che mi serviva l'epub perché sta per uscire un libro sulla costruzione della Porrettana. Ho provato ipso facto a estrarne un epub. Incredibilmente ci sono riuscito. Ma ho incontrato un paio di piccole difficoltà che vi enumero così magari chi sa, sistema. Poca roba, sia chiaro, però.

Cliccando sul link si arriva direttamente alla pagina di conversione. Piccoli problemi:

- in alto mi è apparso un messaggio di errore:HTTP error: it.wikisource.org/w/index.php?action=render&title=Documenti_principali_relativi_alla_Strada_Ferrata_dell%26%2339%3BItalia_Centrale. (che magari errore non è (lo è? non lo è?) visto che poi sono riuscito a produrre il file ma che preoccupa, così d'amblé).

- il campo "Title of the page" non chiarisce come il titolo deve essere scritto. Inizialmente ho usato :"Documenti_principali_relativi_alla_Strada_Ferrata_dell%26%2339%3BItalia_Centrale" con gli underscore eccetera. Poi invece il titolo "normale" e ha funzionato.

- Ho anche avuto un problemino con i font (credo - perché nel secondo tentativo ho cambiato tutti i parametri senza fare prove "una alla volta").

Anyway, ne è uscito un prodotto buono (anche se con qualche spaziatura in eccesso o in difetto) L'ho anche trasformato in file .mobi essendo il proprietario di un kindle è anche qui non mi lamento della qualità.

Sommando le tire: Non pensate che -senza scomodare i creatori dell'utensile- sia meglio che alla pressione del link sulla pagina iniziale si passi a una paginetta sintetica di aiuto/spiegazione. del tipo:"qui scrivi così" qui clicca cosà) e, con dentro questa, magari scritto più grande, il link alla pagina di trasformazione? Certo non è necessario a quelli bravi ma io -che bravo non sono- lo avrei trovato utile. denghiù.Silvio Gallio (disc.) 09:52, 5 dic 2014 (CET)

Grazie Silvio. C'è un errore nel link, inizia con http:// mentre dovrebbe essere https:// oppure (meglio) //. Chi sa dove mettere le manine.... --Alex brollo (disc.) 10:05, 5 dic 2014 (CET)
Ho modificato {{epub}}, ci sono altri "link generatori" in giro? --Alex brollo (disc.) 10:08, 5 dic 2014 (CET)
Uhm! Alex Non so che generatore hai toccato e so che hai un sacco da fare; ma mo' è peggio! Cliccando quel link il computer ci pensa su un bel po' (adesso ho una superbanda sui 65/80 Gb!) poi mi appare "https://wsexport.wmflabs.org/tool/book.php?lang=it&format=epub&page=Documenti+principali+relativi+alla+Strada+Ferrata+dell%26%2339%3BItalia+Centrale" e l'avviso "La pagina web non è disponibile" :PP.
Comunque quello che "chiedevo" io era un passaggio in più (di help) che spiegasse un paio di cose poco immediate. Mah!Silvio Gallio (disc.) 12:11, 5 dic 2014 (CET)
Ho rollbackato la modifica. Normalmente non dovrebbe apparire niente da pigiare: dovrebbe semplicemente scaricare l'epub, senza chiedere nulla. --Alex brollo (disc.) 14:51, 5 dic 2014 (CET)
Forse ho trovato: il nome della pagina viene codificato con urlencode nel template (e non funziona), con una codifica tipo PAGENAMEE nel link in sidebar (che funziona). Ho inserito PAGENAMEE nel template, e finalmente il link che produce è identico a quello della sidebar: ed essendo identico, mi sembra che funzioni. Prova Silvio! --Alex brollo (disc.) 18:08, 5 dic 2014 (CET)

Alex sei grande! In effetti adesso ho scaricato un altro libro ed è partito tutto in automatico. Grazie! Ho fatto anche un po' di pubblicità in giro. Peccato solo che il marchingegno utilizzi il "logo" della Source francese ... 10q!

Un secondo Primo Levi[modifica]

Cari amici,

mi serve un aiuto a ricordare come regolarsi in caso di ominimia: alla pagina Pagina:Opere (Dossi) I.djvu/31 occorre attribuire un brano a un PRIMO LEVI diverso dal Primo Levi oggi più moto, ma che non meno di esso ha diritto alla pagina autore (tant'è vero che del primo abbiamo appunto un testo, mentre per il secondo avremo da attendere ancora molti anni...). Come li disambiguiamo questi autori? La questione è importante perché poi occorrerà agire su pagine e categorie che puntano al Primo Levi più recente. - εΔω 09:06, 6 dic 2014 (CET)

Col parametro disambigua del template autore. Io utilizzerei "Autore:Primo Levi (giornalista)". --Accurimbono (disc) 10:52, 6 dic 2014 (CET)
Intanto ho creato un elemento wikidata base per Primo Levi (giornalista). --Alex brollo (disc.) 13:24, 6 dic 2014 (CET)
L'elemento Q18606682. --Accurimbono (disc) 16:00, 6 dic 2014 (CET)

Trova e sostituisci: opzione Ricorda[modifica]

Sto cercando di riattivare l'opzione Ricorda del tool Trova e Sostituisci. Al momento NON è una memoria "specifica per opera", ma generica (agisce su tutte le opere nella stessa maniera). Le sostituzioni memorizzate vengono invocate da postOCR. La cosa più difficile è modificare quello che è stato memorizzato: al momento, la procedura è riservata ai soli utenti che non si disperano all'idea di dover aprire la console javascript. Per questi utenti coraggiosi, il dato importante è che le modifiche memorizzate stanno in localStorage.memoRegex e ogni modifica a questa variabile (compresa la cancellazione) diventa immediatamente attiva.

Adesso torno su Fisiologia vegetale e provo a stressare il meccanismo :-) --Alex brollo (disc.) 14:51, 6 dic 2014 (CET)

Per il problema di scaricare o caricare i dato di localStorage.memoRegex basterebbe creare due pulsanti rispettivamente di "caricamento" e "scaricamento" del contenuto su una pagina come questa di esempio/di prova: Utente:Alex_brollo/PersonalRegex. Che dite, procedo? Alex brollo (disc.) 07:53, 7 dic 2014 (CET)


Grazie Xavier, procedo. Per consentire di salvare sulla pagina scelta come "ripostiglio delle regex" serie di sostituzioni diverse (come può servire lavorando contemporaneamente a più opere) i due pulsanti agiranno sulla selezione quindi:
  1. per attivare/caricare un set di sostituzioni, entrare nella pagina in modalità modifica, selezionare il set, premere il pulsante "carica Regex";
  2. per salvare/scaricare il set di sostituzioni attivo, entrare nella pagina, selezionare ciò che va cancelato o sistemare il puntatore in un punto adatto, e premere "salva Regex";
  3. per modificare il set di sostituzioni attivo, salvarlo come al punto 2, modificarlo (con estrema attenzione alla punteggiatura e alle virgolette!!), ricaricarlo come al punto 1. --Alex brollo (disc.) 17:03, 7 dic 2014 (CET)

Aggiornamento[modifica]

Sto "stressando" la cosa su Indice:Eneide (Caro).djvu, a me funziona (le modifiche sono esportate in Discussioni indice:Eneide (Caro).djvu, ma Xavier121 mi segnala che non solo non funziona, ma che postOCR risulta malfunzionante :-(. Urgono altri feedback! Alex brollo (disc.) 00:32, 9 dic 2014 (CET)

Xavier mi segnala che il problema sembra risolto. L'uso dell'opzione "Ricorda" è opzionale :-P : se non vi va di trascinarvi dietro correzioni automatiche che scattano anche dove sarebbe meglio che non lo facessero, e non avete tempo/voglia di imparare come modificarle, evitate di attivare l'opzione e non avrete grattacapi. --Alex brollo (disc.) 16:18, 9 dic 2014 (CET)

Test per Aubrey[modifica]

Ho innestato su IncludiIntestazione un banale script Lua che genera categorie tipo Categoria:Testi proofread SAL 75% e simili. E' solo una prova! Ma la cosa interessante è che lo script legge il codice della pagina e - stando nel template IncludiIntestazione - rovista nel testo alla ricerca di un tag pages e se c'è nel codice del template Qualità - cosa che con i normali template è assolutamente impossibile. Potrebbe essere la strada per la "quadratura del cerchio" del problema che Aubrey sollevava qualche messaggio fa. Non appena avrete visto il risultato e ne avremo parlato, occorre rollbackare IncudiIntestazione e tutto svanirà... per essere eventualmente sviluppato con calma. --Alex brollo (disc.) 23:36, 6 dic 2014 (CET)

scusa alex, non ho capito dove dovrei guardare...--Aubrey (disc.) 14:03, 7 dic 2014 (CET)
Se ho capito bene, non basta, perchè per esempio comprendi testi del genere: Adelchi/Atto_quinto/Scena_VI che non sono indipendenti... --Aubrey (disc.) 15:08, 7 dic 2014 (CET)
Mi sono spiegato male: questo è il primo passo, la "prova di fattibilità". E' già una cosa sorprendente che un "template" generi una categoria da dati sparpagliati nel codice della pagina. Se il dato "opera principale" ci fosse in un anfratto qualsiasi del codice, e potesse essere letto, adesso lo script potrebbe produrre le categorie delle opere proofread per SAL nelle sottopagine; ma siccome questo dato non esiste, bisogna elaborare una strategia per ficcarcelo. --Alex brollo (disc.) 16:32, 7 dic 2014 (CET)
Ho chiuso il test; adesso che sappiamo come fare, bisogna solo immaginare il metodo più astuto per registrare nelle pagine ns0 (una per una!) il dato "Questa è un'opera autonoma". E' aperto il concorso di idee su come farlo :-) --Alex brollo (disc.) 01:42, 8 dic 2014 (CET)

Fonte libro[modifica]

Si può usare come "fonte immagine" di un testo una edizione digitale gratuita moderna coperta non libera di un testo libero? Immagino di no. Mentre invece il solo testo trascritto sì, giusto? --Emanuele676 (disc.) 00:27, 8 dic 2014 (CET)

La cosa è delicata; bisogna "estrarre" dall'edizione il puro testo originale, escludendo tutto quello che è stato aggiunto da editore, revisori, ecc (es. note, introduzioni, immagini.... per non parlare delle traduzioni, ovviamente, che costituiscono un'opera autonoma). E comunque non sarebbe più una "fonte immagine" da una "fonte testo/fonte opera". Dando la precedenza alle opere proofread, con le immagini a fronte, da un po' di tempo evitiamo questo tipo di caricamenti; e anche evitandoli, non ci manca il lavoro :-) --Alex brollo (disc.) 01:39, 8 dic 2014 (CET)
Quindi anche estraendo solo il testo originale, levando tutte le aggiunte, non si possono caricare le immagini ma solo trascrivere il testo? --Emanuele676 (disc.) 10:12, 8 dic 2014 (CET)
Se non esiste la possibilità di pubblicare le scansioni del libro (le immagini), perchè in parte coperte da copyright, non si può eseguire la procedura proofread. Tutto qui. Tempo fa ho iniziato un progetto, il caricamento di Rivista di Cavalleria; mi sono accorto che le scansioni pubblicate su Internet Archive erano state mutilate delle immagini - per qualche strano motivo, erano state rimosse dalle scansioni perchè non libere. Ho abbandonato il progetto. --Alex brollo (disc.) 21:13, 8 dic 2014 (CET)
Quindi se levo tutto l'editoriale e le aggiunte, lasciando solo il testo libero, posso caricarlo? --Emanuele676 (disc.) 21:43, 8 dic 2014 (CET)
Penso di sì; LiberLiber lo fa comunemente (prende il puro testo originale di opere libere stampate su edizioni recenti). Se ci dici di cosa si tratta precisamente, forse i nostri esperti di copyright (io zoppico) possono darti una risposta conclusiva. --Alex brollo (disc.) 00:28, 9 dic 2014 (CET)
Ti ho inviato una email --Emanuele676 (disc.) 01:00, 9 dic 2014 (CET)

Opere come template... filosofia della transclusione[modifica]

Cari amici,

questa discussione potrebbe creare emicranie e coinvolgere discussioni in corso perciò prepariamoci.

Tutto parte da Sui sepolcri (Torti), dove mi sono accorto che le medesime pagine dell'edizione proofread sono transcluse anche in Dei sepolcri (Bettoni 1808)/Epistola sui sepolcri (Torti). Questa situazione concentra almeno due problemi senza risposta:

  1. opportunità della sottopaginazione nelle antologie: se in questo caso l'opera fa parte di una antologia tematica è il caso di sottopaginare le opere dell'antologia (a mio parere no). Come definire questo in termini concettuali per wikidata?
  2. opportunità della transclusione multipla si noti che la transclusione non è un problema in sé: una volta che la pagina sia riletta la buona qualità della trascrizione può produrre molte transclusioni tutte di buona qualità, come accade normalmente per i template, peccato che questo implichi che le operazioni manuali legate al luogo di transclusione (nel caso specifico la gestione del SAL) non sia automatica e dunque una medesima opera sia SAL 100% da una parte e non lo sia da altre. Nel caso specifico di Torti me ne sono accorto, ma non è scontato. A quali condizioni è opportuna la transclusione multipla di una medesima opera in più luoghi?

Sotto con le riflessioni. - εΔω 09:52, 8 dic 2014 (CET)

Direi che il problema 1 è esattamente quello di cui ci stiamo provando ad occupare io e Alex poco più su, cioè cosa significa essere un "componimento autonomo" (come dice Alex). Il punto è che questo è negli occhi di chi guarda, e tendenzialmente quindi negli occhi della comunità (i nostri) che all'uopo possiamo decidere se una cosa è ragionevolmente autonoma (un saggio, una poesia, una prefazione diventata talmente famosa da essere studiata a sè (es. la prefazione di Calvino al Sentiero dei nidi di ragno)(o esattamente questa che riporti)
Siamo nella fase in cui noi stessi non abbiamo una "chiarezza logica", non sappiamo bene come intendere le cose fra di noi. Wikidata è ancora un passaggio successivo, secondo me (ovviamente la chiarezza logica aiuta a preparare l'implementazione). C'è una discussione molto simile anche in wikisource-l, giusto ieri: partecipate!
il problema 2 non mi preoccupa, perchè è talmente eccezionale che decideremo caso per caso. Se il testo è lo stesso, possiamo transcluderlo in parti diverse. Sinceramente non me ne preoccuperei (a meno che non stia vedendo un caso frequente e problematico). --Aubrey (disc.) 10:15, 8 dic 2014 (CET)
Mah, il caso 1 - non credo richieda necessariamente che l'opera autonoma sia "famosa".- Esempi ne ho trovati un sacco e qui ne ho prodotti io. Molti degli articoli a carattere ferroviario sono apparsi in varie edizioni. Ora se un articolo di Cattaneo (o peggio di un autore meno "famoso") appare negli Annali assieme ad altri non è "autonomo"? E se lo stesso testo viene stampato in pamphlet (accadeva di continuo a metà ottocento) è "più autonomo"?
Quanto alla transclusione direi che -premesso che il testo da transcludere sia esattamente uguale in tutti i casi se no non vale :) - io la effettuerei usando testo e il SAL migliori senza tanti problemi. Il caso 2, comunque, non è affatto eccezionale. Da un paio di anni qui abbiamo l'opera Delle strade ferrate italiane e del miglior ordinamento di esse di Ilarione Petitti che in allegato riporta leggi o documenti che erano già presenti su wikisource e che qualcuno ha (giustamente) già transcluso. Lo stesso si può dire di Memorie dell'ingegnere Giovanni Milani che contiene due articoli di cui uno in "duplice copia". Bye! Silvio Gallio (disc.) 11:06, 8 dic 2014 (CET)
My2cents: Secondo me dovremmo riprodurre fedelmente il testo scansionato, senza fare lo spezzatino, IMHO senza MAI fare lo spezzatino. Un libro=Un testo in NS0. Semplice e lineare. --Accurimbono (disc) 17:35, 8 dic 2014 (CET)


Anch'io sono contrario alla spezzatino. Per le opere "autonome" procederei come mi è capitato di trovare in alcune schede delle biblioteche: "Opera famosa" è contenuta in "Raccolta Tal dei Tali". Quindi se la stessa opera è transclusa da più fonti basterà aggiungere il link, e lo spezzatino diventa uno schedario. --Luigi62 (disc.) 17:52, 8 dic 2014 (CET)
Per chi volesse fare una prova segnalo questo: L'ultima ora di Venezia e Pagina:Patria Esercito Re.djvu/45. --Luigi62 (disc.) 18:00, 8 dic 2014 (CET)
Confermo che il problema 1 è esattamente quello che stiamo discutendo con Aubrey, non dispero di trovare una soluzione per il 90% almeno dei casi dal punto di vista "logico": le singole poesie sono opere autonome, come le singole novelle, le lettere originali, gli articoli. Ovviamente lo sono anche le opere maggiori: i poemi,i romanzi, i saggi eccetera. Le cose si complicano un po' per le parti di opere: tipico caso, alcune antologie, in cui possono essere riportati brani o punti salienti di un'opera, e ci saranno di certo altri casi ancora; ma sono pochi. Deciso il criterio logico, si tratta di realizzare la sua implementazione tecnica, e qui ci sarà da lavorare un po' da parte di tutti (per farsi venire una buona idea) e da parte dei geek (per implementarla).
Riguardo il problema 2, direi che è solo tecnico. Si tratta di scovare un modo per assegnare automaticamente il SAL di una transclusione basandosi sul SAL delle pagine sorgente; certo, anche nel realizzare il codice di transclusione c'è un po' di lavoro, e questo lavoro ha una qualità da registrare (non si può dare un SAL 100% a una transclusione con un codice di transclusione difettoso), ma più andiamo avanti nell'automatismo, meno conta il "SAL aggiunto" proprio di ns0.
Un caso molto particolare è di nuovo il rebus Zibaldone, in cui sono contenute delle opere vere e proprie, che potrebbero essere "ricucite" per transclusione selettiva. I pezzetti di queste opere sono sparpagliati uno qua e uno là nei sette volumi, ma Leopardi stesso ci fornisce il "codice di transclusione" nei suoi Indici: e noi possiamo attuare quelle direttive, con un metodo che Leopardi non poteva immaginare, ma che oggi è possibile. Una cosa affascinante.... e un bel caso in cui la "transclusione multipla" va assolutamente effettuata.... con calma. ;-) --Alex brollo (disc.) 21:33, 8 dic 2014 (CET)
Proposta operativa: infilare la parola banale chiave opera nel parametro (per ora opzionale) argomento di IncludiIntestazione in tutte quelle sottopagine che decideremo che devono essere considerate opere autonome. Da qui potrebbe partire una eccellente categorizzazione (interna nel codice template o esterna con un modulo Lua), non solo: sarebbe l'occasione per aggiungere dei buoni ulteriori dati nel parametro argomento, attualmente un po' trascurato in IncludiIntestazione. --Alex brollo (disc.) 23:01, 8 dic 2014 (CET)
La proposta operativa di Alex è sensata, ma mi preoccupa (soolo un pochino) il fatto che non abbiamo davvero un albero di argomenti... Possiamo provare ed andare a buonsenso, tanto è una cosa che neanche i bibliotecari hanno davvero risolto o risolveranno mai (l'unica soluzione è tentare la classificazione Dewey, ma poi dovremmo trovare il modo di associare ogni nostro libro con la Dewey...). Anyway, ci si può provare.
Per quello che riguarda lo "spezzatino", non abbiamo più forme di spezzatino? Non vorrei che ci confondessimo.
Ogni tanto ci è capitato di trovare un testo in Indice che ha diversi testi che mandiamo in ns0 diversi. Secondo me è abbastanza sensato (soprattutto se il testo in Indice è un'antologia) e non vedo grossi problemi, anche se capisco le ragioni di chi dice un testo Indice, un testo ns0.
Io credo che il nostro obiettivo sia il fatto di rendere un servizio al lettore: cioè che il lettore ci trovi in fretta, da Google o direttamente dentro Source. Che ci legga bene. Che usi i nostri rimandi ipertestuali. Questo viene fatto nel ns0, e posso dirvi che in queste settimane mi sto ammattendo cercando di scaricare i metadati delle nostre opere, ma andare soltanto con le opere Indice è controproducente, mentre il ns0 è molto più difficile ma dà grandi soddisfazioni.09:34, 9 dic 2014 (CET)Aubrey (disc.)
Anch'io sono fautore di "un indice, un testo ns0" ma con una sfumatura diversa: "ad ogni pagina indice, una pagina ns0 corrispondente alla pagina indice". Ma, data questa pagina ns0 "chiave" che corrisponde alla pagina Indice e che quindi corrisponde in pieno alla edizione, poi l'ulteriore spezzettamento è IMHO libero. Da tempo seguo questo principio e, fatta la pagina ns0 "chiave", poi creo una miscela di pagine principali e di sottopagine per le opere complesse (più opere di uno stesso autore, più opere di diversi autori).
Per quanto riguarda l'albero degli argomenti: ci siamo incastrati sul concetto di "argomento", potremmo usare il parametro per un concetto più ampio e più utile: "tipo di opera" o meglio ancora "parole chiave". Passando a Lua, l'elenco di queste "parole chiave" potrebbe diventare di lunghezza indefinita. L'importante è che le parole chiave non siano libere, ma siano comprese dentro un elenco ben definito (aggiornabile ma solo a livello di sysop o di utenti esperti); e che il tentativo di inserire parole chiave non comprese dall'elenco produca un messaggio di errore e sia rifiutato. --Alex brollo (disc.) 12:06, 9 dic 2014 (CET)
Aperta una pagina (senza pretese, giusto per fissare le idee, se non serve la lasceremo morire): Progetto:Trascrizioni/Parole chiave nel parametro argomento. SE vi va l'idea di cominciare a raccogliere parole chiave standard, quella potrebbe essere una pagina adatta. Tenete conto che se vogliamo fare una cosa perfetta, non la faremo mai :-) --Alex brollo (disc.) 15:55, 9 dic 2014 (CET)
Arrivo anch'io. Più sopra OrbiliusMagister si dichiara contro lo spezzatino, e dice: "una volta che la pagina sia riletta la buona qualità della trascrizione può produrre molte transclusioni tutte di buona qualità". Io sono d'accordo in principio, ma mi sembra che si dimentichi che la filosofia di Wikisource finora non è stata quella di trascrivere Opere, quanto di trascrivere Edizioni. Per cui transcludere pezzi di "libri" da una parte all'altra può creare dei problemi, perché non è detto che tutte le versioni siano identiche fra loro. Manca insomma quello di cui parla Karen Coyle qui: http://kcoyle.blogspot.com/2012/04/digital-urtext.html, il concetto di UR-DIGITAL-TEXT, di testo digitale assoluto e univoco a cui collegare tutte le varie manifestazioni, le varie edizioni, ecc. Io propongo di fare una cosa semplice semplice: si crea una pagina contenitore per ogni Opera (ad es.: i Promessi Sposi) nella quale vi si elencano tutte le pagine di tutte le varie edizioni. Per incominciare. Poi sarebbe figo riuscire a fare qualcosa tipo un mega "diff" di tutti i testi, in modo da ottenere un unico testo UR, e da lì evidenziare soltanto le varianti tramite, appunto, dei diff. -- Pepato (disc.) 22:56, 10 dic 2014 (CET)
Un'idea pepata. Tu hai partecipato alla discussione (aimè ibernata, ma era malmatura) sul problema delle pagine "Opera", nata per allinearci allo schema work-edition su wikidata? O si tratta di una "convergenza evolutiva"? --Alex brollo (disc.) 08:17, 11 dic 2014 (CET)
Sono capitato qui in medias res, come in tutte le mie esperienze wiki, con quasi zero consapevolezza del dibattito precedente. Quindi credo di non sapere di cosa stai parlando ;) -- Pepato (disc.) 09:01, 11 dic 2014 (CET)

Gestione delle edizioni multiple: definiamo![modifica]

Cari amici,

è ora di definire con chiarezza come gestire le edizioni multiple di una medesima opera: un primo esempio che direi fa da battistrada è la versione live dei Promessi sposi. Proviamo a finalizzare l'opera in una serie di operazioni pratiche e di linee guida.

Per come la vedo io la sequenza operativa prevede tre fasi

  1. un elenco di testi presenti in versioni multiple
  2. Uno schema di pagina "di aggregazione e disambiguazione" con template e categorie apposite e una forma standard che appaia leggibile e carina sia in casi complessi come quello di Manzoni che a casi semplici.
  3. L'applicazione dello standard definito nella seconda fase all'elenco dei testi raccolti nella prima fase.

Le prime due fasi possono svolgersi in parallelo, ma la terza può partire solo su basi solide, con criteri validi anche in futuro.

Mi piace :-), a partire dalla brillante idea della "discussione transclusa".
Riguardo al punto 1: hai un'idea su come pescarle tutte? Andiamo "a memoria"?
Riguardo al punto 2: proporrei di partire dalla conferma degli standard di struttura dei titoli, e di applicarla in questo "caso complesso" anche se occorrerà rinominare migliaia di pagine; sia in ns0 che in ns Indice e Pagina. Se troviamo uno standard che faciliti anche la gestione del successivo "maneggiamento", la cosa ci sarà utile in questo caso complesso, ma anche nei più frequenti "casi semplici"; e proporrei subito di adottare integralmente lo standard francese. --Alex brollo (disc.) 07:04, 11 dic 2014 (CET)
Per il punto 1, secondo me andiamo a memoria. Il Principe, I Sepolcri, la Bibbia... tutti libri importantissimi :-). Ricordiamoci poi sempre del Wikisource:Canone...
Al momento (fate conto che io ho appena fatto una ricognizione di tutte le opere in ns0 al 100%) lo standard per le versioni multiple è

--Aubrey (disc.) 10:11, 11 dic 2014 (CET)

Scusa ma non ho capito lo standard che indichi. I promessi sposi 1840 è un'opera sola, non è connessa con "le varie versioni dei PP". Forse non ho capito a cosa ti riferisci. In ogni caso io pensavo a una cosa molto grezza, ditemi voi se è fattibile in WS: una pagina intermedia del tipo "Il Principe di Machiavelli", identificata in qualche modo (con un namespace particolare?) che non contiene altro che la lista delle versioni presenti. Quindi un conto è una pagina tipo disambiguazione (I Sonetti, che comprende i titoli omonomi di opere diverse) mentre un conto è una pagina di raccolta di tutte le varianti di un'unica opera (work). -- Pepato (disc.) 11:15, 11 dic 2014 (CET)
Anch'io con Alex alla francese: partiamo dal titolo per togliere ogni possibilità di confusione (a breve esempio sulle 7 edizioni delle Operette Morali).
schema: Leopardi - Operette morali, Stella, 1827.djvu; Leopardi - Operette morali, Piatti, 1834.djvu ecc. si potrebbe usare il parametro editore prima della data solo nei casi di ed. dello stesso anno (caso Manzoni quando nel '27 sono state autorizzate diverse ristampe della Ferrario, senza significative variazioni). Io sono per mantenerlo SEMPRE. --Xavier121 13:28, 11 dic 2014 (CET)
Se parli dell'elenco di edizioni alternative da indicare nella pagina-contenitore, sono d'accordo nel tenere l'editore - anzi, mi sembra ovvio il cercare di dare più dettagli possibile: in fondo si tratta proprio di un volume diverso quindi è giusto descriverlo con completezza. Io però continuo a non capire come creare la pagina contenitore, dove metterla, come nominarla. -- Pepato (disc.) 15:27, 11 dic 2014 (CET)
A suo tempo, avevamo ipotizzato di creare pagine Opera: e ne avevamo anche fatta qualcuna. Si tratta semplicemente di pagine in ns0 che iniziano con Opera: (ne trovi parecchie create per gli esperimenti di aggancio con gli item "work" di wikidata). In teoria, il posto giusto per elencare le edizioni sarebbe proprio una pagina Opera: ; ma a suo tempo l'esperimento non è riuscito (verosimilmente per non creare una ulteriore "particolarità" di it.source, poi difficile da correggere) e quindi mi rimetto alla vostra decisione. --Alex brollo (disc.) 16:39, 11 dic 2014 (CET)

Io credo che le possibilità siano praticamente 2:

  • mettere la pagina-opera come in I promessi sposi, cioè nel titolo più comune, come se fosse una pagina di disambigua.
Il conflitto potrebbe crearsi quando per esempio abbiamo sia varie edizioni per un'opera, sia altre opere con lo stesso nome. Si potrebbe risolvere abbastanza facendo una pagina di disambigua che poi rimanda all'opera...
  • metterla in un namespace apposito (anche finto) come Opera:I promessi sposi.

Gli esempi che avevo fatto prima erano per differenziare le singole edizioni:

Mi piace l'idea di Aubrey, trovo sensato creare una pagina-opera come in Promessi Sposi e identificarla con un ns adatto, come Opera: . Mi sembra una cosa banale per poi collegarla con il "work" di FRBR in Wikidata. Solo non ho capito quali sono le controindicazioni nel fare questo. Perché Alex dice che il progetto non è riuscito? Perdonate la mia acerbissima comprensione di certi meccanismi di WS, sono ancora molto confuso. -- Pepato (disc.) 20:00, 11 dic 2014 (CET)
it.source è una "fucina di idee", è normale che alcune camminino e molte si rivelino vicoli ciechi. Il progetto delle pagine Opera: era interessante ma forse prematuro; inoltre rischiava di farci prendere una strada diversa da quella delle altre wikisource, meglio aspettare che la polvere si depositi e che emergano soluzioni condivise fra più progetti. La questione opere/edizioni è molto più complessa di quello che pare a prima vista, le soluzioni possibili sono diverse. --Alex brollo (disc.) 23:40, 12 dic 2014 (CET)
Proporrei di usare come nome della pagina Opera, ove possibile, il label italiano dell'elemento work di wikidata (+ eventuale suffisso disambigua). Se non c'è ancora l'elemento work, di crearlo immediatamente, contestualmente alla creazione della pagina Opera: . --Alex brollo (disc.) 12:37, 15 dic 2014 (CET)

Convenzione 1: nomi delle opere, delle loro suddivisioni, delle pagine Indice[modifica]

Ce la facciamo a fissare lo standard per la denominazione dei file relativi alle opere? Che ne dite di applicare tutte, o quasi tutte, le convenzioni degli amici francesi (come già abbiamo proposto) che trovate qui:? Chi è francofono, si studierebbe la pagina per verificare se possono essere prese di peso tal quali o sono necessari aggiustamenti? Vi segnalo una minuzia ma che in passato mi ha causato belle cefalee. Se il titolo contiene apostrofi, che apostrofo usiamo, il dattilografico o il tipografico? --Alex brollo (disc.) 23:45, 11 dic 2014 (CET)

Dattilografico, cioè quello delle tastiere. (Accessibilità è il nostro primo pensiero: nel nome della pagina dattilografico, nel titolo dell'opera se vogliamo anche il tipografico). --Aubrey (disc.) 09:57, 12 dic 2014 (CET)
Concordo con Aubrey. -- Pepato (disc.) 10:01, 12 dic 2014 (CET)
E allora questa sarà la prima deviazione dalle convenzioni degli amici francesi ;-), i quali invece hanno un tool per la trasformazione dattilografico->tipografico che agisce quasi su tutto il testo (esclusi i markup per italico e grassetto e i tag math), titoli e link compresi, mentre noi dobbiamo sudare per fare la stessa trasformazione talora sì, talora no. --Alex brollo (disc.) 15:28, 12 dic 2014 (CET)
Allora riformulo: optiamo per qualcosa che faccia fare meno lavoro agli utenti e più alla macchina. IMHO il dattilo è più facile da usare e da inserire, mentre il tipo è più giusto e bello da avere nel testo. Quindi se gli utenti possono liberamente usare quello che hanno sulla tastiera, mentre il bot sostituisce tutto, a me va bene. -- Pepato (disc.) 13:39, 15 dic 2014 (CET)

Problema: edizioni e versioni/stesure[modifica]

I livelli "edizione" e "versione/stesura" non coincidono; caso ben noto Fermo e Lucia/I promessi sposi, diversi fra di loro ma definiti comunque due stesure di una stessa opera. In altri casi le versioni differiscono di meno. Cosa facciamo? Unifichiamo i due concetti "versione/stesura" e "edizione" o no? --Alex brollo (disc.) 23:53, 11 dic 2014 (CET)

Ti sei già risposto: poiché non coincidono, non li unifichiamo. Quelle che tu chiami "versioni" o "stesure" sono di fatto due opere diverse (ad es. i Promessi 27 e i Promessi 40). Le "edizioni" sono rielaborazioni della stessa opera che spesso sono identiche nel testo ma differiscono nel paratesto e nell'apparato critico (es. di fantasia, i Promessi di Sansoni 1890 e di Sonzogno 1920), mentre talvolta contengono varianti più o meno documentate (v. il caso di Machiavelli). Credo che il primo passo sia unire le edizioni, ovvero le manifestazioni fisiche dell'opera che sono state digitalizzate. Il secondo sia quello di ricondurre questi raggruppamenti a una storia più generale dell'opera. Tra l'altro immagino che nella storia della letteratura un caso come quello dei Promessi sia raro, sicuramente più raro del succedersi di versioni editoriali diverse. -- Pepato (disc.) 08:43, 12 dic 2014 (CET)
La domanda aveva un risvolto pratico. Una volta creata una pagina "opera", ci elenchiamo dentro tutte le stesure/versioni/edizioni (magari tenendole in gruppi separati, ma tutti dentro la stessa pagina) oppure creiamo pagine separate (e allora per quanto sottile la differenza fra "stesura/versione" e "edizione" diventa critica)? Secondo voi, oggi, su wikidata, Fermo e Lucia e I promessi sposi hanno elementi opera distinti o convergono sullo stesso elemento opera? ;-) --Alex brollo (disc.) 15:48, 12 dic 2014 (CET)

Convenzione 2: usare pagine Opera: come da proposta di Aubrey[modifica]

Siamo d'accordo di usare pagine Opera: per elencare le diverse edizioni, come suggerito da Aubrey, lasciando per ora in sospeso i pochi casi controversi come Fermo e Lucia vs I promessi sposi? Propongo di votare. --Alex brollo (disc.) 12:27, 15 dic 2014 (CET)

Prove di una prima applicazione[modifica]

Visto che Il Principe e le sue edizioni sono state oggetto di una interessante osservazione di Minsenti (che parte da un libro di Adriano Sofri) nella mailist bibliotecari di Wikimedia, ho provato ad applicare proprio a questa opera uno schema di disambiguazione delle diverse edizioni come ce l’avevo in mente, guardate i seguenti:

  • Opera:Il Principe che contiene tutte le edizioni disponibili su Wikisource o scansionate liberamente accessibili su siti web esterni come GB o IA. La pagina contiene anche la sezione Altri progetti di collegamento con Wikipedia, Commons e gli altri progetti fratelli di Wikimedia.
  • Il Template:Edizioni (che ha parenti in en.source e fr.source) da includersi nelle pagine Opera, analogo al template Disambigua (uno per diverse edizioni di una stessa opera, l’altro per diverse opere con nome simile)
  • La Categoria:Edizioni multiple che raccoglie tutte le pagine Opera
  • La pagina Autore:Niccolò Machiavelli in cui vengono elencate (transcluse automagicamente) tutte le edizioni elencate nelle singole pagine Opera.
  • Il template Altre edizioni (analogo a quello di en.wiki) che rimanda con un link dalla singola edizione alla pagina Opera che elenca le altre edizioni.

La pagina Opera è stata connessa all’elemento Wikidata dedicato all’opera (d:Q131719) per cui dall’articolo su Wikipedia (o Wikiquote e gli altri progetti Wikimedia), tramite il tl interprogetto in Altri progetti, si arriva alla pagina Opera e da questa il lettore può scegliere l’edizione che più gradisce.

Che ne pensate? Alcuni dettagli sono da migliorare, ma a me sinceramente piace molto!-Accurimbono (disc) 20:32, 17 dic 2014 (CET)

Mi piace moltissimo, complimenti! Ottimo lavoro. Propongo alcuni suggerimenti:
  • separare le edizioni incluse in Wikisource da quelle esterne (i.e. Google Books, etc.), mi sembra più chiaro
  • mi chiedo se il paragrafetto introduttivo sia davvero necessario: comporta uno sbattimento minimo a chi lo scrive, e finirebbe per riportare generiche informazioni che sarebbe più utile cercare direttamente in Wikipedia (magari con un rimando). Mi rendo conto però che senza di esso la pagina risulterebbe anonima e in alcuni casi poco chiara.... Che ne pensate?
  • ora il lavoro grosso è concettuale. Occorre identificare e definire le opere per cui va creata la pagina. Ad es come disambiguiamo le opere omonime (I sepolcri, I sonetti, ecc.). Inoltre qual è l’unità dell’opera? La poesia L’infinito è un’opera di Leopardi, che però finora non è mai esistita, sia editorialmente sia culturalmente, separata dai Canti. Io personalmente darei dignità di opera all’unità più piccola, e la includerei a sua volta in un’opera più grande (Si può includere un’opera con template Edizione in un’altra opera con lo stesso template?) Dal punto di vista bibliografico, non so come la teoria biblioteconomica abbia risolto concettualmente questo problema. Magari posso portare questa discussione in lista. Direi che è un ottimo risultato, complimenti a Accurimbono!- Pepato (disc.) 20:50, 17 dic 2014 (CET)
Grazie, ti rispondo brevemente che devo scappare:
1) Ci avevo pensato anche io, poi nell’esempio ho preferito mantenere l’ordine cronologico anche per permettere la transclusione nella pagina Autore, ma può essere giusto dare maggior evidente alle edizioni interne Wikisource e separare quelle esterne.
2) Un minimo di introduzione (facoltativa) credo che non guasti, senza dilungarsi troppo, magari sottolineando la storia editoriale di un’opera, quando ci sono edizioni rilevanti o cambiamenti da far notare.
3) In prima battuta guardiamo cosa hanno fatto in Wikipedia, poi credo che mano a mano riusciremo a decidere per ciascuna opera, ma una regola generale la vedo difficile.
Ora scappo che ho un impegno. A domani, ciao,-Accurimbono (disc) 20:55, 17 dic 2014 (CET)
Faccio l’avvocato del diavolo, abbiate pazienza.
Ricordiamoci che esiste wikidata, e che tutti questi dati (meno le parti discorsive che sono un interessante plus) sono dati, ossia potrebbero/dovrebbero essere registrati su wikidata, e visualizzati dinamicamente sulla pagina Opera:.
Non so se sia possibile al 100%, nè se la cosa al momento praticabile: ma wikidata ribolle; ma farei ogni sforzo possibile per tenere fermo questo principio: ogni dato deve essere condiviso su wikidata; a costo di fare alcune rinunce grafiche. -Alex brollo (disc.) 00:43, 19 dic 2014 (CET)
Mi piace!!! E' proprio quello che avevo in mente quando abbiamo iniziato a discutere delle pagine Opera. Per rispondere a Pepato, direi che per le opere omonime faremo come al solito, ad esempio avremo come adesso la disambigua Canti, che tra le altre cose punterà a Opera:Canti (Leopardi). Per creare le pagine Opera, può essere utile partire proprio dalle disambigua: alcune elencano già edizioni della stessa opera, vedi ad esempio Cantico delle creature. Candalùa (disc.) 15:13, 19 dic 2014 (CET)
Alex, concordo che l'utilizzo di Wikidata sia auspicabile e da attuare, ma da qualche parte bisogna pur cominciare per ragionare su un esempio concreto, altrimenti rimangono discorsi fumosi e teorici che mi rimane difficile seguire. Metto nero su bianco alcuni punti riguardo Wikidata su cui ragionare:
1) Il template Interprogetto così come è ora non va bene, IMHO deve prendere in automatico gli interwikilink da Wikidata, così come fa da tempo il tl Interprogetto di it.wiki. Ora l'ho rimodificato alla sintassi breve senza parametri per mostrare i risultati che dà in questo momento e come non siano ne coerenti (le stringhe mostrate hanno formattazione diversa), ne completi (mancano i link ad alcuni progetti cioè 'quote. 'Books assente giustificato in quanto non è ancora supportato da Wikidata).
2) La pagina Opera: come detto sopra è stata connessa al suo elemento Wikidata (d:Q131719). Sta a noi completare i dati mancanti su Wikidata e studiare il modo di utilizzarli qua in locale.
3) Ogni singola edizione presente in Wikisource deve essere connessa al suo elemento su Wikidata. L'edizione del Il Principe che abbiamo è stata ora collegata all'elemento Wikidata (d:Q18647256). Sta a noi completare i dati mancanti su Wikidata e studiare il modo di utilizzarli qua in locale.
Per Wikidata ho seguito le indicazioni per work item and edition item in d:Wikidata:WikiProject Books. --Accurimbono (disc) 15:43, 19 dic 2014 (CET)




Quella che leggete qui sopra è la transclusione di una discussione che ho posto in Discussioni progetto:Trascrizioni, in modo che possa essere richiamata al bar senza pericolo di archiviazioni a metà discussione. Prego tutti di mantenere il filo della discussione nel progetto trascrizioni. - εΔω 17:02, 10 dic 2014 (CET)

Domanda e proposta su competenze informatiche[modifica]

Mi chiedo: quanti di voi hanno usato un vero database relazionale, tipo Access di Microsoft? O programmi analoghi a Access in Mac e Linux? Per "usare" intendo: provare a costruire un database a tabelle multiple collegate fra di loro, e provare ad attuare la cosiddetta "normalizzazione" tenendo conto delle relazioni uno-uno, uno-molti, molti-molti.

Vi propongo: se non l'avete mai fatto, fatelo.

Purtroppo, come molte volte ho notato, mediawiki è un fantastico e complesso database relazionale, che trascura solo un piccolo aspetto: i contenuti delle pagine; sembra quasi che sia dato per scontato che l'utente non può, e non deve, capire come i dati vanno correttamente maneggiati, fin dal momento dell'ideazione delle loro strutture. Il ritardo nella creazione di wikidata è incredibile. --Alex brollo (disc.) 10:11, 11 dic 2014 (CET)

Purtroppo, hai ragione, i database sono potentissimi ma hanno limiti strutturali. Fai conto che la rivoluzione dei linked open data sta lentamente arrivando dovunque, anche alle biblioteche e a noi :-)
Consolati, siamo un po' tutti in ritardo (e i wikipediani meno che il resto). --Aubrey (disc.) 10:17, 11 dic 2014 (CET)
Non mi riferisco ai software che implementano dei database; mi riferisco a tali software solo perchè - battendo la capa sui problemi astratti che pone la manipolazione dei dati - si capiscono tante cose per esperienza personale. Non parlo da teorico, parlo di brutale pratica e di dolorose testate che gli errori personali insegnano. In cosa differisce l'approccio open linked data con la teoria e con i principi di un database astratto, in parole povere? --Alex brollo (disc.) 14:30, 11 dic 2014 (CET)
Una minima ricerca mi fa vagamente intuire che open linked data è una sovrastruttura di gestione di dati, che consiste nella integrazione di molti dati organizzati in diversi database; ma alla fin fine il modello teorico "relazionale", nei database locali, non viene intaccato. L'esercizio che vi ho raccomandato non perde la sua utilità. --Alex brollo (disc.) 16:48, 11 dic 2014 (CET)
Sono certo che l'esercizio che propone sia utile in sè, anche se io non credo avrò mai possibilità/necessità di farlo:
Per riferire nozioni non mie (ma di gente che ne sa), uno dei limiti (e deli punti di forza) dei database relazionali è che sono "chiusi", non aperti. In un'ottica di continuo incremento ed evoluzione, la struttura dei linked open data è più sensata, mentre i database fanno più fatica. Fra l'altro, per certe strutture (fra cui citazioni e libri) i database "classici" hanno enormi problemi di ottimizzazione (ci sono anche i "database a grafo"; ma non divaghiamo troppo). --Aubrey (disc.) 19:01, 11 dic 2014 (CET)

Vincitori concorso[modifica]

Abbiamo i vincitori! Se volete la sorpresa, andate qui... :-) Qualcuno gli scrive un bel messaggio in bacheca? --Aubrey (disc.) 11:05, 12 dic 2014 (CET)

Ho messo le medagliette in pagina utente a quelli che non l'avevano.
Una cosa: ci sono quattro utenti in classifica che però risultano non registrati.... Com'è possibile? Un typo?
I quattro sono: Utente:Afilak Utente:Capra in Utente:Markoramit Utente:Lilloteù.
I quattro potrebbero corrispondere invece a: ??? Utente:Capra in Orbem ??? Utente:Lilloteuì
--Accurimbono (disc) 12:00, 12 dic 2014 (CET)

Stupefazione[modifica]

Ho benvenutato Utente:Yuri Gallo, nostro nuovo utente attivo, e guardati i suoi primissimi contributi sono rimasto di stucco: ha affrontato un testo teatrale in versi, usando l'exoterico template {{T}}. Ovviamente, essendo una mia creatura, mi sono commosso.... abbiamo in sospeso l'idea balzana dei template {{Pr2}} e associati, che dovrebbero "semplificare" il problema; ho invitato Yuri a discuterne, ma vorrei risollevare la questione anche qui. --Alex brollo (disc.) 17:29, 12 dic 2014 (CET)

Dai che ci scappa anche la lacrimuccia!!! Ho spammato un po' del tuo egregio lavoro qui! :) --Xavier121 19:49, 13 dic 2014 (CET)
 ;-P --Alex brollo (disc.) 00:48, 16 dic 2014 (CET)
Grazie del benvenuto e per il tuo lavoro. Devo però confessare di aver barato: La Traviata è stata segnalata nella mailing list "Wikimedia bibliotecari" come bisognosa di lavoro ed io sono arrivato al testo per quella via. Dopo aver trascritto una pagina mi sono accorto che la formattazione era tremenda e l'opera illeggibile. Piuttosto che arrendermi e lasciare il lavoro a qualcun altro ho aperto in modifica una delle pagine già completate ed ho copiato i marcatori necessari. Prometto però di dedicare un po' di tempo allo studio dei vari template per capire effettivamente come funzionano. --Yuri Gallo (disc.) 14:14, 18 dic 2014 (CET)

Rolando Certa[modifica]

Poeta, giornalista, critico artistico e letterario, animatore culturale e politico mazarese. Nato a Palermo il 22 marzo 1931 e morto a Budapest il 29 maggio 1987. Commento non firmato di Ernesto Certa (discussioni) , in data 14:10, 14 dic 2014‎.

Questo contributo non sta ne posto giusto nè è coerente con il progetto wikisource; penso sia una svista. Ho avvisato l'utente nella sua pagina di discussione. --Alex brollo (disc.) 17:29, 14 dic 2014 (CET)
L'autore è schedato da SBN, ha composto diverse opere per cui, ritenendolo rilevante, ho creato la pagina Autore:Rolando Certa --Accurimbono (disc) 11:20, 15 dic 2014 (CET)
Mi sembra un compromesso decente, vediamo se troviamo almeno una citazione in modo da far quadrare il cerchio. --Alex brollo (disc.) 11:59, 15 dic 2014 (CET)

Feedback needed[modifica]

Qualcuno ha sperimentato la riattivazione dell'opzione Ricorda del tool trova & sostituisci? Io la sto usando con grande soddisfazione, ma non vuol dire.... :-( --Alex brollo (disc.) 12:02, 15 dic 2014 (CET)

Fate pure con calma con i feedback.... ho attaccato Indice:Cantoni - Trattato completo di agricoltura, 1855, I.djvu, mi terrà un occupato per un po'  :-) --Alex brollo (disc.) 00:50, 16 dic 2014 (CET)
Io lo uso ogni tanto, non è molto user friendly, ma fa il suo lavoro. Quello che devo ricordarmi che non è opera dipendente ed alcune modifiche non sono così universali. --Luigi62 (disc.) 16:28, 16 dic 2014 (CET)
In effetti, il meccanismo dovrebbe essere usato solo per sostituzioni opera-specifiche; quelle generali dovrebbero essere aggiunte a tool "generalisti", e già ce ne sono un po' in postOCR. In effetti è possibile "memorizzare o caricare" gruppi di sostituzioni opera-specifiche e modificarle, scambiandole quando si cambia opera; c'è un cenno di doc in una discussione precedente, ma toccherà fare una pagina di doc come si deve. Accetto suggerimenti su dove farla in modo che sia ritrovabile.... --Alex brollo bis (disc.) 12:29, 17 dic 2014 (CET)

Nuovo gadget sperimentale[modifica]

Ho attivato il vecchio (ma abbandonato in fase di test) gadget "Immagini da IA"; per ora si attiva su un'unica opera (in cui è utile), Indice:Lezioni di analisi matematica.pdf . Attiva in edit delle pagine un bottoncino IA; lo cliccate, e dopo due-tre secondi l'immagine a fronte viene sostituita automagicamente con l'immagine alla maggior risoluzione possibile, contenuto in un file dell'item IA, incomparabilmente migliore all'immagine ricavata dal file djvu. Studierò il modo per generalizzarlo a tutti i libri provenienti da IA; nel frattempo, vi raccomando di aggiungere, nel campo Fonte di Indice, il template IA esattamente identico a quello che dovreste usare su Commons.

Attenzione
sulla stessa opera è utilissimo il pulsante OCR, carica un testo assai migliore di quello di default (per motivi lunghi a spiegare; posso spiegarveli a richiesta... ma se me lo chiedete procuratevi un qualcosa contro la cefalea) --Alex brollo (disc.) 10:41, 16 dic 2014 (CET)
Molto interessante... Ci starebbe uno scriptino che trovi la URL archive.org e se non c'è il template IA lo metta. Chissà che non riesca a farlo pure io (non adesso, però).
Ho notato che lanciando un Visualizza anteprima, il tasto IA sparisce dalla bottoniera. Quale potrebbe essere il problema? Uomoinverde (disc.) 13:30, 16 dic 2014 (CET)
Visto che vi è piaciuto l'ho attivato anche in modalità view; e non sparisce più (ma tocca premerlo di nuovo). In pochi minuti dovrei generalizzarlo a tutte le pagine Indice che hanno un campo Fonte che punta su Internet Archive. Stasera rifinisco.
PS: i secondi di attesa dopo pressione del tastino IA possono essere anche più di due o tre - le immagini talora sono veramente grosse - ci vorrebbe un "frullino" per indicare che c'è un lavorio in corso. Il ricaricamento, dopo caricata una volta l'immagine, è rapidissimo (l'immagine, suppongo, è giaà presente nella cache del pc)). Ma il frullino non so come visualizzarlo! :-( --Alex brollo (disc.) 14:36, 16 dic 2014 (CET)
Frullino montato (sul cursore), generalizzazione fatta ma attenzione: per motivi sconosciuti non sempre il numero pagina djvu corrisponde al numero immagine su IA; in Indice:Lezioni di analisi matematica.pdf l'allineamento c'è; in altre opere c'è uno sfasamento che andrà "corretto", non immagino come (se non "a mano", inserendo da qualche parte un delta). :-( --Alex brollo (disc.) 17:15, 16 dic 2014 (CET)
Aimè, le cose si complicano. Raccoglierò dati e vediamo se esiste una soluzione generale. Non aspettatevi che il tool funzioni sempre, anzi, fallisce (per disallineamento e anche per "url malformato") piuttosto spesso. --Alex brollo (disc.) 15:00, 17 dic 2014 (CET)
Dopo una rapida raccolta delle idee sui misteri di Internet Archive, e sulle tecniche per leggerne i metadati (chiave per arrivare "a colpo sicuro" anche ai nomi corretti dei file exoterici), mi toccherà documentare un po'; esorto a suggerimenti su dove scrivere la pagina di aiuto e su come evitare che sprofondi nell'oblio e sia rintracciabile. Ammetto la mia incapacità di tenere queste cose in ordine: help! Al momento, la "chiave" per accedere ai metadati di IA sta in una sezione di Utente:Alex brollo/Ajax--Alex brollo (disc.) 08:24, 18 dic 2014 (CET)

Wikisource su MLOL[modifica]

Finalmente, su MediaLibrary online è presente Wikisource: http://www.medialibrary.it/media/ricerca.aspx?seltip=310&selarg=-1&keywords=%22wikisource%22&x=0&y=0&portalId=1 Ho importato solo 811 titoli, per adesso, che corrispondono a 811 "opere" (quindi anche saggi singoli, poesie singole, appartenenti a raccolte) al 100%. Conto di aggiornarle a breve (non ci sono i titoli del concorso), e di mettere su anche i titoli al 75%. Conto anche di spiegare meglio come ho fatto, se a qualcuno interessa (in parte, c'è già qlc nel Progetto:Qualità/Semantizzazione). Ditemi che ne pensate! @Accurimbono: ci pensi tu a mandarlo sui social? --Aubrey (disc.) 12:29, 16 dic 2014 (CET)

Come primo passo, è sicuramente interessante e molto importante ma credo che ci sia tanto ancora da lavorare. Restano poi aperti tanti problemi. Io ad esempio, da mesi non riesco più a creare l'epub deI promessi sposi del 1840. Mi viene il dubbio che non sia io a sbagliare ma che che ci sia qualche errore di fondo . Ovviamente ci sono, poi gli inevitabili errori di stampa: Manzoni scrive una Canzone Maggio 1984 anzichè 1814. Bisogna trovare un sistema semplice ma efficace per segnalare appunto gli errori. Tra l'altro io ho poca confidenza con gli indici di MLOL, ma questo, evidentemente è un limite mio--Mizar (ζ Ursae Maioris) (disc.) 21:38, 16 dic 2014 (CET)
Ottima notizia questa! Finalmente il nostro lavoro avrà anche questo canale di distribuzione molto importante.
Verificate la leggibilità degli epub scaricati tramite MLOL, ieri ne avevo trovato uno con dei caratteri illeggibili, forse un problema di codifica, se lo ritrovo lo segnalo.
@Aubrey: Mi ha anticipato Virginia a dare la notizia nel gruppo Facebook (a proposito iscrivetevi al gruppo, se avete un profilo su Facebook). --Accurimbono (disc) 09:52, 17 dic 2014 (CET)
La modalità che ho usato io è quella di linkare direttamente al convertitore di EPUB, per cui se l'epub è rotto noi possiamo agire e parlarne direttamente con Thomas (l'altro giorno ho trovato un errore, ed è stato risolto in un paio di giorni).
MLOL non fa altro che linkare a noi, per cui abbiamo la facoltà di correggere eventuali errori. Sono d'accordo che sarebbe bello trovare un modo più "chiaro" di dire al lettore su MLOL che può correggere direttamente il libro da noi.... Aubrey (disc.) 19:47, 17 dic 2014 (CET)
@Aubrey:, hai fatto bene. Mi sembra il modo giusto per fornire libri sempre aggiornati in tempo reale evitando inutile fatica di produrre epub e caricarli in continuazione. Se ritrovo il testolo segnalo. --Accurimbono (disc) 20:16, 17 dic 2014 (CET)

Avviso "robe tecniche"[modifica]

Ho pingato Candalua, ma estendo l'invito a venire a dare un'occhiata a tutti coloro che masticano javascript, sull'ultimo post messo in Bar tecnico su una modifica software promettente, riguardo alla manipolazione e salvataggio dei dati della pagina Indice corrente, ossia quella collegata alla pagina che viene aperta (sia in nsPagina che in ns0). --Alex brollo bis (disc.) 09:22, 17 dic 2014 (CET)

Linguetta evidenziata[modifica]

Non so se è fattibile e non so se per la comunità e importante o utile ma la dico ugualmente. Mi è capitato, qualche volta, di leggere nella pagina Discussione di qualche opera/pagina alcune indicazioni riguardanti la stessa come ad esempio il tipo di formattazione utilizzata, suggerimenti su come procedere, sospesi da sistemare, ecc. Proprio oggi mi è capitato di aprire una discussione per i posteri in questa pagina. Arrivando al dunque, sarebbe importante evidenziare in qualche maniera la linguetta al fine che possa visivamente comunicare, al lettore wikisoursiano che forse si mette a lavorare, che al suo interno c'è qualcosa e, se c'è qualcosa, questa dovrebbe essere letta. Che ne dite?. --Stefano mariucci (disc.) 20:53, 17 dic 2014 (CET)

Hai perfettamente ragione. Ancora una volta, occorrerebbe imparare dagli amici francesi, che hanno un sistema standardizzato di registrazione delle "avvertenze di formattazione", dove chi inizia l'opera dichiara - ad esempio - lo "stile" che userà (trascrizione diplomatica, ossia tal quale, o modernizzazione dell'ortografia, o annotazioni libere). Non ho approfondito questo argomento, l'ho solo intravisto, ma sarebbe un campo da esplorare ed eventualmente da importare. Invito tutti coloro che masticano il francese a lavorare un po' su fr.source tenendo gli occhi bene aperti.
Rivedendo rapidamente, il template base per dichiarare le "scelte editoriali" è fr:Template:ChoixEd, ma ce ne sono anche altri collegati. --Alex brollo (disc.) 08:05, 18 dic 2014 (CET)

Modifica a Progetto:Trascrizioni[modifica]

Mi son fatto coraggio e ho aggiunto al menu a destra di Progetto:Trascrizioni una nuova voce, "Sottopagine", dove con pazienza linkeremo (se siamo d'accordo) le varie sottopagine del progetto in cui si affrontano problemi specifici. Ho "inaugurato" la nuova sezione con il link a una sottopagina su Internet Archive, in cui sistemerò le idee man mano che le dissodo e le raccolgo. Se l'idea non vi va: rollback! :-) --Alex brollo (disc.) 18:00, 18 dic 2014 (CET)

Abbozzata una seconda pagina, Progetto:Trascrizioni/Trova e sostituisci; personalmente sento il bisogno di qualche spiegazione da parte del creatore del tool, ho problemi con le sostituzioni regex se contengono caratteri speciali, come l'acapo. --Alex brollo (disc.) 21:20, 19 dic 2014 (CET)
Eccomi! Sono il Creatore... ehm, il creatore del tool. Dicaaaa! Candalùa (disc.) 11:07, 22 dic 2014 (CET)
Come inserisco nei due campi trova e sostituisci il riferimento a caratteri a capo e similari (es. tabulazione)? Nelle sostituzioni può succedere di dover cercare (o inserire) caratteri tipo \n, \t, .... io sono stato sempre frustrato :-( --Alex brollo (disc.) 11:53, 22 dic 2014 (CET)
\s può fare al caso tuo? Matcha qualunque cosa sia uno spazio, inclusi tab e a capo (sia \n che \r). Candalùa (disc.) 12:10, 22 dic 2014 (CET)
Troppa grazia S. Antonio; ma adesso che me lo dici, proverò con l'acapo Windows (test fatto: no, non serve, basta \n alla linux)
Niente da fare, \n matcha, ma non riesco a inserire il carattere speciale \n in sostituisci; lì sta il problema. :-( --Alex brollo (disc.) 12:45, 22 dic 2014 (CET)
In effetti non era possibile: scrivendo "\n" nel campo, leggendolo questo viene interpretato letteralmente come la stringa "backslash+n", come se fosse scritto con l'escape cioè "\\n". Adesso ho aggiunto nel codice un "unescape" che ripristina il significato originale di \n "newline". Prova a vedé... Candalùa (disc.) 14:21, 22 dic 2014 (CET)

Problema ricorrente: ancore[modifica]

Indice:Cantoni_-_Trattato_completo_di_agricoltura,_1855,_I.djvu e Indice:Lezioni di analisi matematica.pdf, insieme ad altre opere complesse, hanno un problema comune: la presenza di sottocapitoli "atomici", molto piccoli, con molti riferimenti dall'uno all'altro, da convertire in link. In entrambe le opere questi sottocapitoli sono identificati da un titolo tipo § 12. Ci sono due soluzioni: o si sparpaglia l'opera in piccole pagine ns0, una per sottocapitolo, o si allestiscono capitoli un po' più grandi, con sottocapitoli identificati da un'ancora. Sarebbe però comodo, in questo secondo caso, fare in modo che il link completo sia costruito automaticamente; per farlo, occorre memorizzare da qualche parte (oppure scrivere a mano) la relazione fra ancora e pagina djvu ossia "far sapere" ai template che il tal sottocapitolo inizia nella tal pagina djvu; in modo che basti passare a un template un parametro con il numero dell'ancora per ottenere il link completo, sia in nsPagina che in ns0.

Per prima cosa, occorre (se si sceglie la seconda soluzione, come sto facendo in Cantoni), applicare a ogni titolo del sottocapitolo un template § (molto intuitivo in questi casi! Ad ogni § un template §...) e poi chi vivrà vedrà. ;-) --Alex brollo (disc.) 09:32, 19 dic 2014 (CET)

Opera Dalle dita al calcolatore[modifica]

Vedo che @AlbertoC44: sta lavorando a [quest'opera], molto interessante, ma vedo anche che è datata 1990. Volevo chiedere se è libera da diritti o se è meglio non lavorarci proprio e evitare di perdere del tempo prezioso. --Stefano mariucci (disc.) 06:28, 22 dic 2014 (CET)

Mi sa tanto che AllbertoC44 è il coautore del libro, persona protagonista di tanti Linux Day milanesi e di tante iniziative con Wikimedia. Se necessario, meglio trovare il modo di chiarire ulteriormente che la licenza è compatibile.Mizar (ζ Ursae Maioris) (disc.) 08:16, 22 dic 2014 (CET)
@AlbertoC44: In effetti un problema c'è: nelle immagini manca la pagina di frontespizio, e il suo retro, dove in genere è riportato anche il copyright insieme agli altri dati editoriali. Occorre documentazione che entrambi gli autori rilasciano l'opera in copyright compatibile, oppure l'integrazione delle immagini con le pagine dell'opera che riportano il copyright sotto il quale l'opera è rilasciata. --Alex brollo (disc.) 11:49, 22 dic 2014 (CET)
Alberto credo abbia fatto tutto con OTRS, ci sto parlando io da settimane, secondo me siamo a posto. --Aubrey (disc.) 15:44, 22 dic 2014 (CET)
Il libro è su Internet Archive, caricato da alberto.campiglio: bello sarebbe se ci aggiungesse, con una semplice modifica dell'item, il metadato licenza. Resta il problema del secondo autore, ma sarebbe qualcosa. In più, su Commons dovrebbe essere taggato come "own work" per chiarire un po' le cose. Queste opere recenti rilasciate con copyright compatibile sono sempre un grosso problema! --Alex brollo (disc.) 16:14, 22 dic 2014 (CET)