Wikisource:Bar/Archivio/2023.01

Da Wikisource.
Archivio delle discussioni del mese di gennaio dell'anno 2023

Categoria: Archivio Bar 2023 Bar   Archivio    gennaio 2023 


Statistiche ed eventi del 2022[modifica]

Cari amici,

Cari amici, oggi ho rivisto i progressi di quest'anno e li ho confrontati con la stessa tabellina che avevo raccolto nel 2019 e l'anno scorso.

Ecco i numeri:

ANNO all pages in nsPagina not proof. problem. w/o text proofread validated all pages in ns0 with scans w/o scans
2018 57297 15080 -345 4131 38431 19598 5154 5375 -218
2021 9545 -4186 -25 2909 30847 14713 4714 6364 -1654
2022 38275 -4700 1258 2635 39082 26502 4818 8461 -3689

La lettura è apparentemente semplice per cui invito gli scientifici a correggere le mie semplificazioni:

  • I caricamenti di file sono aumentati e anche il numero di pagine elaborate: per quanto mi riguarda possiamo accumulare tutte le pagine SAL 25% che vogliamo, ma evidentemente la comunità si lancia a formattare e preparare a tutto spiano, dunque ottimo risultato;
  • sono stabili le pagine SAL 50%: questo non è un problema quando sia chiaro che il significato è "pagina problematica di cui devo indicare il problema"; quando questa indicazione manchi ci affidiamo al discernimento degli altri, che è tutt'altro che scontato;
  • è notevolmente aumentato il numero di pagine SAL 75% (+30% ca.) e quasi raddoppiato il numero delle pagine rilette, distanziando anche il valore del 2019: questo è un notevole passo avanti che inorgoglisce, sapendo che non abbiamo più tenuto concorsi di rilettura e che le riletture del mese attirano meno utenti di quelli che vorremmo;
  • infine nel ns0 abbiamo mantenuto il ritmo di inserimento di nuove pagine con immagine a fronte e abbiamo compiuto un passo da gigante sul fronte del Match & Split, accoppiando ben più del doppio di pagine "naked" con la loro fonte.

Su questo invito la comunità a commentare, riflettere e mettere più a fuoco i dati, intanto però mi congratulo con i molti utenti sia iperattivi che "mordi e fuggi" che contribuiscono alla crescita del progetto.


Eventi del 2022[modifica]

Non abbiamo un periodico pubblico come è Il Wikipediano su Pedia. Ci avevamo provato ma non ha funzionato. Propongo comunque un post di inzio anno in cui inserire tutti quanti gli eventi che si ritengono importanti per la comunità: mi pare giusto che ci sia un luogo che riassuma l'anno trascorso dato che non tutti ci divertiamo a scorrere gli archivi del Bar per ricostruire gli anni passati: questo esercizietto di memoria comunitaria ci aiuti a tener traccia dei progressi e dei regressi avvenuti.

Nel corso del 2022
  • la comunità perde un amministratore, Aubrey, ma ne elegge due nuovi, Dr Zimbu e Carlomorino.
  • L'interfaccia Vector 2022 si appresta a sostituire Vector 2010 Legacy come skin di default, il test su strada è necessario per evitare problemi agli utenti non registrati.
  • Il fastidioso malfunzionamento del Trova&Sostituisci che affligge da anni tutte le Wikisource è stato momentaneamente risolto disabilitando il supporto a Visual Editor su Wikisource. Evidentemente questo compromesso dovrà essere risolto definitivamente, dato che Visual Editor non è meno importante;
  • A ItWikiCon 2022, finalmente in presenza, è stato pubblicizzato il recupero e la divulgazione del manoscritto semidimenticato di Giacomo Leopardi: La virtù indiana;
  • ...

εΔω 10:33, 1 gen 2023 (CET)[rispondi]

Grazie Edo per i dati. Aggiungo qualche statistica sulla rilettura: questa è la divisione delle pagine (ns Pagina) al 75% per anno di creazione.
2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022
17/03/2022 217 202 1008 4356 4539 5922 6127 3882 8847 19527 20550 22502 16890 19069 17373 5765
31/12/2022 217 154 807 3075 3537 4747 6956 3634 8782 16968 19318 21329 16806 18826 18236 21659
(La prima riga è di marzo perché è allora che ho iniziato a tenere questi dati)--Dr Zimbu (disc.) 16:24, 2 gen 2023 (CET)[rispondi]
Scusa, @Dr Zimbu ma confesso di non aver colto bene la descrizione: il 17 marzo 2022 c'erano 3882 pagine SAL 75% create nel 2014, e il 31 dicembre 2022 di quelle 3882 ne sono rimaste 3634, il che significa che in nove mesi e mezzo di quelle 3882 ne sono state portate al 100% (o degradate al 25%) 248 e non ne sono create altre? Se ho capito giusto, cosa di cui dubito assai, cosa è accaduto negli anni in cui a dicembre ci sono più pagine che a marzo? εΔω 19:26, 9 gen 2023 (CET)[rispondi]
@OrbiliusMagister Il movimento verso l'alto di alcuni numeri deriva dal fatto che alcune pagine possono essere state create al 25% o al 50%, e poi essere state portate al 75% quest'anno. Ad esempio, il passaggio da 3882 a 3634 (-248) del 2014 può essere il risultato di 248 passaggi dal 75% al 100%, oppure di 348 passaggi 75% → 100% e di 100 passaggi 25% → 75% (o qualsiasi altra combinazione 248+x vs x). La grossa salita del 2013 penso si spieghi con il lavoro di @Alex brollo su Galileo, ad esempio (con un massiccio passagio 0% → 75%).
Non sono riuscito a trovare nessun modo (a parte aprirle una ad una, che è impraticabile) di ottenere statistiche relative al tempo in cui sono diventate al 75%.--Dr Zimbu (disc.) 21:17, 9 gen 2023 (CET)[rispondi]

defunti nel 1952[modifica]

Ciao e buon anno. Passavo per 'Pedia e al Bar dicono che da oggi sono libere le opere fino al 1952- qui la pagina apposita. w:Morti_nel_1952 Dice che c'è pure Benedetto Croce e Montessori (nessuno di ferroviario, temo :D) Bye! Silvio Gallio (disc.) 19:11, 1 gen 2023 (CET)[rispondi]

Chi conosce meglio di me Silvio D'Arzo? Se ne parla qui. εΔω 20:30, 1 gen 2023 (CET)[rispondi]
Ci sarebbe anche Renato Simoni, tra le altre cose coautore del libretto della Turandot, che quindi entra anch'esso nel pubblico dominio (l'altro autore, Giuseppe Adami, è morto nel '46) Can da Lua (disc.) 18:14, 2 gen 2023 (CET)[rispondi]
In cerca di idee per rimpolpare la biblioteca?
ecco una serie di liste dinamiche incentrate su categorie di autori nati o morti nel **23:
Autori nati e morti uno o più secoli fa con opere su Wikisource
nati nel 1823 morti nel 1823 morti nel 1923 morti nel 1952
  1. Autore:Robert Mowat
  2. Autore:Alessandro Castellani
  3. Autore:Alessandro Doveri
  4. Autore:Antonio Caccianiga
  5. Autore:Carlo Livi
  6. Autore:Adolfo Targioni Tozzetti
  7. Autore:Enrico Betti
  8. Autore:Venanzio Giuseppe Sella
  9. Autore:Michele Lessona
  10. Autore:Domenico Carbone
  11. Autore:Carlo Mariani
  12. Autore:Vincenzo Lazari
  13. Autore:Giuseppe Fiorelli
  14. Autore:Giuseppe da Forio
  1. Autore:Giuseppe Pasta
  2. Autore:Charles Wolfe
  3. Autore:Giambattista Mutinelli
  4. Autore:Vincenzo Cuoco
  5. Autore:Carminantonio Lippi
  6. Autore:Papa Pio VII
  1. Autore:Francesco Perrone
  2. Autore:Gennaro Finamore
  3. Autore:Decio Albini
  4. Autore:Beatrice Speraz
  5. Autore:Giovanni Dattari
  6. Autore:Achille Ricciardi
  7. Autore:Pierre Loti
  8. Autore:Arturo Zardini
  9. Autore:Giosuè Signori
  10. Autore:Alfredo Comandini
  11. Autore:Gian Francesco Gamurrini
  12. Autore:Ubaldo Mazzini
  13. Autore:Vilfredo Pareto
  14. Autore:Ernesto Giacomo Parodi
  15. Autore:Almerico Meomartini
  1. Autore:Benedetto Croce
  2. Autore:Carlo Sforza
  3. Autore:Luigi Volta
  4. Autore:Giuseppe Antonio Borgese
  5. Autore:Gion Cadieli
  6. Autore:Guido Castelnuovo

Inserimento biografia su Aaron Swartz[modifica]

Grazie al supporto di @Alex brollo e @OrbiliusMagister sto procedendo con la creazione della biografia di Giovanni Zaccardi su Aaron Swartz Aggiustare il mondo. Visto che l'11 gennaio prossimo cadono i 10 anni dalla sua morte mi pare possa essere una bella cosa avere la sua biografia disponibile completamente. Che ne pensate? C'è qualcun altro interessato a portare avanti il lavoro? Grazie a tutti! Maupao70 (disc.) 15:29, 4 gen 2023 (CET)[rispondi]

Di solito funziona così: un utente mette giù il grosso delle pagine anche se non perfettamente, e altri assestano, aggiustano e rileggono. Intanto procedi: secondo me per l'11 ce la fai. Se poi ci si mettesse anche @Aubrey sarebbe una grandissima festa. - εΔω 15:52, 4 gen 2023 (CET)[rispondi]
Ok, va bene, infatti sto procedendo e ora sono a metà. Maupao70 (disc.) 16:23, 4 gen 2023 (CET)[rispondi]
ACHTUNG! Ho cominciato a tappare qualche buco verso pagina 200. Ma non mi azzardo (più) a mettere il quadretto verde anche dove posso. Comunque da qualche parte ci deve essere una baco perché le prime pagine seguono la numerazione del .pdf mentre in quelle che ho cominciato -appunto- a pistolare, il -pdf non combacia. Silvio Gallio (disc.) 09:59, 7 gen 2023 (CET)[rispondi]
Mi sa che devo aver fatto qualche cosa di sbagliato io quando ho creato l'indice... Maupao70 (disc.) 10:11, 7 gen 2023 (CET)[rispondi]
Il grosso del lavoro è fatto, bisogna completare la formattazione. Io credo di riuscire a lavorarci un po' questa sera, se ci sono altri a dare una mano facciamo prima. Scusate se pingo chi è intervenuto in questi giorni. @Aubrey @Alex brollo @OrbiliusMagister @Silvio Gallio Maupao70 (disc.) 14:58, 10 gen 2023 (CET)[rispondi]
Ieri ho provato a sistemare qualche pagina dello Swartz. Mi 'perplime' la soluzione (buona ma forse automatizzabile (?)) della Riga Intestazione nelle pagine iniziali che, per cambiare, non è centrata sul foglio. chessifà? --Silvio Gallio (disc.) 11:53, 11 gen 2023 (CET)[rispondi]
Ciao a tutti, mi pare un'iniziativa molto bella. Non mi convince molto l'idea di "ritrascrivere" un PDF, mi pare che sia un lavoro in più che forse potevamo risparmiarci chiedendo direttamente un ebup/doc all'autore. Ad ogni modo, gran bella idea. Aubrey (disc.) 13:10, 12 gen 2023 (CET)[rispondi]
Pazienza, intanto me lo sono letto :-) l'autore è stato molto contento di aver ritrovato il testo dentro un ambiente wiki. Maupao70 (disc.) 14:46, 13 gen 2023 (CET)[rispondi]
@Aubrey Dipende dal testo. Quando si tratta di un testo con formattazione molto regolare e semplice, largamente discorsivo, l'OCR o meglio l'estrazione diretta del testo dal pdf contiene "quasi tutto" e anche quello che manca (suddivisione in paragrafi, stili delle indentature) può essere ricostruito in automatico con sufficiente approssimazione, e il testo su Swartz ha queste caratteristiche. Quando la formattazione è molto pesante, es. Nuovo vocabolario siciliano-italiano, sarebbe una mission impossible. Ogni testo è una storia a sè.
Ne approfitto per un inciso.... oggi, la qualità dell'OCR Mediawiki disponibile in mmodificas pagina spesso è nettamente superiore a quella registrata, ad esempio, in molti testi di Internet Archive, ed è anche molto veloce. Di fronte a una pagina con parecchi errori dell'OCR pre-registrato sia in un pdf che in un djvu, vale la pena di provare a lanciare sia tesseract che Google OCR. Alex brollo (disc.). 09:11, 18 gen 2023 (CET)[rispondi]

Brindisi romanesco[modifica]

Nell'ennesima "passata" dei Sonetti romaneschi, stavolta pagina dopo pagina, mi è comparsa la scritta "Fine dell'opera" :-)

Il lavoro non è affatto finito, ci sono centinaia di pagina ns0 da rifinire, e molte altre cosette da sistemare; gran parte delle pagine nspagina ha solo un SAL 25%. Ma io vi propongo lo stesso il brindisi! Alex brollo (disc.). 14:39, 5 gen 2023 (CET)[rispondi]

Eccezionale @Alex! Hai compiuto un'opera erculea: mi sa che dopo una simile full immersion di oltre due mesi ora potresti parlare a Roma come un madrelingua romanesco. Adesso ti spetta una pausetta, ma ti rammento la fusione dei doppioni. - εΔω 15:26, 10 gen 2023 (CET)[rispondi]
@OrbiliusMagister Sì, mi sto prendendo una pausetta romanzesca. Il prossimo passo, l'appaiamento naked-proofread, e penso che come prodotto secondario dell'appaiamento ci sarà anche l'estrazione del testo del primo verso dei sonetti, collegato al titolo del sonetto. Una cosetta da bot, ma.... so già che ci vorranno varie rifiniture e controlli manuali. A proposito: esistono convenzioni per depurare il primo verso da caratteri inutili (tipo punteggiatura) che ostacolino le funzioni di ricerca? Alex brollo (disc.). 17:48, 10 gen 2023 (CET)[rispondi]

Opere su Wikisource che hanno anche voci su Wikipedia[modifica]

Qualcuno di voi riesce a ottenere un elenco delle opere presenti su Wikisource e non ancora completamente trascritte o rilette e che inoltre hanno anche una voce propria su una pagina di Wikipedia (ad esempio La luna e i falò di Pavese ha una propria pagina su Wikipedia ed è anche su Wikisource però non è ancora stata trascritta totalmente)? Fermo restando che ognuno e libero di trascrivere e rileggere le opere che vuole sarebbe buona cosa mettere in evidenza un elenco di opere di questo tipo come "consigli di trascrizione e rilettura" in quanto la presenza di una voce a sé su Wikipedia per queste opere è segnale di una maggiore rilevanza oggettiva dell'opera. Myron Aub (disc.) 16:18, 5 gen 2023 (CET)[rispondi]

@Myron Aub Le cose sarebbero più facili se riuscissimo a linkare a ciascuna opera presente su wikisource almeno un elemento work di wikidata. Noto che in w:La luna e i falò manca il link interprogetto verso la pagina wikisource: un buon esempio di quanto è difficile la relazione fra i due progetti. Alex brollo (disc.). 00:23, 6 gen 2023 (CET)[rispondi]
Avevo già rivolto questa domanda a Epìdosis un anno e mezzo fa: il risultato della query non è comodissimo da usare ma aiuta molto e comunque ogni query può essere perfezionata. - εΔω 06:50, 6 gen 2023 (CET)[rispondi]
@OrbiliusMagister @Myron Aub Ammetto che mi muovo male in wikidata, e peggio in wikipedia. Comunque, analizzando il caso di La luna e i falò, vedo che la voce wp è già collegata a un elemento "written work" di wikidata, pronto per servire da base per una pagina Opera qui, cosa che ho fatto. Adesso ci rifletterò un po'... Alex brollo (disc.). 08:47, 6 gen 2023 (CET)[rispondi]
Ecco! quello che volevo vedere con i miei occhi... avrei dovuto saperlo, ma vederlo dal vivo è un'altra cosa. Collegata la pagina Opera allo stesso elemento wikidata a cui è collegata la voce wp, su entrambi i progetti compare automaticamente l'interlink. Alex brollo (disc.). 08:54, 6 gen 2023 (CET)[rispondi]
@Alex brollo, brevissimamente per non andare offtopic: dato che nel corso del 2022 ho lavorato un po' nel nsOpera e ho creato qualche entità su Wikidata, mi piacerebbe fare il punto sui collegamenti interprogetto e magari scrivere una paginetta per non addetti ai lavori. εΔω 08:56, 6 gen 2023 (CET)[rispondi]
@OrbiliusMagister Benissimo. Ho l'impressione che l'idea necessiti di una discussione preliminare. Dove la apriamo? Alex brollo (disc.). 11:09, 6 gen 2023 (CET)[rispondi]
Scusa ma durante il periodo in cui sono mancato da Wikisource non è stata fatta una pagina per confronto opera-edizione e simili? Ammetto un po' di amnesia rispetto a quando mi ero posto il problema con i lirici Marinisti e le copie multiple di sonetti antichi. εΔω 11:14, 6 gen 2023 (CET)[rispondi]
Ricordo che esiste un modello, probabilmente datato, ma a suo tempo costruito per i testi che ritenevamo imprescindibili per tutti i progetti. :) --Xavier121 17:35, 8 gen 2023 (CET)[rispondi]
Continuo a digerire male la struttura "a triplette"... evidentemente fantastica per le possibilità di interrogazione, ma... molto dipendente, per la sua elasticità, da scelte arbitrarie di chi introduce i dati, per ridurre la quale necessita di un insieme corposo di regole senza garanzie che poi vengano rispettate. Sempre riguardo La luna e i falò: "written work" o "literary work"? E come fare in modo di mettersi d'accordo, tutti insieme, fra contributori di wikidata...? Alex brollo (disc.). 06:40, 9 gen 2023 (CET)[rispondi]
Mi sembra che la pagina "Canone delle opere della letteratura italiana" non abbia molto aiutato a invitare a trascrivere prima le opere più "imprescindibili". A parte il fatto che in quell'elenco ci sono opere come "L'amor coniugale" di Giovanni Pontano, "L'Italia Illustrata" di Flavio Biondo e "La prima veste dei discorsi degli animali" di Agnolo Firenzuola che non mi pare abbiano un grandissimo spazio nei manuali di storia della letteratura italiana, noto che fra i testi non ancora trascritti in modo completo c'è addirittura la Vita Nuova di Dante... Myron Aub (disc.) 12:20, 9 gen 2023 (CET)[rispondi]
Ehm, potrei rispondere ma non in forma sintetica, inoltre in questo singolo post si sta mettendo molta carne al fuoco, almeno per tre interrventi differenti. Piuttosto che lasciare discorsi importanti a metà perché non spostarli e proseguirli in post separati, magari in pagine di discussione specifiche? εΔω 20:04, 9 gen 2023 (CET)[rispondi]
Ok, proseguiamo pure in altri post in pagine di discussioni apposite.--Myron Aub (disc.) 20:48, 9 gen 2023 (CET)[rispondi]

Due Ipazie[modifica]

Abbiamo Ipazia la Filosofa (testo proofread) e Ipazia (non proofread): il testo è sostanzialmente lo stesso (con piccole differenze, forse perché derivano da edizioni diverse), ma il testo proofread ha anche note a piè di pagina. Vale la pena tenere entrambe le pagine o cancelliamo qualla non proofread?-- Dr Zimbu (disc.) 12:02, 9 gen 2023 (CET)[rispondi]

@Dr Zimbu Si potrebbe fare, ma secondo me non è molto in alto nella lista delle priorità. @OrbiliusMagister, decidi tu? Alex brollo (disc.). 17:48, 9 gen 2023 (CET)[rispondi]
Più passa il tempo più mi infastidisce scoprire leggerezze e inesattezze nelle edizioni non proofread. Nel nostro caso la pubblicazione è datata 1914 salvo scoprire che abbiamo un'edizione che la predata di quattro anni; le citazioni in inizio testo assenti nell'edizione 1910 non sappiamo se siano state aggiunte dall'autore o dalla curatrice dell'edizione 1998; l'assenza della bibliografia presente nell'edizione 1910.
Onestamente anche se so che rischiamo di perdere qualche informazione più recente sono propenso ad eliminare l'edizione liberliber (beninteso, LiberLiber continuerà a distribuirla dunque nulla va perduto per l'umanità) e tenere solo l'edizione proofread: ci sono voci in contrario? - εΔω 19:10, 9 gen 2023 (CET)[rispondi]
'cidere, 'cidere :D (cit) --Silvio Gallio (disc.) 11:54, 11 gen 2023 (CET)[rispondi]
✔ Fatto --Alex brollo (disc.). 13:52, 12 gen 2023 (CET)[rispondi]

Notizie tecniche: 2023-02[modifica]

MediaWiki message delivery 02:07, 10 gen 2023 (CET)[rispondi]

Wikimedia Italia - Bando 2023 per progetti dei volontari[modifica]

Ciao,

Wikimedia Italia ha da poco pubblicato il bando 2023 di finanziamento rivolto ai progetti dei volontari, per la realizzazione di progetti, eventi e iniziative proposti da volontari, anche non soci di Wikimedia Italia, che contribuiscono al raggiungimento dello scopo dell'associazione.

Il budget disponibile per il bando è di complessivi € 45.000, di cui € 20.000 riservati a progetti di sviluppo o manutenzione software, a copertura totale o parziale dei costi di realizzazione del progetto. I progetti vanno presentati entro il 15 febbraio e si dovranno chiudere entro il 15 novembre 2023.

Il bando completo si trova qui.

Per qualsiasi informazione potete scrivere una email a segreteria@wikimedia.it --Dario Crespi (WMIT) (disc.) 10:01, 10 gen 2023 (CET)[rispondi]

Scusa, ma non sarebbe eccezionale che un progetto di correttore automatico nello stile di quello di mishoko venisse elaborato e implementato da @Candalua con un grant apposito tratto da questo bando? Per il progetto sarebbe un avanzamento enorme e per Candalua sarebbe un riconoscimento non solo virtule delle sue abilità applicate: se avessi le competenze che ha lui mi presenterei subito. - εΔω 15:47, 10 gen 2023 (CET)[rispondi]
Non hai preso in considerazione di presentarlo tu per poter affidare il lavoro a lui? Maupao70 (disc.) 18:52, 11 gen 2023 (CET)[rispondi]
Non me lo permetterei mai. Io lancio l'idea ma lascio la massima libertà di decisione a chi poi si farebbe carico di realizzarla, a maggior ragione se c'è in ballo del denaro ^_^... εΔω 15:17, 12 gen 2023 (CET)[rispondi]
Avere un grant non mi aiuterebbe particolarmente: la difficoltà per me non è tanto il vile denaro, ma il tempo che potrei dedicarci, che tra lavoro e famiglia è sempre risicato. Poi non credo neanche di avere tutte le competenze necessarie per fare un vero correttore fatto bene, con vocabolario, analisi grammaticale e tutto (non è solo questione di saper programmare su wiki). Però sto facendo comunque un gadget ispirato al lavoro di Mishoko, che potrà aiutare a trovare almeno gli errori più marchiani. Spiegherò meglio prossimamente. Can da Lua (disc.) 10:11, 18 gen 2023 (CET)[rispondi]

Segnalo richiesta[modifica]

Wikisource:Richieste agli amministratori#MediaWiki:Movepage-reason-dropdown Pierpao (disc.) 09:35, 11 gen 2023 (CET)[rispondi]

✔ Fatto εΔω 11:20, 16 gen 2023 (CET)[rispondi]

Nuova avventura[modifica]

@Àncilu @OrbiliusMagister Segnalo Indice:Antonino Traina - Nuovo vocabolario siciliano-italiano.pdf, testo molto impegnativo ma con una novità: verrà eseguito caricamento via match and split del testo quasi completamente formattato :-) Alex brollo (disc.). 11:17, 16 gen 2023 (CET)[rispondi]

@Alex brollo: A Pagina:Antonino Traina - Nuovo vocabolario siciliano-italiano.pdf/37, è normale che vi sia il tag <span style="font-variant: normal">? Àncilu (disc.) 11:38, 16 gen 2023 (CET)[rispondi]
@Àncilu No, evidentemente è sfuggito alla pulizia. Esiste un sistema (memoRegex) per memorizzare ed effettuare in automatico sostituzioni di testo. Vado a vedere e se possibile sistemo (TUTTI i tag span vanno eliminati o sostituiti). La pagina usuale per discutere problemi dei singoli libri è la pagina di discussione della pagina Indice, naturalmente con un ping per richiamare l'attenzione dell'utente a cui si vuole proporre il problema; ma anche questa pagina va bene. Alex brollo (disc.). 12:08, 16 gen 2023 (CET)[rispondi]
L'avventura continua... Nuovo vocabolario siciliano-italiano.

Interfaccia desktop: ultime novità[modifica]

Ciao, vi segnalo che le ultime novità del progetto delle Migliorie all'interfaccia desktop sono on line.

Ne approfitto per linkarvi anche questa discussione su Phabricator che potrebbe interessarvi perché cita alcune discussioni avute in passato con la comunità di Wikisource in italiano. Buona lettura!--Patafisik (WMF) (disc.) 15:07, 16 gen 2023 (CET)[rispondi]

La lettura è un pizzico complessa, ma è importante perché coinvolgerà anche l'aspetto delle nostre pagine: se qualche anglofilo riuscisse a riportarne il succo qui ci permetterebbe di reagire adeguatamente. - εΔω 19:47, 16 gen 2023 (CET)[rispondi]

Notizie tecniche: 2023-03[modifica]

MediaWiki message delivery 02:10, 17 gen 2023 (CET)[rispondi]

Pirandello, Il berretto a sonagli[modifica]

Non pare esistere nessuna versione online, anche se i diritti sono scaduti da mo'. Esistono volumi con varie commedie di Pirandello, ma i volumi sono ovviamente sotto copyright. Che si può fare in questi casi? Uno potrebbe trascrivere l'opera, possibilmente confrontando due edizioni diverse per vedere eventuali solecismi, ma poi rimarrebbe comunque al SAL 75%... a meno che non lo si pubblicasse su Amazon come print-on-demand :-) Che ne pensate? --.mau. (disc.) 10:09, 17 gen 2023 (CET)[rispondi]

In che senso i volumi con opere di Pirandello sono sotto copyright? Nel senso che hanno introduzioni e note a piè di pagina di autori ancora sotto diritti? Le introduzioni è facile toglierle, basta non scansionarle, le note a piè di pagina è più complicato cancellarle dalle scansioni. Poi naturalmente ci sono i 20 anni di diritti dalla pubblicazione di nuove edizioni critiche...
E comunque il testo di Pirandello è qui in un'edizione del 1925, per vederla tutta basta scrivere a Google Libri con il metodo che tutti conosciamo: https://books.google.it/books?id=PqlIAQAAMAAJ&q=il+berretto+a+sonagli&dq=il+berretto+a+sonagli&hl=it&newbks=1&newbks_redir=0&source=gb_mobile_search&sa=X&ved=2ahUKEwi02c7Iwc78AhW4g_0HHUVlC2w4ChDoAXoECAMQAw#il%20berretto%20a%20sonagli Myron Aub (disc.) 12:45, 17 gen 2023 (CET)[rispondi]
@Myron Aub La firma! :-) --Alex brollo (disc.). 00:42, 18 gen 2023 (CET)[rispondi]
Fatto, grazie! Myron Aub (disc.) 09:24, 18 gen 2023 (CET)[rispondi]
ammetto di non conoscere come scrivere a Google Libri :-( --.mau. (disc.) 10:24, 18 gen 2023 (CET)[rispondi]
@.mau.Vai qui:

https://support.google.com/websearch/answer/6113327 Compila i dati mettendo l'URL del libro su Google Libri, scegli l'opzione "Vorrei vedere l'intero libro e credo che il libro sia di dominio pubblico" e alla domanda "come possiamo aiutarti?" Rispondi "il testo x dell'autore y è di pubblico dominio in Italia perché l'autore y è morto più di 70 anni fa, come si legge qui (e metti un link affidabile come Wikipedia o viaf.org)." Di solito il libro viene sbloccato entro due giorni lavorativi (a meno che non ti dicano di no a causa di presenze nel testo di alcune pagine opera di autori sotto diritti, ad esempio introduzioni, illustrazioni e cose simili).Myron Aub (disc.) 11:33, 18 gen 2023 (CET)[rispondi]

grazie! --.mau. (disc.) 12:27, 18 gen 2023 (CET)[rispondi]
È arrivato! --.mau. (disc.) 12:40, 20 gen 2023 (CET)[rispondi]

ucoc! Ucoc!! UCoC!!![modifica]

Cari amici,

noto con dispiacere che qualcosa non funziona ad alti livelli nel sitenotice, per cui non siamo avvertiti di eventi di livello globale: al momento compenso con questo messaggio:

Si sta concludendo il processo decisionale per ratificare le linee guida revisionate per l'applicazione del Codice universale di condotta (UCoC).

Da ieri si vota. In pratica questo codice universale di condotta sarà applicato su tutti i progetti Wikimedia e in tutti gli eventi offwiki della WikiMedia Foundation. Chi è stato a eventi come ItWikiCon o WikiMania o a raduni vari sa che non si scherza: lo scopo dichiarato di questo codice è garantire che gli ambienti virtuali e non virtuali dove editiamo allegramente siano protetti da molestie e discriminazione: chi non vi si attiene potrà essere dunque estromesso dalla partecipazione virtuale o concreta. Ci hanno lavorato decine di utenti per oltre due anni e dunque tale lavoro va conosciuto e approvato. Diamo voce alla validità dei nostri progetti. εΔω 15:28, 18 gen 2023 (CET)[rispondi]

Gadget per trovare errori ortografici[modifica]

Vi ricorderete di questa pagina: Utente:Мишоко/The so-called riletta pages are not so riletta, di cui si era parlato in Wikisource:Bar/Archivio/2022.12#Lo_strano_caso_dell'utente_cirilico. Giorni fa avevo scritto all'autore per capirne di più. Non ci siamo intesi benissimo e non mi ha rivelato tutti i suoi segreti, ma a quanto ne ho capito non c'è un tool magico che da solo scova tutti quegli errori: la lista l'ha ottenuta principalmente scaricando il dump dell'intero Wikisource italiano e poi lanciando una serie di ricerche mediante delle regex, e scartando manualmente i falsi positivi. Lui asserisce di non conoscere l'italiano, ma in realtà lo sa quel tanto che basta per saper cercare anche errori di grammatica, ad esempio un articolo al plurale seguito da un aggettivo al singolare.

Il suo metodo non sembra quindi automatizzabile, ma ad ogni modo mi ha dato l'ispirazione per creare un gadget, che si chiama ErroriOrtografici. Se ve lo attivate, andando su una pagina Indice c'è un bottone "Cerca errori ortografici", che si tira giù tutte le pagine del libro così come appaiono in ns0, ripulite di tutti i template e gli stili, ed esegue una serie di regex, mostrando poi i risultati con tanto di link alla pagina in questione. Vedete per esempio Indice:Guerrazzi - Il secolo che muore III.djvu, che è al 75%: ben 19 errori (magari non correggeteli subito, date tempo a tutti di vederli).

I controlli che vengono fatti sono per il momento pochi e abbastanza banali: una lettera minuscola seguita da una maiuscola, la stessa lettera ripetuta 3 volte, due accenti nella stessa parola e così via. Ovviamente alcuni dei risultati possono essere dei falsi positivi. La cosa può essere estesa cercando ad esempio delle sequenze di lettere non ammissibili in italiano (ad esempio spr è ammissibile, spt non lo è), ma la difficoltà è scrivere delle buone regex. C'è al momento una limitazione: il gadget non funziona su libri di 400-500 pagine o più. (risolta)

Una possibile evoluzione è quella di fargli analizzare tutti gli indici al 100%: c'è un problema di mole dei dati, ma si potrebbe farlo partire da un indice casuale e farlo fermare dopo un tot, così ad ogni esecuzione potrebbe comunque trovare nuovi errori. Non è e non sarà mai un vero correttore ortografico, perché non ha un vocabolario e difficilmente potrò fargli eseguire dei controlli grammaticali, ma è già qualcosa.

Secondariamente, il gadget aggiunge anche un bottone "Scarica il testo puro", che permette di scaricare il solo testo dell'opera senza formattazione, ma comunque "leggibile". Il gadget tirava fuori già questo testo per lanciare le regex, quindi questa funzione mi veniva quasi gratis, e ho pensato che era comodo aggiungerla. Anche il tool WsExport permette di scaricare in formato TXT, ma ci sono comunque una copertina e i credits; qui invece si scarica il solo testo e basta. Can da Lua (disc.) 16:35, 18 gen 2023 (CET)[rispondi]

Interessante. Vale solo per testi almeno al 75 per cento, immagino. Troppi risultati altrimenti. --Lagrande (disc.) 18:28, 18 gen 2023 (CET)[rispondi]
Lagrande: in linea di principio lo puoi eseguire su qualunque indice, ovviamente se la trascrizione è imperfetta troverà tanti risultati. Can da Lua (disc.) 09:25, 19 gen 2023 (CET)[rispondi]
@Candalua Molto interessante. Lo sperimenterò appena possibile. Spero di essere in grado anche di leggere il codice. La ruggine si sta diffondendo con rapidità.... Alex brollo (disc.). 18:08, 19 gen 2023 (CET)[rispondi]
Alex brollo: grazie alla tua esperienza con memoRegex, forse potresti riuscire ad aiutarmi a scrivere altre regex. Can da Lua (disc.) 15:07, 20 gen 2023 (CET)[rispondi]
@Candalua Volentieri, fra l'altro intravedo delle possibili sinergie fra i due strumenti. In generale ho la sensazione che ogni testo è un caso a parte, soprattutto per noi che seguiamo una politica di riproduzione piuttosto rigorosa della fonte; tuttavia il nuovo strumento suggerisce, e non agisce, al contrario di memoRegex, quindi i falsi positivi sono meno problematici. Sono rimasto piacevolmente sorpreso del link seguito da ?highlight, non lo conoscevo affatto, devo approfondire. Alex brollo (disc.). 17:10, 20 gen 2023 (CET)[rispondi]
Alex brollo: esatto, per questo tool bisogna cercare più delle regole generali che possano andar bene per un po' tutti i testi. Magari ci saranno alcuni testi in cui troverà molti falsi positivi (es. testi antichi dove "perche" è scritto senza accento), ma la cosa è comunque accettabile. Restando ai testi "moderni", io sto cercando delle regex che mi diano al massimo un 5-10% di falsi positivi, altrimenti rischi di trovare troppi risultati. Ma già con le regex "banali", sto correggendo montagne di errori... L'highlight è una funzioncina che ho fatto sempre io, in realtà è stato piuttosto facile. Can da Lua (disc.) 17:25, 20 gen 2023 (CET)[rispondi]
@Candalua Una discussione con @Catonif ha messo in evidenza la presenza di grandi buchi nella mia conoscenza delle regex... aimè, le cose sono complicate dal fatto che in teoria dovrei conoscerne almeno tre diversi dialetti (JS, python e Kate/KDE). Sono un po' scoraggiato. A proposito del tool, non ho ancora guardato il codice, intravedo la possibilità di usare il suo output per darlo in pasto al bot, hai già sfruttato questa possibilità? Alex brollo (disc.). 13:56, 22 gen 2023 (CET)[rispondi]
@Candalua Sperimentato :) sui due indici Indice:Pavese - Romanzi Vol. 1, Einaudi, 1961.djvu e successivo. Riconosciuti e segnalati alcuni errori noti, certamente non tutti, ma intanto loro sono spariti. Bravo! Alex brollo (disc.). 15:09, 20 gen 2023 (CET)[rispondi]

Poll regarding January 2023 Wikisource Community meeting[modifica]

Hello fellow Wikisource enthusiasts!

We will be organizing the January 2023 Wikisource Community meeting in the last week of January and we need your help to decide on a time and date that works best for the most number of people. Kindly share your availabilities at the wudele link below:

https://wudele.toolforge.org/5tauCFqk8NJQBcBv

Meanwhile, feel free to check out the page on Meta-wiki and suggest topics for the agenda.

Regards

KLawal-WMF and PMenon-WMF

Sent via MediaWiki message delivery (disc.) 04:48, 20 gen 2023 (CET)[rispondi]

Un altro quasi-doppione[modifica]

Mi sono imbattuto nell'Indice:Fior di Sardegna.djvu: una trascrizione iniziata e poi abbandonata a causa della mancanza dalla scansione di una decina di pagine (83-94) e della presenza di Indice:Fior di Sardegna (Racconti).djvu, scansione della stessa opera ma di un'edizione diversa (pubblicata tre anni dopo), ora al 100%. Ha senso tenere anche la scansione incompleta in attesa di trovarne una completa proprio di quell'edizione?

C'è anche il ns0 da sistemare: al titolo Fior di Sardegna c'è l'opera proveniente dalla scansione incompleta, mentre quella completa è in Fior di Sardegna (Madella), la cui disambiguazione è ambigua perché entrambe le edizioni sono della Casa Editrice Madella. Cosa si usa in questi casi? L'anno di pubblicazione? Dr ζimbu (msg) 17:33, 22 gen 2023 (CET)[rispondi]

Fatto un preliminare: creata Opera:Fior di Sardegna sfruttando l'elemento wikidata già attivo d:Q63439482; dopo cancellazione del doppione e spostamento della pagina Fior di Sardegna (Madella) a Fior di Sardegna i collegamenti a wikidata dovrebbero restare a posto. --Alex brollo (disc.). 11:21, 23 gen 2023 (CET)[rispondi]
Comincio a organizzarmi, partendo dalla cancellazione di Fior di Sardegna e spostamento da Fior di Sardegna (Madella) a Fior di Sardegna. Non lascio redirect, così i link da modificare (che diventeranno "rossi") saranno più evidenti. Alex brollo (disc.). 11:11, 24 gen 2023 (CET)[rispondi]
Finito, Alex brollo (disc.). 13:57, 24 gen 2023 (CET)[rispondi]
bene :-) --.mau. (disc.) 17:21, 26 gen 2023 (CET)[rispondi]

Notizie tecniche: 2023-04[modifica]

MediaWiki message delivery 00:46, 24 gen 2023 (CET)[rispondi]

Invitation to join Wikisource Community meeting (28 January 2023)[modifica]

Hello fellow Wikisource enthusiasts!

We are the hosting the first Wikisource Community meeting of the year on 28th January 2023 at 12 PM UTC / 5:30 PM IST (check your local time) according to the wudele poll.

The first half of the meeting will be focused on non-technical updates and conversations like events, conferences, proofread-a-thons and collaborations. The second half will be focused on technical updates and conversations, such as talking about major challenges faced by Wikisource communities, similar to the ones conducted in previous Triage meetings.

If you are interested in joining the meeting, kindly leave a message on sgill@wikimedia.org and we will add you to the calendar invite.

Meanwhile, feel free to check out the page on Meta-wiki and suggest any other topics for the agenda.

Regards

KLawal-WMF, PMenon-WMF, Sam Wilson (WMF), and Satdeep Gill (WMF)

Sent using MediaWiki message delivery (disc.) 14:03, 25 gen 2023 (CET)[rispondi]

Ferretti - Centoventi sonetti in dialetto romanesco[modifica]

L’indice dice che le paggine so’ state trascritte tutte. Mo’ vie’ er probblema: li sonetti vanno direttamente in namespace principale (presempio Sur repiano de le scale) o puranco bigne mettece davante er nome der libbro (pe’ capisse: Centoventi sonetti in dialetto romanesco/Sur repiano de le scale). A me me pare mejo la seconna, ma si dite ch’è meij a prima, me adeguo. Carlo M. (disc.) 16:02, 26 gen 2023 (CET)[rispondi]

@Carlomorino @OrbiliusMagister La prima. E’ una indicazione piuttosto recente, il tempo dirà se è sostenibile, sostenuta da Edo. Eccezione: le corone di sonetti, in cui sonetti multipli (di solito numerati) costituiscono un blocco unico.
Preliminare un controllo di eventuali pagine omonime. Basta creare un "indice" provvisorio con i titoli delle pagine, se tutti i link sono rossi è tutto ok. Lo faccio sulla pagina Centoventi sonetti in dialetto romanesco. Alex brollo (disc.). 19:14, 28 gen 2023 (CET)[rispondi]
Mi correggo... pensavo che in Sommario i link fossero di tipo 2. Sono già di tipo 1, e nell’indice tutti sono rossi... nessuna omonima:-)
Se al tl|Intestazione si aggiungono due parametri prec= e succ=, da riempire con i titoli dei sonetti precedente e seguente, meglio. @Candalua Forse sarebbero da aggiungere anche nel modello automatico di Intestazione; guai, se sono lasciati vuoti, non dovrebbero farne. Alex brollo (disc.). 19:24, 28 gen 2023 (CET)[rispondi]
Rispiego il criteri per scegliere la prima (sonetti singoli non sottopagine con template raccolta!) o la seconda ipotesi (sonetti come sottopagine della raccolta)
La domanda da porsi è "l’ordine delle poesie corrisponde a una sequenza scelta daal’autore oppure è un puzzle o un’antologia creata dal curatore?" Nel primo caso ricorrerei alla sequenza di sottopagine che compare nel testo, nel secondo "libererei" le poesie.
P.S. Non mi sento depositario di una verità indiscutibile: anch’io sto macerandomi nel dubbio: quando vedo L'infinito da solo e L'Infinito, con Versi del conte Giacomo Leopardi/L'Infinito, Idilli (Leopardi)/L'Infinito, Canti (1831)/L'infinito, Canti (1835)/L'infinito e Canti (Leopardi - Ranieri)/XII. L'infinito alla fine mi chiedo come riunirli in una pagina opera senza che ci sia una chiarezza definitiva su come definirli (a partire dal titolo) sia come singola opera che come parte della raccolta. Aiuto!
@OrbiliusMagisterLa firma!:-)
Fin dagli albori dell’avventura wikidata per i "libri", ho intuito che un problema serio sarebbe stato quello di chiarire cos’è un’opera, in particolare per i componimenti poetici, talora brevissimi, talora fantasiosamente aggregati (tipico esempio le corone di sonetti). Prima o poi i nodi dovevano venire al pettine... ci siamo. :-). Fin dall'inizio, mi sembrava opportuno, per motivi "databasistici", dare a qualsiasi componimento letterario, sonetti compresi, la dignità di opera; quindi sono favorevole alla separazione di ogni sonetto in una pagina ns0 principale. Non si perde la grande comodità di disporre di una barra di navigazione: basta aggiungere e compilare i due parametri prec= e succ= al tl|Intestazione, e utilizzare sistematicamente il tl|Raccolta.

Aggiornare la Guida alla pubblicazione di un testo[modifica]

In una delle ultime discussioni avevo dato per scontato che ormai fosse noto a tutti il metodo per chiedere a Google Libri di visualizzare completamente un testo di pubblico dominio e invece mi sbagliavo. Ho notato che nella Guida qui non solo non viene descritta questa possibilità ma mi sembra che non vengano neanche citati altri argomenti fondamentali quando si inizia a scegliere un testo da trascrivere. Penso a cose come il problema di ricercare l'anno di morte dell'autore per sapere se è di pubblico dominio o no, il problema di come accorgersi di pagine mancanti o illeggibili e come recuperarle e un po' di conoscenza dei cataloghi bibliotecari in rete nel caso si volesse sapere se un libro è disponibile in biblioteche a pochi passi da casa. O forse questi argomenti sono trattati in altre sezioni di Wikisource? Io non mi ritengo il massimo esperto di questi temi ma un po' di conoscenze ne ho accumulate. Non so se a voi interessa condividerle in modo approfondito... Myron Aub (disc.) 11:51, 29 gen 2023 (CET)[rispondi]

@Myron Aub Sì sì facciamolo!
(Chi comincia? E' un lavoretto facile...) Alex brollo (disc.). 18:08, 29 gen 2023 (CET)[rispondi]
@Alex Brollo Intanto scrivo qui le conoscenze che ho. Il metodo per chiedere a Google Libri di visualizzare testi di pubblico dominio l'ho già descritto in un post sopra. Io poi di solito cerco l'anno di morte di autori semisconosciuti (cioè che non ci sono su Wikipedia e sul sito Treccani) usando il sito viaf.org, Google Libri e l'SBN. Per accorgersi di pagine mancanti io uso la tecnica veloce di confrontare la differenza tra il numero della pagina in pdf/djvu e il numero scritto sulla pagina cartacea (che però funziona solo se non ci sono "tavole fuori testo"). Le pagine illeggibili invece possono essere scoperte solo manualmente. Per recuperare le pagine mancanti o illeggibili di solito il metodo più veloce è scrivere una mail a una biblioteca che possiede quel volume (si può anche scrivere a Google Libri se il testo è su questo sito però i tempi possono essere anche lunghi). Per quanto riguarda i cataloghi bibliotecari oltre all'SBN è importante conoscere il proprio catalogo provinciale (che spesso contiene titoli non presenti nell'SBN) e anche il proprio catalogo provinciale delle biblioteche scolastiche (moltissime di queste biblioteche sono assenti dall'SBN). Poi si potrebbe anche segnalare l'opzione di comprare libri vecchi in siti dell'usato (Amazon, eBay, comprovendolibri, maremagnum e abebooks). Non so se voi potete integrare queste conoscenze con altre... --Myron Aub (disc.) 21:10, 29 gen 2023 (CET)[rispondi]
@Myron Aub Naturalmente la mia risposta era dolorosamente ironica. Alex brollo (disc.). 10:53, 30 gen 2023 (CET)[rispondi]
@Myron Aub Esiste un modello alternativo di governo della pubblicazione dei testi, quello di de.wikisource, che andrebbe studiato a fondo (oltre alla procedura di avvio della pubblicazione, il progetto ha anche altre profonde differenze con il mainstream, guidato da fr.wikisource e en.wikisource). Su de.wikisource, per il poco che ne so, la proposta di caricamento viene discussa a fondo prima di iniziare il lavoro, analizzando sia le fonti disponibili, che le risorse effettivasmente disponibili per il completamento della trascrizione. Immagino che questa politica comporti che il caricamento sia effettuato da utenti specializzati, che hanno bisogno di pagine di documentazione del tutto diverse da quelle che servono a utenti neofiti. Alex brollo (disc.). 11:34, 30 gen 2023 (CET)[rispondi]
@Alex brollo Sono andato sulla Wikisource tedesca ma mi risulta che questa "discussione preliminare" (che avviene in una sezione chiamata "Skriptorium") sia obbligatoria solo per i testi non caduti in pubblico dominio ma con licenza CC concessa dall'autore mentre per i testi di pubblico dominio più lunghi di 25 pagine la "discussione preliminare" è "altamente consigliata". Ho notato inoltre che lo "Skriptorium" comprende sia uno sportello "tecnico" su come fare al meglio la digitalizzazione sia uno sportello "informativo" su temi appunto come la ricerca di testi cartacei in biblioteche o altrove e relative scansioni, il verificare se un autore è di pubblico dominio o no e così via. Più che studiare questi modelli avrebbe più senso conoscere persone esperte di questi temi nell'ambito dei libri italiani... --Myron Aub (disc.) 16:16, 6 feb 2023 (CET)[rispondi]

Notizie tecniche: 2023-05[modifica]

MediaWiki message delivery 01:05, 31 gen 2023 (CET)[rispondi]