Wikisource:Bar/Archivio/2014.11

Da Wikisource.
Archivio delle discussioni del mese di novembre dell'anno 2014

Categoria: Archivio Bar 2014 Bar   Archivio    novembre 2014 



Meditazioni sulla economia politica[modifica]

Ciao, per il compleanno di Wikisource BEIC ci consiglia e offre due opere (BEIC vuole sostenere il concorso anche in altri modi, ma una cosa alla volta). Una di queste viene dalla Fondazione Raffaele Mattioli per la storia del pensiero economico: Pietro Verri, Meditazioni sulla economia politica con annotazioni. Vedo che abbiamo già Indice:Meditazioni sulla economia politica.djvu ma poche pagine sono state fatte, inoltre il PDF è meno compresso (ed eventualmente si possono avere risoluzioni maggiori); l'OCR mi pare di qualità simile.

Che mi dite, l'opera interessa? Federico Leva (BEIC) (disc.) 12:07, 30 ott 2014 (CET)[rispondi]

Bellissimo! Ci sto,
ehm… e il secondo libro? εΔω 13:00, 30 ott 2014 (CET)
Potremmo evitare sistematicamente il formato pdf? Lo odio profondamente. Sarei ben lieto di bandirlo da Commons. Inoltre, non può essere generato lo strato hOCR su cui sto lavorando grazie al tool di Phe, che si "appoggia" al tipico e magnifico strato testo mappato dei file djvu. --Alex brollo (disc.) 13:25, 30 ott 2014 (CET)[rispondi]
(bi-conflittato) Ah, ti ho incuriosito, bene! L'altro libro è [1], non l'ho ancora messo perché al momento ci manca l'OCR. --Federico Leva (BEIC) (disc.) 13:32, 30 ott 2014 (CET)[rispondi]
Alex, è quello che c'è, non mi avventurerei in conversioni. Se dici che il DjVu esistente è meglio, cercheremo un'altra opera di cui non esista un DjVu. --Federico Leva (BEIC) (disc.) 13:32, 30 ott 2014 (CET)[rispondi]
No, no, il testo va benissimo, fra l'altro l'edizione è diversa da quella che abbiamo già caricato! si tratta solo di scaraventare il pdf su Internet Archive e farglielo derivare. Se un pdf può stare su Commons, a maggior ragione può essere caricato su Internet Archive; e se il djvu risultante è difettoso, si può sempre accedere alle immagini ad alta risoluzione di Internet Archive, una a una, come tu mi hai insegnato. --Alex brollo (disc.) 15:31, 30 ott 2014 (CET)[rispondi]
Concordo con quanto dice Alex. Inoltre osservo che sono due edizioni diverse e andrebbero conservate entrambe.
Per quella nuova sarebbe il caso di iniziare ad applicare le convenzioni di denominazione dei file DjVu, così iniziamo la buona prassi. --Accurimbono (disc) 16:08, 30 ott 2014 (CET)[rispondi]
touchè; chiedo subito il rename del file su Commons, appena effettuato rinominerò anche il file Indice. Ritengo siano da evitare, nel limiti del possibile, i redirect: meglio rinominare ab origine (ossia, su Commons). --Alex brollo (disc.) 16:43, 30 ott 2014 (CET)[rispondi]
✔ Fatto - Rinomino immediatamente "in fiducia" la pagina Indice. --Alex brollo (disc.) 16:54, 30 ott 2014 (CET)[rispondi]
Grazie per la segnalazione, anche il mio PDF è da rinominare no? "Verri - Meditazioni sulla economia politica con annotazioni, 1771.pdf"? Lunghetto. --Federico Leva (BEIC) (disc.) 16:58, 30 ott 2014 (CET)[rispondi]
Ho chiesto il rename del tuo file su Commons, causale 6, "armonizzazione", in: File: Verri - Meditazioni sulla economia politica, 1771.pdf. Aspettiamo che il link si bluizzi e allora la pagina Indice: Verri - Meditazioni sulla economia politica, 1771.pdf si animerà. --Alex brollo (disc.) 17:13, 30 ott 2014 (CET)[rispondi]
Bluizzato. Date un po' un'occhiata alla pagina Meditazioni sulla economia politica con annotazioni. Non ho ancora provato a stressarla con diverse risoluzioni di schermo, tengo i diti incrociati....--Alex brollo (disc.) 00:57, 31 ott 2014 (CET)[rispondi]
Ho avuto una proposta alternativa: [2]. Potete vedere la Scorta di economia in IA, l'OCR è abbastanza atroce no? (Ho provato, ma unpaper non riusciva a de-ondularlo.) Decidete voi. :) --Federico Leva (BEIC) (disc.) 13:14, 31 ott 2014 (CET)[rispondi]
Che peccato, averlo "ingrigito".... ho l'impressione che l'occhio fatichi di più a leggerlo. Per l'OCR penso non ci sia alcun guadagno: tanto converte brutalmente in BW secondo i suoi propri criteri prima dell'interpretazione. Confermo, l'OCR è al limite della inutilizzabilità; quello che ci vorrebbe qui, sarebbe un buon interprete vocale, chi di vuoi ne ha usati? Il mio caro vecchio Dragon era una meraviglia....
@Federico Leva (BEIC)Hai potuto forse caricare Verri su IA? Mi raccomando, se lo fai, niente "ingrigitura", carica il pdf come sta.--Alex brollo (disc.) 15:58, 31 ott 2014 (CET)[rispondi]
Il Della moneta non l'ho caricato perché aspettavo vostri pareri: vi serve o no? Mi dici che il PDF non va bene? Ha un OCR che non sembra male? Non ci capisco piú nulla, che cosa volete che carichi e dove? :( --Federico Leva (BEIC) (disc.) 12:45, 4 nov 2014 (CET)[rispondi]
Mi spiace di aver confuso le cose. Secondo me, la via maestra è: caricare tutti i file pdf su Internet Archive, e utilizzare il djvu prodotto da Internet Archive per Commons; idem se si dispone di file TIFF da scansione originale. Questo dovrebbe essere il primo passo; in casi particolari, si può rifinire e migliorare in seguito. --Alex brollo (disc.) 20:47, 4 nov 2014 (CET)[rispondi]
Ma quindi evito di chiedere alla gente che mi faccia o dia l'OCR? Se preferiamo quello di IA a prescindere mi risparmio un po' di accattonaggio. :) --Federico Leva (BEIC) (disc.) 18:51, 5 nov 2014 (CET)[rispondi]

Ecco qui il secondo libro: File:Vasco - Della moneta, 1788.djvu. L'OCR di IA non è meglio di quello originale, direi; ma nemmeno peggio: sbagliano cose diverse ma piú o meno nella stessa quantità, a occhio. --Federico Leva (BEIC) (disc.) 20:37, 12 nov 2014 (CET)[rispondi]

Li ho aggiunti a Wikisource:Undicesimo compleanno di Wikisource. --Federico Leva (BEIC) (disc.) 10:02, 20 nov 2014 (CET)[rispondi]

Proposta per patrollare[modifica]

Se "desalutassimo" (ossia: cancellassimo le pagine discussione degli utenti con zero contributi) e prendessimo l'abitudine di benvenutarli solo dopo il primo edit, vedremmo a colpo d'occhio in Ultime modifiche la situazione "primo edit dell'utente", dalla combinazione pagina discussione rossa - contributi blu) e potremmo dare un'occhiata al primo contributo; molti degli spammer si smascherano con il loro primo contributo. --Alex brollo (disc.) 09:26, 31 ott 2014 (CET)[rispondi]

Mi scuso del "tecnicismo", annoto qui giusto per non dimenticarmene. Pasticciando con la console js vedo che in Ultime modifiche, lanciando:
$(".mw-usertoollinks").each(function() {
     if (!($("a",$(this)).eq(0).attr("class")==="new")) $(this).parent().remove(); 
     if ($("a",$(this)).eq(1).hasClass("new")) $(this).parent().remove();
})
restano in evidenza proprio gli utenti con "discussione rossa e contributi blu" + gli utenti anonimi che hanno fatto modifiche. Più fortuna che giudizio, eh... Alex brollo (disc.) 10:49, 31 ott 2014 (CET)[rispondi]
  • bisogna sempre stare attenti a chi si saluta. E' un brutto mondo là fuori... Comunque ricordatevi che "prevenir is megl che curar", e che abbiamo a disposizione il potentissimo strumento del FiltroAntiAbusi, col quale possiamo stroncare sul nascere quasi qualunque attacco da parte delle forze del male. Candalùa (disc.) 10:53, 31 ott 2014 (CET)[rispondi]
Triste ma vero: devo dar ragione a Candalua, io che sono un fervido sostenitore del saluto preventivo. C'è anche una ragione pratica per togliere il saluto agli utenti senza edit anche retroattivamente: in caso di usurpazione dell'utenza non cisarà bisogno di spostare una inutile pagina di discussione. - εΔω 19:24, 31 ott 2014 (CET)[rispondi]
Personalmente un'eventuale desalutazione la troverei atroce. La cancellazione vera e propria delle discussioni la considero assolutamente impraticabile, perché mandereste migliaia di (orrende) notifiche per posta elettronica a tutte quelle persone. --Nemo 21:54, 12 nov 2014 (CET)[rispondi]
D'accordissimoː un lavoro in meno a cui pensare non appena tornerò operativo. L'avessi saputo prima...--Barbaforcuta (disc.) 17:07, 29 nov 2014 (CET)[rispondi]

update newThumbs[modifica]

  1. a Xavier121 newThumbs non partiva; scovato il problema, aveva un vector.js con funzioni di vario tipo, alcune in conflitto; quindi, prima di rinunciare, svuotate temporaneamente i vostri vector.js e common.js e provate; poi riattivate uno alla volta i vostri aggeggi e segnalatemi quelli che risultano bloccanti.
  2. abbiamo lo script per il preview! Non è ancora montato ma il motore è funzionante. Una volta attivato, newThumbs passa dalla fase di bozza alla fase alfa (può essere provato da coraggiosi in una interfaccia completa) e, dopo rifinito graficamente, passerà in fase beta (e lo annunceremo in lista wikisource). --Alex brollo (disc.) 11:07, 31 ott 2014 (CET)[rispondi]
Io uso il gadget che simula il tuo ambiente di modifica. Se mi scrivi qui sotto il codice per incorporare lo script nel proprio vector.js mi presto come cavia, vale a dire che parto da un vector.js minimale minimale e un po' alla volta aggiungo materiale. - εΔω 19:16, 31 ott 2014 (CET)[rispondi]
Il gadget simulatore della mia utenza mi mette in molto imbarazzo.... va be', grazie del coraggio. Comunque, il preview sarà integrato in newThumbs e l'unica modifica dell'interfaccia sarà un bottone "anteprima" vicino al bottone "salva" del box di edit. Chi attiva newThumbs lo potrà provare immediatamente: spero, se tutto va bene, fra una mezz'ora. --Alex brollo (disc.) 22:02, 31 ott 2014 (CET)[rispondi]
✔ Fatto --Alex brollo (disc.) 23:09, 31 ott 2014 (CET)[rispondi]

Anomala indentatura del primo paragrafo in nsPagina[modifica]

Date un'occhiata a qualche pagina: il primo paragrafo non dovrebbe più risultare indentato. Il ritocco è in MediaWiki:Common.css, elementi .pagetext p:first-child; spero che non ci siano conseguenze impreviste. In caso invocate pure S. Rollback. --Alex brollo (disc.) 16:00, 2 nov 2014 (CET)[rispondi]

  • Ciao Alex. Vedo che la brutta notizia la devo dare io. Ho verificato su alcune pagine SAL75% e SAL100% ma l'indentatura di nsPagina resta sempre indentata. Quindi... nulla di fatto, nada di nada a meno che non sia il mio profilo che, per qualche motivo ignoto, non recepisce la tua modifica. Se hai bisogno dei link sui testi che ho utilizzato batti un colpo (ma mi sembra che il problema sia generico). Buona giornata Alex. --Stefano mariucci (disc.) 13:50, 3 nov 2014 (CET)[rispondi]
first-child non va bene, perché a volte il primo p non è il figliolo primogenito del pagetext (perché magari ci sono altre cose prima, tipo il RigaIntestazione). Ho sostituito con .pagetext > p:first-of-type, cioè il primo figlio di tipo p. Ovviamente, dato che questi trucchetti sono sempre CSS3, i browser vecchiotti non ne terranno conto. Candalùa (disc.) 14:42, 3 nov 2014 (CET)[rispondi]
Ottimo, funzia, anche se mi sfugge la differenza (p:first-child non significa "il primo p figlio di pagetext"?); indifferente, funzia p:first-of-type, quindi: problema risolto. Attenzione però:per vedere il primo paragrafo indentato quando va indentato, occorre mettere il {{nop}} (oppure un <noinclude/> che è lo stesso e forse fa risparmiare un milionesimo di secondo al server) alla francese, ossia: all'inizio della pagina, seguito da riga vuota, e non (come io ero abituato a fare) riga vuota + {{nop}} alla fine della pagina precedente) . Vedi la maggior parte delle pagine di Indice:Così parlò Zarathustra.djvu, in assoluto il testo con più paragrafi che abbia mai visto! --Alex brollo (disc.) 23:38, 3 nov 2014 (CET)[rispondi]
Quello che vedo, però, è che se faccio così in nsPagina la riga vuota all'inizio la vedo, il che non è il massimo dal punto di vista della resa visuale. Vedo anche che il "vecchio" sistema del tag <p></p> non funziona. Certo, si può sempre usare {{indent|2|, ma anche lì se il paragrafo è più lungo della pagina le cose si complicano (è fattibile). --Cruccone (disc.) 13:11, 6 nov 2014 (CET)[rispondi]
indent-2 non funziona, squadra il paragrafo seguente... --Cruccone (disc.) 13:22, 6 nov 2014 (CET)[rispondi]
Raccomanderei di far tesoro del vecchio proverbio "Il meglio è nemico del bene" e di non tentare in alcun modo di modificare con aggiustamenti di qualsiasi genere quello che il software adesso produce sul primo paragrafo. L'adozione sistematica del nop+riga vuota, o del nowiki + riga vuota "alla francese" risolve il problema concreto di visualizzare l'inizio paragrafo in testa di pagina con l'indentatura; e la modifica css permette di visualizzare la prima riga non indentata quando è la continuazione di un paragrafo già iniziato (anche nel caso ambiguo in cui inizi proprio a inizio pagina un periodo, che è comunque la continuazione di un paragrafo). Lo spazio fra intestazione e prima riga è troppo ampio? Pazienza. Quello che conta è un codice semplice, una ottima transclusione, e l'adesione più profonda possibile a standard wikisource comuni interprogetto (e secondo me il "modello" è fr.source, come già ho avuto occasione di suggerire). --Alex brollo (disc.) 18:30, 7 nov 2014 (CET)[rispondi]

hOCR[modifica]

Permettetemi di condividere una grandissima soddisfazione. Ho appena scoperto - grazie a newThumbs - il fantastico tool OCR.js di Phe, che restituisce al volo una rappresentazione mappata delle parole di una pagina djvu - un sogno che rincorrevo da anni. Questo è tecnicismo, ma i risultati già si vedono dentro newThumbs. Ma la soddisfazione è: Phe ha usato anche un po' di mio vecchio codice, che gli avevo segnalato! Adesso io userò il suo codice per andare avanti, e forse Phe userà il mio nuovo codice, costruito sul suo, per andare ancora avanti, e così il magnifico ping pong del software libero continuerà. Che bellezza! --Alex brollo (disc.) 08:02, 3 nov 2014 (CET)[rispondi]

Uh, c'è qualche cosa di visibile anche per noi profani? (cavoli, Phe mi pare non dica mai niente delle belle cose che fa!) --Aubrey (disc.) 17:15, 3 nov 2014 (CET)[rispondi]
Phe mi diceva che aveva annunciato il tool in lista, ma la cosa evidentemente non aveva creato alcun entusiasmo. Ad apprezzare il testo mappato dei file djvu, in wikisource, siamo una manciata.... nel mondo. Certo che c'è qualcosa di visibile: il tasto OCR chiama proprio le routine di Phe; solo che la routine com'è non usa affatto la mappatura.... usa solo il testo. Riceve dal server il testo hOCR, e butta via tutto estraendo il solo testo. :-( Il motivo: in apparenza hOCR è un orribile guazzabuglio.... però, superando il primo momento di sconforto....
Quello che è veramente bello è che è hOCR è xml puro ossia: jQuery ci sguazza, e rende semplice quello che altrimenti semplice non era affatto.
Mi domando quante ottime idee ci siano in giro sparpagliate e semisconosciute, e perchè non vengano afferrate al volo. D'altronde, ho menzionato in wikipedia i tool di Vlsergey, il sesto grado superiore dell'uso di javascript in wiki, e praticamente la segnalazione è caduta nel vuoto. --Alex brollo (disc.) 21:46, 3 nov 2014 (CET)[rispondi]
Eh, hai ragione. La cosa che avevi iniziato sulla Wikisource multilingue (shared scripts) secondo me era bella, ma lì l'importante non è iniziare le cose, ma mantenerle abbastanza perchè diventino standard e usate dagli altri... Pensa la fatica che abbiamo fatto, in anni, ad avere una mailing list, a cercare di riunire gli utenti delle Wikisource, a farli venire a Wikimania... Piano piano si vedono i frutti, ma con una tale lentezza che non si sa neanche se le nostre azioni hanno avuto effetto o le cose capitano per caso. Riunire le migliore pratiche e strumenti delle Wikisource sarebbe un lavoro (pagato) part-time di sei mesi, con tanto di report e pagine condivise. Bisognerebbe chiedere una borsa di studio IEG :-) --Aubrey (disc.) 09:49, 4 nov 2014 (CET)[rispondi]
Il colmo di wiki: essere lenta :-)
Visto l'interesse di Phe, riunirò script & altro relativo a hOCR in Utente:Alex brollo/hOCRlab.js e appena ci sarà qualcosa di carino passerò l'indirizzo a Phe (che se troverà qualcosa di interessante lo tradurrà dal mio orrido slang javascript a un linguaggio decente)Alex brollo (disc.) 11:12, 4 nov 2014 (CET)[rispondi]

note all'interno di una nota[modifica]

in questa pagine della commedia di Buti ci sono 2 note all'interno di una nota. https://it.wikisource.org/wiki/Pagina:Commedia_-_Purgatorio_(Buti).djvu/645 Come si fa? Cordiali Saluti --Utoutouto (disc.) 18:17, 3 nov 2014 (CET)[rispondi]

Ciao @Utoutouto, se vedi [questa pagina] credo che troverai il modo. Se poi la la nota all'interno della nota dovesse continuare nelle pagine successive, ahimè, è un problema per il quale ho già chiesto aiuto [vedi questa discussione] ma come dice il buon @Alex brollo, il caso è terribbbbile. ;) Ciao --Stefano mariucci (disc.) 18:42, 3 nov 2014 (CET)[rispondi]
Il tutto andrebbe spiegato nella pagina Aiuto:Come aggiungere le note. --Accurimbono (disc) 17:05, 4 nov 2014 (CET)[rispondi]
Ho aggiunto una minispiegazione nella pagina di aiuto, sentitevi liberi di espanderla. @Alex brollo, secondo te si riuscirebbe a rendere più user-friendly questa soluzione, facendo per esempio un "Template:Nota interna" con il tag:ref interno, e un "Template:Sezione note interne" con il tag:references finale? Candalùa (disc.) 17:43, 4 nov 2014 (CET)[rispondi]
Mica è risolto, il caso della pagina citata nella pagina di aiuto... tutto inizia con una nota dentro una nota, ma la nota esterna continua per più pagine, e nella seconda pagina ha una ulteriore nota interna... per ora getto la spugna. --Alex brollo (disc.) 22:40, 4 nov 2014 (CET)[rispondi]

Operette morali[modifica]

Ciao a tutti, apro questa discussione per fare un po' di chiarezza sulle Operette morali di Leopardi. Mi pare noi abbiamo due versioni:

Dalla cronologia della Storia del genere umano, per esempio, mi pare che ci abbiamo lavorato quasi tutti :-), ma mi pare pure che ci sia stato un equivoco.

Posto infatti che la comunità abbia deciso di tenere tutte le versioni possibili (e va bene, è un'opera importante e non ci sono problemi di spazio), sarebbe bene che non si "mischiassero". Infatti sempre da qui mi pare che il buon @Luigi62 abbia fatto un M&S dalle OM del 1827 a quelle del 1918 (e questo va bene, date che quelle del 1918 hanno il testo a fronte e possiamo controllarle tutte), ma abbia poi sostituito il testo del 1918 con la transclusione... Questo non può andare bene, perchè appena la gente si mette a trascivere nella versione del 1927 cambia automaticamente quella del 1918... E questo solo per quello che ho visto... Insomma, è un po' un casino, e dato che fra poco c'è il compleanno e soprattutto che Leopardi è al cinema come film più visto dell'anno forse dovremmo dedicarci della cura. C'è qualcuno che se ne vuole prendere cura? Quanto meno per creare le opere distinte e rimettere a posto in modo che il resto della comunità possa poi lavorare tranquillamente senza incappare in casini :-) --Aubrey (disc.) 11:57, 7 nov 2014 (CET)[rispondi]

  • Strong support!
Per come la vedo io, bisognerebbe completare la separazione delle due edizioni, sistemare bene gli indici, riutilizzare le trascrizioni della edizione trascritta per riempire/popolare le pagine dell'edizione scansionata.
Soprattutto dovremmo cavalcare l'onda di interesse che si è risvegliato attorno alla figura di Leopardi in seguito al film di Martone. --Accurimbono (disc) 12:36, 7 nov 2014 (CET)[rispondi]
Mi sembra che l'unica pagina dove è stato fatto il M&S fosse la "Storia del genere umano", che ho testè rollbackato. Quindi ora suppongo (ma controllate!) che Operette morali contenga a tutti gli effetti il testo dell'edizione del 1827. E questa sarebbe a posto e non andrebbe più toccata. Quindi ora basta lavorare sull'indice, trascludendo su Operette morali (1918). Candalùa (disc.) 14:32, 7 nov 2014 (CET)[rispondi]
Infatti non ho proceduto oltre. Mi aspettavo che chi avesse cominciato l'indice prendesse poi in mano il progetto. Comunque da quello che vedo in Discussione:Operette morali l'edizione è del 1969 e la ritengo perfettamente "rullabile". --Luigi62 (disc.) 17:29, 7 nov 2014 (CET)[rispondi]
Uhmmmm mi fischiano le orecchie... ehm, esattamente 7 anni fa iniziava con le predilette Operette la mia avventura su Wikisource... quanto tempo... :) --Xavier121 17:47, 7 nov 2014 (CET)[rispondi]

Annuncio semitecnico[modifica]

Come sapete, sto scavando dentro le routine che stanno dietro al tasto "OCR" che vedete sotto Zoom/Altro in toolbox. La questione è abbastanza tecnica e annoterò i dettagli altrove, qui vi segnalo come la cosa funziona al momento, perchè non ne siate confusi:

  1. al momento della creazione di una nuova pagina, il software carica un OCR che altro non è che lo strato testo del file djvu (i casi speciali dei file pdf e dei file djvu senza strato testo,non li conosco). Il testo è suddiviso in linee da caratteri fine-linea; viene aggiustato al volo da nostre routine che al momento aggiustano le spaziature, gli apostrofi, e alcuni errori di scansione ricorrenti. Il testo caricato è diverso da quello che viene caricato dal tasto OCR.
  2. in qualsiasi momento, il tasto OCR carica il testo della pagina rendendolo come una serie continua di parole, senza interruzioni di linea. Se esiste uno strato testo djvu viene caricato quello; se non esiste, viene restituito l'OCR prodotto lì per lì (suppongo da tesseract), di qualità in genere molto inferiore. Il tasto OCR attiva gli script di MediaWiki:OCR.js, copia conforme, in questo momento, di mul:MediaWiki:OCR.js, lo script originale condiviso fra più progetti.

Mentre del primo metodo non abbiamo, nè possiamo avere, alcun controllo, possiamo prendere il pieno controllo del secondo metodo; e in realtà, gran parte delle pagine di Indice:Così parlò Zarathustra.djvu che risultano create direttamente a SAL 75% sono il risultato di test di "manipolazione" del secondo metodo. Intravedo cose molto interessanti: ma non immediatamente, c'è da fare un lavoro notevole, e non facile :-(. Pian piano i risultati saranno collegati al tasto OCR; provatelo con cautela. --Alex brollo (disc.) 18:47, 7 nov 2014 (CET)[rispondi]

Una cosa che non ho mai capito, ma secondo me sarebbe una cosa incredibile, è il fatto che noi potremmo allenare il nostro tesseract in italiano, e fra l'altro allenarlo per annate/secoli diversi. Bisognerebbe trovare il modo di archiviare il "dizionario" di tesseract da qualche parte, ma ci vuole uno sviluppo serio e complesso e penso non lo faremo mai... Però Wikisource (come progetto globale) sarebbe un enorme database e posto dove allenare OCR. Ne avevamo parlato anni fa con Federico Boschetti, ma ovviamente il nostro software è ancora 10 anni indietro. --Aubrey (disc.) 11:23, 8 nov 2014 (CET)[rispondi]
Riserverei questo allenamento ai testi italiani antichi; per quelli moderni, il FineReader di Internet Archive è già il massimo, purchè la lingua italiana sia stata specificate nei metadati al momento del caricamento. Il pulsante OCR attualmente lancia al server la richiesta di estrarre lo strato testo del djvu, e in caso di insuccesso, manda una seconda richiesta di eseguire un OCR (suppongo, tesseract) sull'immagine della pagina (aimè, a risoluzione bassina). In questa seconda richiesta invia anche un parametro "language"; per attivare un dizionario alternativo, es. "italiano antico", occorrerebbe trovare il modo di inviare un parametro diverso da quello di default. Penso che Phe sappia come fare e cosa chiedere "in alto loco". Avevo privato il dizionario "ancient Italian" su tesseract, ma non ero soddisfatto del risultato; i testi antichi restano un osso duro per qualsiasi OCR. La mia idea è che per i testi antichi la soluzione finale è Dragon - o un altro software di riconoscimento vocale, in modo da dettare la trascrizione. --Alex brollo (disc.) 13:02, 13 nov 2014 (CET)[rispondi]

Un epub di 6.800 pagine[modifica]

Ho provato a creare un epub da Donne e Uomini della Resistenza . Ho visto che i tempi di caricamento erano molto lunghi, ma poi è venuto fuori un epub di 6.800 pagine, ma che mi sembra funzioni bene. Lo dico per curiosità, perchè credo che dalle nostre parti sia un record e dimostra che il convertitore è molto efficiente. Ho fatto la prova che è nettamente più veloce scaricarlo dal sito dove ne ho salvata una copia [3] il che dimostra che per diversi aspetti avere un sito che raccoglie gli epub può offrire dei vantaggi, purchè sia periodicamente aggiornato.--Mizar (ζ Ursae Maioris) (disc.) 18:58, 7 nov 2014 (CET)[rispondi]

Fantastico, grazie per la coraggiosa prova! --Nemo 21:02, 12 nov 2014 (CET)[rispondi]
Per risparmiare un po' di fatica, sto mettendo qui tutti i testi sal100 e sal75 in ePub fatto da WSexport: http://koti.kapsi.fi/~federico/itsource/ --Nemo 21:46, 14 nov 2014 (CET)[rispondi]

Template Pt[modifica]

Nell'eterna lotta per rendere Wikisource più semplice da editare, credo che uno dei nostri nemici peggiori siano le parole tronche. Io stesso, dopo anni, non mi ricordo come si usa il template {{Pt}} (non mi ricordo cosa visualizza il primo parametro e cosa il secondo}}, e inoltre ci sono modalità diverse di usarlo:

  • usare {{pt}} nella prima metà della parola tronca, usare <noinclude> nella seconda
  • usare <noinclude> nella prima metà della parola tronca, usare {{pt}} nella seconda
  • usare {{pt}} in entrambe

La mia domanda, dunque, è: non riusciremmo a fare un {{pt1}} e un {{pt2}}, uno che va nella prima parte e l'altro che va nell'altra? Il pregresso possiamo lasciarlo così com'è, ma il futuro sarebbe più semplice. E' ovvio che i due template vanno usati bene e forse non è semplice la visualizzazione in ns0, ma sarebbero semplicissimi e uno saprebbe sempre quale usare... Aubrey (disc.) 11:49, 8 nov 2014 (CET)[rispondi]

  • ho sempre avuto lo stesso problema con altri parametri per i quali la visualizzazione si comporta fra di loro in maniera opposta ossia in uno si visualizza il primo parametro, nell'altro il secondo. (se non ricordo male). Questi sono {{Var}} e {{Ec}} Ho fatto la prova e ... ricordavo male :( --Stefano mariucci (disc.) 19:53, 8 nov 2014 (CET)[rispondi]
E' un problema di comunicazione. Esiste un tool, autoPt, che si può usare indifferentemente sulla parte iniziale della parola tronca, a fine pagina, e sulla parte finale della parola sulla pagina successiva. Automaticamente si compila in modo corretto.
Comunque, se c'è accordo, possiamo procedere all'importazione del "Pt francese" che funziona come dice Aubrey: due diversi template, che si compilano in modo identico con i due spezzoni delle parole (senza trattino) con il vantaggio di avere la parola "intera" in entrambe le pagine; ma lo svantaggio, per me insopportabile, di non poter compilare il template nella pagina precedente se non dopo aver dato un'occhiata alla successiva, per vedere "come finisce" la parola. Quindi, non sostituirei Pt, ma gli affiancherei due template Pt1 e Pt2 che operino "alla francese" e pure "all'inglese", producendo, ovviamente, l'identico risultato sia in visualizazzione che in transclusione. --Alex brollo (disc.) 13:39, 11 nov 2014 (CET)[rispondi]
Intanto ho ricollegato il template al Pt giusto su wikidata, adesso la lista degli interprogetto è più ragionevole e compare anche il fr:Modèle:Tiret che emulerei in {{Pt1}}, che si accoppia con fr:Modèle:Tiret2 che emulerei con {{Pt2}}. Con calma troveremo per i due template nomi "lunghi" che autospieghino l'uso del template (suggerimenti?) Alex brollo (disc.) 17:31, 11 nov 2014 (CET)[rispondi]
non ho ben capito... Con autoPt se io metto il template direttamente nella parola tronca della pagina precedente mi mette tutto a posto nella pagina successiva e viceversa? Se funziona bene perchè non è nel commons.js? Aubrey (disc.) 21:41, 11 nov 2014 (CET)[rispondi]
No, non "e viceversa", sistema solo nella seconda pagina. Pt è fatto per "andare avanti pagina per pagina". Immagina una parola spezzata "tem-plate". Alla fine della pagina n c'è tem-; seleziono e clicco autoPt. Lo script osserva che siamo a fine pagina, quindi scrive {{Pt|tem-|}}. Nella pagina successiva seleziono plate e clicco sempre autoPt. Lo script sa che siamo a inizio pagina; conosce anche il testo della pagina precedente (e anche di quella precedente); quindi vede che alla fine della pagina precedente c'è un template Pt, e che contiene tem-. Allora ha tutti gli elementi per scrivere {{Pt|plate|template}}. E lo fa. Dove sta scritto? Forse da nessuna parte; me ne scuso, ma veramente non riesco a documentare tutto, e soprattutto mi manca il feedback necessario a capire quali strumenti sono utili solo a me, e quali utili a tutti.
Ma torniamo al Pt1 + Pt2 "alla francese", analogo al Tiret e Tiret2 degli amici francesi e ai Hyphenated word start e Hyphenated word end degli inglesi. Ce li facciamo? --Alex brollo (disc.) 23:52, 11 nov 2014 (CET)[rispondi]


...sembra incredibile, ma solo grazie a questo post ho finalmente capito il significato di Pt, cioè ParolaTronca! In tanti anni non ci ero mai arrivato. :D Sentite, ma invece di fare due template Pt1 e Pt2, che poi qualcuno riuscirà a confondersi ancora più di adesso, perché non facciamo semplicemente un alias {{ParolaTronca}} e insegniamo a tutti a scrivere {{ParolaTronca|pa-}} e {{ParolaTronca|rola|parola}}? E oltre a ciò, dall'autoPt dobbiamo assolutamente ricavare un gadget da attivare di default per tutti, con un bottone nella barra in alto. Candalùa (disc.) 12:25, 12 nov 2014 (CET)[rispondi]

D'accordo con Candalua, con una modifica: non è possibile far sì che funzioni {{ParolaTronca|pa-}} e {{ParolaTronca|rola}}?
Mi pare la cosa più naturale per tutti. --Aubrey (disc.) 21:42, 12 nov 2014 (CET)[rispondi]
@Alex brollo, @Xavier121: ovviamente non incolpo nessuno, ci mancherebbe, ma secondo me dobbiamo iniziare a pensare che dei tool per power users e basta che risolvono problemi generali siano una toppa peggio del buco. Nel senso: se il problema rimane per tutti ma io so che ho un gadget oscuro che si chiama autoPt e non è documentato, risolvo il problema per me ma allontano le persone. Io credo che Alex abbia ragione che ci sia poco feedback (quindi colpa nostra e non sua), ma dobbiamo imparare a ragionare, IMHO, in termini di Commons.js e non di gadget personali. Non ho idea di cosa accade a persone che non usano Javascript, ma spero siano poche... Aubrey (disc.) 21:46, 12 nov 2014 (CET)[rispondi]
Mi spiace ma Pt non significa ParolaTronca ma Pagina Testo, semplicemente perchè il parametro a sinistra si vede in Pagina e il parametro a destra si vede in Testo.
Quanto ai tool automatici e "avanzati" hanno una particolarità: emulano esattamente quello che si può fare a mano. Non è che Pt sia stato ideato per funzionare con autoPt; proprio come RigaIntestazione non è stato ideato per funzionare con autoRi. Nessuno è obbligato a usarli, semplicemente perchè i template che maneggiano possono essere applicati a mano, proprio come sono stati applicati a mano per anni da tutti noi. Comunque chiedo di nuovo: vi va se importo tali e quali i due template Tiret e Tiret2 di fr.source? Così li proviamo, in pratica? --Alex brollo (disc.) 21:59, 12 nov 2014 (CET)[rispondi]
Nuooooo che delusione! :( Giusto una precisazione: dico "gadget attivo di default" e non "common.js", per vari motivi: perché non è bene affollare il common.js di troppo codice che poi è difficile da manutenere; perché i gadget "sentono" subito le modifiche al codice, mentre modificando il common.js spesso resta la versione vecchia in cache; e perché in caso di malfunzionamenti, o semplicemente se uno il gadget non lo vuole per motivi suoi, si possono disattivare. Però resta un principio basilare: che tutte le cose utili e teoricamente non dannose devono essere fornite a tutti, senza che uno debba scoprire come attivarsele da solo. Tiret e Tiret2: ma serve proprio importarli? Non vorrei che complicassimo le cose, nel senso che poi una volta che i template son lì, qualcuno di sicuro comincerà ad usarli e ci troviamo in giro 3 template invece che uno solo... Secondo me visto che Pt è usatissimo da anni, più che cercare soluzioni diverse conviene lavorare sul rendere più semplice la soluzione Pt (con l'alias, il gadget, le guide...). Candalùa (disc.) 10:22, 13 nov 2014 (CET)[rispondi]
Non prometto ma ci sto lavorando: l'applicazione del Pt, sempre che dall'OCR risulti che l'ultima parola della pagina finisce con un trattino, potrebbe, un giorno a venire, diventare totalmente automatica. Il problema non sta nell'applicare il Pt sull'ultima parola della pagina, ma riconoscere quale parola, nella pagina successiva, è la sua continuazione; perchè quasi mai si tratta della prima parola della paginata di testo OCR, ma della prima parola della seconda, o della terza riga, essendo una o due righe occupate dalle "frattaglie" derivanti dall'intestazione della pagina. Non appena sarà possibile riconoscere ed eliminare in automatico tali frattaglie, anche se non somigliano per nulla al vero testo di RigaIntestazione, allora .... :-) --Alex brollo (disc.) 12:44, 13 nov 2014 (CET)[rispondi]

Scusate se ci ritorno, ma mi devo nuovamente correggere. I template Var e Ec hanno una sintassi antitetica fra loro. Sempre per agevolare l'utente medio basso (come me) è tanto impossibile unificare, in un'unica logica, l'utilizzo di quei template che adottano due paramentri all'interno?--Stefano mariucci (disc.) 06:04, 30 dic 2014 (CET) Ciao[rispondi]

File metadata cleanup drive[modifica]

"The File metadata cleanup drive is an effort started in September 2014 by the Wikimedia Foundation. Its goal is to fix file description pages and tweak templates to ensure that multimedia files consistently contain machine-readable metadata across Wikimedia wikis.

The files listed below don't contain machine-readable metadata. Please help fix them!"

5% done; 1,467 files to go

https://tools.wmflabs.org/mrmetadata/wikisource/it/index.html

Nella Wikisource italiana ci sono ben 1467 file da sistemare! --Accurimbono (disc) 20:10, 10 nov 2014 (CET)[rispondi]

Stavo provando a fare qualche cancellazione massiva... Qualcuno mi sa dire perchè usando i lbot e collegandomi con il mio nome utente vero (quindi admin) non mi permette di farlo ma mi dice
Can't delete it:File:De' matematici italiani - 001.jpg; do you want to mark it for deletion instead? ([y]es, [N]o, [a]ll) 
? --Aubrey (disc.) 22:47, 11 nov 2014 (CET)[rispondi]
Pare che ce l'abbia fatta. --Aubrey (disc.) 22:57, 11 nov 2014 (CET)[rispondi]
Bravo Aubrey. Probabilmente anche la maggior parte degli altri file rimanenti andrebbe cancellata, cercate di dare un'occhiata tutti quanti. Candalùa (disc.) 12:10, 12 nov 2014 (CET)[rispondi]

Help javascript[modifica]

Ho messo una richiesta in Bar tecnico, ho bisogno di un tool per selezionare un'area rettangolare di un'immagine con il mouse, in modo diretto, facile e intuitivo; ho pingato Candalua, Ricordisamoa e L0ll0, ma estendo la richiesta a tutti coloro che hanno sottomano l'eventuale risposta. Grazie!

PS: l'obiettivo è di emulare la selezione sull'immagine che si attua in DjView, e che restituisce il testo sottostante o la porzione selezionata dell'immagine. La parte difficile è tracciare bene il rettangolo, in modo che anche un principiante assoluto lo faccia d'istinto, il resto è facile :-) --Alex brollo (disc.) 08:19, 12 nov 2014 (CET)[rispondi]

Domanda su Ritaglio[modifica]

Ho un dubbio e vorrei il vostro parere.

Alcuni di voi (impossibile sapere chi...) usano il tool Ritaglio immagini, anche se l'interfaccia non è ideale (il sistema di selezione dell'immagine mediante trascinamento è ben lontano dall'essere il migliore possibile). Ora, dal furioso lavoro di questi giorni, sono pronto a costruire un qualcosa che permetta, con la stessa manovra di "ritaglio", di recuperare il testo OCR "sotto" l'area selezionata; immagino, ma devo provare, che sia una buona idea per vari motivi (immaginate di poter selezionare il testo "a pezzi" dicendo, con un click, di che tipo di testo si tratta e dandogli quindi il giusto formato: titoli, parti in prosa, poem, note laterali.... eccetera).

Il quesito è: uso direttamente l'interfaccia di Ritaglio, o quella del tutto analoga del meno noto Imagemap, per costruire un'interfaccia per il ritaglio dei testi? Il vantaggio: avere un'interfaccia di ritaglio noto e omogeneo; lo svantaggio: i difetti dell'attuale meccanismo di selezione/ritaglio. --Alex brollo (disc.) 08:47, 13 nov 2014 (CET)[rispondi]

Io credo che l'interfaccia di ritaglio così sia molto buona, ma è poco chiara la prima volta: avere una freccina, o un piccolo testo, o un mouseover, potrebbe già aiutare. Inoltre, non si capisce cosa vuol dire "centrato flottante". Insomma, mancano delle istruzioni, ma per il resto secondo me funziona. L'ultima cosa, è che ritaglio è solo nella sidebar, e sappiamo bene che non basta perchè la gente lo veda e lo usi. --Aubrey (disc.) 09:12, 13 nov 2014 (CET)[rispondi]
Ok, vado sulla base di Ritaglio, aggiungendo un po' di pulsanti in modo di recuperare, invece che il codice del template, il testo OCR. Così ci sarà anche lo stimolo per migliorare entrambi. Una prova preliminare conferma che - con i dati "invisibili" che vengono generati da un click sul pulsante OCR - selezionare le parole che "cascano" dentro un'area rettangolare dell'immagine della pagina è uno stupidez (una o due istruzioni javascript). --Alex brollo (disc.) 11:31, 13 nov 2014 (CET)[rispondi]
Non ci posso credere: il tool in brutta copia textSelect, clone quasi completo di imagemap, ha eseguito la prima cattura del testo selezionato. Ci vorrebbe un'espressione poco wikisourciana per rappresentare il colpo di fortuna.... :-)
Lo attivo immediatamente come gadget sperimentale. A chi mi chiede la doc ora, in fase pre-pre-pre-alfa, gli do una testata in faccia ;-) --Alex brollo (disc.) 18:23, 13 nov 2014 (CET)[rispondi]
:-( Ps: nel manipolare MediaWiki:Gadgets-definition mi è caduto l'occhio sul link Aiuto:Strumenti per la rilettura, l'ho seguito..... ODDDDIIIOOO! E' preistorico. Non è una pagina di aiuto, è una pagina di disaiuto. Ora, o perdo giorni a riscrivere quasi tutto, o sviluppo le idee che si stanno affollando.... che dilemma. --Alex brollo (disc.) 21:23, 13 nov 2014 (CET)[rispondi]

eureka[modifica]

Si seleziona....
... e si clikka "Cattura".

CI siamo! dopo un bisticcio con le coordinate, causato da un dato confondente infilato nel codice dai Piani Alti, ecco qui due screenshot di MediaWiki:Gadget-textSelect.js. Attenzione: prima di lanciare il tool occorre aver caricato i dati hOCR della pagina, mediante click sul pulsante OCR, sotto Zoom/Altro. L'unica manovra fatta per passare dalla fase 1 (selezione) alla fase 2 (cattura) è un click sul pulsante "Cattura". I testi catturati sono aggiunti al box di edit, separati da righe vuote. --Alex brollo (disc.) 08:48, 14 nov 2014 (CET)[rispondi]

Restando allo screenshot: i dati sanno che i versi sono indentati uno sì e uno no nel testo selezionato; che le strofe sono separate da una riga bianca; che i dati in prima riga sono anomali e rappresentano quindi, con ogni probabilità, l'intestazione della pagina. Io so che lo sanno, ma adesso bisogna torturarli per farglielo dire. È possibile, quindi va fatto. --Alex brollo (disc.) 10:19, 14 nov 2014 (CET)[rispondi]
Si comincia a fare sul serio. Sostituiscco gli screenshot con il nuovo "modello": notate i diversi bottoni di caricamento, il principio è: si seleziona il testo e si clicca per caricare il "tipo Di testo"; sto collaudando il "Titolo" e la "Poesia", quest'ultimo riconosce e rende le indentature dei versi e gli stacchi fra strofe. Il testo del secondo screenshot è prodotto con un unico click su "poesia". --Alex brollo (disc.) 22:27, 15 nov 2014 (CET)[rispondi]
Un piccolo feed backː sto provando il nuovo metodo di cattura del testo. E' superfluo dire che è uno strumento di una certa potenza, comodità ed elasticità. Ne farò senz'altro uso. Ho notato che ad ogni click di OCR si crea una nuova voce textSelect sulla colonna comandi di sinistra. Domanda ad Alex:cosa pensi ad estendere le opzioni (prosa, poesia, titolo, note) anche al riconoscimento delle tabelle? ;)) --Stefano mariucci (disc.) 09:26, 16 nov 2014 (CET)[rispondi]
Perchè serve cliccare più volte su OCR? Una volta entrato, selezioni quanti pezzi di testi vuoi. Può succedere per errore, certo, per "ripensamento";in questo caso, hai ragione.
Tabelle: certo che ci ho pensato. Ci vuole però un approfondimento notevole. Occorre riconoscere gli allineamenti delle parole in verticale, oltre che in orizzontale; inoltre, a causa della logica dell'OCR, può essere che le parole siano parecchio sparpagliate qua e là: ma certo, ci penso eccome. Visto che me l'hai detto, vedo cosa succede sulla tabella "tipica": una pagina indice dell'opera.
Segnalo un caso in cui il tool dovrebbe salvare la vita: ci sono dei casi in cui il testo è in più colonne, ma l'OCR non lo riconosce e fonde le righe adiacenti. Sistemare è molto penoso. Suggeritemi un caso in cui succede, che verifico se le cose funzionano come spero.
ps: vi prego di fare caso alla velocità di creazione delle pagine di Indice:Le_rime_di_Lorenzo_Stecchetti.djvu su cui sto stressando e collaudando l'elaborazione automatica delle poesie. Circa una pagina al minuto! --Alex brollo (disc.) 17:24, 16 nov 2014 (CET)[rispondi]
Ho provato a vedere una delle pagine dell'indice Indice:Le_rime_di_Lorenzo_Stecchetti.djvu , dove avviene il "rimescolamento dei dati" da parte del software OCR. Il problema non è semplice, ma i dati ci sono, quindi deve esserci una soluzione. Riga per riga, il tool "acchiappa", ma selezionando più righe, si impalla. Penso che sia meglio rimandare; prima devo affrontare e risolvere il problema della perfetta suddivisione dei paragrafi in un testo in prosa.
Una delle strade possibili per costruire una tabella da dati "sparsi" nel testo OCR sarebbe sovrapporre all'immagine lo scheletro di una tabella vuota di R righe per C colonne, con trucchi per poter ridimensionare in modo intuitivo (trascinandole) la dimensione dell'intera tabella e la posizione di righe e colonne; una rapidissima guardatina a Google mi suggerisce che non è un problema facilissimo :-( . Ottenuto questo risultato (ossia: la griglia di una tabella sovrapposta all'immagine) dovrebbe essere agevole, per lo script, pescare, cella per cella, le parole che "cascano dentro" la cella). Ma noi non siamo qua per fare solo cose facili no? ;-) --Alex brollo (disc.) 08:28, 17 nov 2014 (CET)[rispondi]

Opere Orfane[modifica]

Ciao ragazzi. E' una buona notizia o per noi non cambia nulla? link --SaettaDiZeus (disc.) 12:00, 13 nov 2014 (CET)[rispondi]

Ho creato w:Direttiva 2012/28/UE su taluni utilizzi consentiti di opere orfane, lavoriamo sul testo là per capirlo meglio.
Secondo me non cambia nulla, per due motivi:
  1. l'eccezione viene garantita dalla legge alle sole istituzioni pubbliche come biblioteche e via dicendo, quindi se anche loro mettessero le scansioni in internet noi non le potremmo caricare da nessuna parte;
  2. è alquanto improbabile che si facciano scansioni di massa che producano qualcosa di interesse per Wikisource, perché per usufruire dell'eccezione bisogna effettuare una "ricerca diligente" che se anche costasse solo un'ora di lavoro per libro renderebbe i costi insostenibili (pensa che MIBAC e BNCF/BNCR manco sono riusciti a sostenere le spese di catalogazione e selezione dei libri in pubblico dominio per Google Books).
Penso che la legge verrà usata soprattutto per effettuare prestiti a distanza, su richiesta (e dietro pagamento), di interi libri particolarmente rari. Certo è un miglioramento rispetto al feudale limite del 15 % di fotocopia, ma abbastanza irrilevante. --Nemo 15:48, 13 nov 2014 (CET)[rispondi]

Feedback da parte degli utenti[modifica]

Da tempo, penso che una delle nostre priorità come community dovrebbe essere quello di avere un qualche feedback/opinione da chi ci legge: Wikisource ha migliaia di visite al giorno, ma non sappiamo cosa la gente fa sul nostro sito, cosa pensa, che problemi ci sono. Non sappiamo niente dei lettori nè degli editori: perchè, per esempio, abbiamo così pochi anonimi? Stavo quindi cercando qualcosa che potessa creare una sorta di bottone o campo di modifica, automaticamente, ma ho trovato soltanto questo e basta. Qualcuno ha già pensato un po' a quello che intendo? Come potremmo fare? --Aubrey (disc.) 16:16, 14 nov 2014 (CET)[rispondi]

Francamente a me basta sapere che i lettori ci sono. Se facciamo un lavoro ben fatto, "finito", è già tanto; proprio come è già tanto conservare un libro in biblioteca, anche se per lungo tempo sembra inutile. Al limite, dovremmo sforzarci di fare un lavoro "finito" ancora di più di quanto ci sforziamo di fare un lavoro "gradito". Quello che mi fa veramente soffrire, ogni tanto, è la scarsità del feedback degli utenti. ;-) --alex sloggato 17:42, 14 nov 2014 (CET)[rispondi]
Aubrey, c'è w:pl:Wikipedia:Zgłoś błąd w artykule‎: clicca "Report a problem" o "Zgłoś błąd" sulla barra laterale per provare. --Nemo 21:44, 14 nov 2014 (CET)[rispondi]

Iliade_testo greco: estremi editoriali di riferimento[modifica]

Ci scusiamo, ma per quanto abbiamo cercato, non siamo riusciti a risalire agli estremi editoriali del testo greco dell'Iliade da voi pubblicato. Possiamo avere indicazioni di riferimento?

Grazie.

Mi sembra che qui ospitiamo solo la traduzione italiana; la versione greca, che si raggiunge con il link, è ospitata da un progetto del tutto distinto e indipendente, e purtroppo è là che bisogna porre il quesito.--193.43.176.15 17:36, 14 nov 2014 (CET)[rispondi]

Global AbuseFilter[modifica]

Salve,

AbuseFilter è un'estensione MediaWiki usata per identificare schemi di comportamento simil-abusivi, come vandalismi e spam. Nel 2013, i Filtri anti Abuso Globali sono stati attivati su un limitato numero di wiki come Meta-Wiki, MediaWiki.org, Wikispecies e (ad inizio 2014) su tutte le "piccole wiki". Recentemente, i filtri anti abuso globali sono stati attivati anche sulle "wiki di medie dimensioni". Questi filtri sono attualmente gestiti da steward su Meta-Wiki ed hanno mostrato di essere molto efficaci nel prevenire attacchi massivi di spam attraverso i progetti Wikimedia. Comunque, non c'è attualmente una politica su come i Filtri anti Abuso Globali debbano essere gestiti, anche se esistono delle proposte. Sta avendo luogo una richiesta di commenti sulle politiche per governare l'uso dei Filtri anti Abuso globali. Nel frattempo, le singole wiki possono disattivare l'uso dei Filtri anti Abuso globali. Queste wiki devono solamente aggiungere una richiesta a questa lista su Meta-Wiki. Ulteriori dettagli possono essere trovati in questa pagina su Meta-Wiki. Se hai domande, sentiti libero di chiedere su m:Talk:Global AbuseFilter.

Grazie,

PiRSquared17, Glaisher18:34, 14 nov 2014 (CET)[rispondi]

Criteri per inserire testo[modifica]

Buonasera, vorrei avere una conferma: basta che un testo sia stato stampato e che sia (almeno) CC-BY per stare su Wikisource? Non serve l'enciclopedicità dell'autore? --→ Airon Ĉ 20:12, 16 nov 2014 (CET)[rispondi]

Sì, basta: ma IMHO questo tipo di testi usualmente ha già una versione digitale sul web, e quindi la priorità nell'uso delle nostre forze dovrebbe essere data ai testi che tale versione digitale non l'hanno ancora, e ce ne sono parecchi; oppure che sono estremamente rilevanti, e questo esclude molte opere rilasciate in CC-BY in epoca recente. --Alex brollo (disc.) 09:00, 17 nov 2014 (CET)[rispondi]
«oppure che sono estremamente rilevanti»
Quindi c'è una sorta di "enciclopedicità" nelle policy di Wikisource? È quell'"estremamente" che mi preoccupa molto. Verifico due cose e poi ritorno :) --→ Airon Ĉ 09:59, 19 nov 2014 (CET)[rispondi]
@Airon90 non si tratta di enciclopedicità; quello a cui si riferisce Alex è di concentrare i nostri sforzi su opere importanti poiché siamo in pochi a lavorare su questo progetto, ma nulla impedisce di inserire anche altri testi di rilevanza minore se c'è qualcuno che ci lavora. Sui testi nativi digitali non c'è ancora uniformità di opinioni: io, ad esempio, sono perfettamente d'accordo, malgrado sia consapevole che servono altri criteri per l'inserimento di queste opere.--Barbaforcuta (disc.) 17:37, 3 dic 2014 (CET)[rispondi]

Categoria Open source[modifica]

C'è sia la categoria:Open Source sia la categoria:Open source. Io sposterei tutti i testi nella seconda categoria e cancellerei la prima. Che ne dite? --→ Airon Ĉ 20:12, 16 nov 2014 (CET)[rispondi]

verificato che la pagina Categoria:Open source era un redirect orfano, l'ho cancellata. Grazie della segnalazione. --Alex brollo (disc.) 09:55, 17 nov 2014 (CET)[rispondi]
Non avremmo dovuto mantenere la categoria che hai cancellato, in uniformità con Wikipedia? --→ Airon Ĉ 10:04, 19 nov 2014 (CET)[rispondi]
Oddio.... avevo letto male. Rimedieremo. --Alex brollo (disc.) 12:12, 19 nov 2014 (CET)[rispondi]
Rimediato; adesso i testi sono categorizzati in Categoria:Open source; ma resta una marea di Open Source in muillanta pagine e sottopagine del Progetto Open Source e template collegati e riferimenti.... :-( --Alex brollo (disc.) 18:30, 20 nov 2014 (CET)[rispondi]

Ricerca pagine con OCR problematico[modifica]

A parte le famose pagine degli indici, in cui l'OCR spesso "rimescola le righe" e di cui ho già un esempio sottomano, mi interessa collaudare il nuovo tool testSelect su quelle pagine in cui il testo è in parte in doppia colonna, e il software non riconosce la doppia colonna e lo rende come "righe uniche", molto fastidiose da separare. In genere avviene nella sezione note. Avete sottomano qualche caso da suggerirmi? Mi sembra di ricordare che un caso "tipico" è Bibbia, ma mi interesserebbe qualche altro caso. --Alex brollo (disc.) 12:31, 17 nov 2014 (CET)[rispondi]

Ciao Alex, non mi viene in mente nulla per quello che chiedi se non in qualche dizionario. Però ti segnalo Indice:Vita Nova.djvu dove il testo in colonna è presente in quanto ci sono le note a lato. Magari potrai tenerne conto per i tuoi futuri sviluppi della funzione textSelect. Comunque se mi dovesse capitare qualcosa sotto mano ti batto un colpo. Ciao --Stefano mariucci (disc.) 13:59, 17 nov 2014 (CET)[rispondi]
Ottimo esempio. Ho "postato" senza modifiche il risultato di textSelected su Pagina:Vita Nova.djvu/14 dove, di seguito, ho fatto quattro selezioni: la prosa, la poesia, la nota a fondo pagina e - in un colpo - le note laterali (rese come semplici ref). Tutto il codice che si vede è automatico; potrei migliorare la cosa impostando la pre-elaborazione per le note laterali; dò un'occhiata a come le hai "rese" nelle pagine precedenti. Devo comunque rivedere il codice di textSelect, perchè i pezzi di testo catturati devono essere inseriti nel punto indicato dal cursore, piuttosto che a fine testo. --Alex brollo (disc.) 15:17, 17 nov 2014 (CET)[rispondi]
Mi sono incuriosito su {{Vn}}, carino; ma è il template {{Annotazione a lato}} che in questo caso dà problemi. Vedrò se posso modificarlo in modo da rendere meno probabili le sovrapposizioni verticali: vedi Vita Nova/Vita nova. Ipotizzo di allargare la cella dell'annotazione a lato e di parametrizzare (e poi ridurre) l'altezza di linea, che per un font piccolo è graficamente sgradevole quando è sproporzionatamente grande. --Alex brollo (disc.) 15:42, 17 nov 2014 (CET)[rispondi]
Nulla si può per le note laterali nella stessa riga... se non usare l'inventiva. Chi ci sta lavorando provi a vedere lo "sporco trucco" sulle note laterali 15 e 16 che in transclusione si sovrapponevano malamente. --Alex brollo (disc.) 15:58, 17 nov 2014 (CET)[rispondi]
Su Indice:Il Brasile e gli Italiani.djvu dovresti trovare quel che ti serve. Per la pagina che ho trascritto tempo fa ho utilizzato un OCR esterno proprio perché le righe erano tutte mescolate. --Luigi62 (disc.) 21:42, 17 nov 2014 (CET)[rispondi]

Scusate (sempre nella Vita Nuova) ma anche in questi casi si deve formattare la nota? --Xavier121 11:13, 18 nov 2014 (CET)[rispondi]

Bravo Xavier, proprio quello che cercavo. Ho ficcato nella pagina il testo OCR "acchiappato" con quattro selezioni: il testo schivando i numerelli; il primo gruppetto di note; infine i due pezzi in colonna, uno alla volta, che l'OCR aveva fuso. Non ho fatto alcun edit aggiuntivo. Sembra che funzi. Alex brollo (disc.) 11:50, 18 nov 2014 (CET)[rispondi]

Dubbio[modifica]

Ma questo testo visto che è stato pubblicato da un autore non morto da 70 anni (nel 1952) può stare qua anche se non è di pubblico dominio? --Panz Panz (disc.) 15:42, 17 nov 2014 (CET)[rispondi]

Aimè: temo che il tuo dubbio sia fondato. Trattasi di caso che insegna: mai iniziare un Indice se l'autore è "rosso", ossia: se non si conoscono i dati anagrafici. Visto che li hai trovati, "bluifica" (crea) l'autore.... e aimè, se i dati sono corretti e indubitabili, Candalua avrà una grossa frustrazione. :-( --Alex brollo (disc.) 16:02, 17 nov 2014 (CET)[rispondi]
Sì, Alfio Tomaselli è morto nel 1952. Terrò conto della lezione. ([4]) --Panz Panz (disc.) 16:15, 17 nov 2014 (CET)[rispondi]
Avevo già segnalato il problema nel 2012. Ora ho creato la pagina autore e credo che si debba procedere alla cancellazione. --Accurimbono (disc) 09:56, 18 nov 2014 (CET)[rispondi]

ancora le dolenti note[modifica]

In questa pagina https://it.wikisource.org/wiki/Pagina:Commedia_-_Purgatorio_(Buti).djvu/670 mi imbatto in una nota il cui testo fa riferimento ad un verso della pagina ed un altro alla pagina successiva. Come fare? Saluti --Utoutouto (disc.) 16:27, 17 nov 2014 (CET)[rispondi]

Qualcuno sa perché non funziona più? (@Candalua) --Xavier121 12:59, 18 nov 2014 (CET)[rispondi]

Pochi giorni fa in bar su fr.source segnalavano altri malfunzionamenti di M&S. Secondo me, siamo ancora nella fase di transizione nel passaggio da Toolserver e Labs, a cui si sono sovrapposte millanta grosse, grossissime modifiche di parecchi aspetti del software centrale e pure un bel po' di modifiche al software per i bot. Io ho rinunciato a seguire la cosa... lascio che le acque si calmino un po'. --Alex brollo (disc.) 16:36, 18 nov 2014 (CET)[rispondi]
Pare che Phe abbia sistemato; c'era un po' di robaccia nelle ultime pagine che ostacolava il bot :) --Xavier121 20:52, 18 nov 2014 (CET)[rispondi]

Evoluzione dei tool di edit[modifica]

Vari tool di edit eseguono una operazione standard chiamata "encapsulate" ossia: agiscono sul testo selezionato, in genere aggiungendo qualcosa prima e qualcosa dopo. Tipico caso il pulsante Centrato oppure il markup per italico-grassetto. Avrete notato una stranezza: alcuni (tipo quelli del ricchissimo toolbox tradizionale, sotto il quadro di edit) agiscono su tutti i campi, dovunque ci sia il puntatore o ci sia testo selezionato; altri (tipo quelli della toolbar "avanzata" sotto vector, sopra il box di edit) agiscono solo sulla finestra principale, ad esempio non agiscono nell'header e nel footer delle pagine Pagina; tanto meno nei campi dei modelli tipo Indici o tipo Autore.

Questo io lo trovo estremamente fastidioso; vorrei che tutti i tool (che "seminano" caratteri nella posizione del puntatore o agiscono sulla selezione di testo) agissero dovunque serve.

Mi pare di aver trovato il modo di farlo, e pian piano cercherò di adeguare al nuovo sistema gran parte dei tool di edit che sono costruiti da noi; nulla possiamo fare per i tool "pronti all'uso" tipo i bottoni G e C della toolbar di Vector.

Una raccomandazione e due quesiti.

  1. Raccomandazione: segnalatemi subito se nell'uso dei tool avviene qualcosa di strano.
  2. Quesito 1: è ovviamente comodo che il cursore si riposizioni nei pressi del testo che è stato modificato in modo da poter, volendo, continuare a scrivere senza ri-puntare con il mouse; ma precisamente dove? Alla fine del testo inserito?
  3. Quesito 2: in certi casi è comodo che il testo originale che è stato "incapsulato" resti selezionato, in modo da poter incapsularlo ancora una volta senza doverlo selezionare di nuovo. C'è uno svantaggio: qualsiasi tasto si clicchi in questa situazione, il testo selezionato viene "mangiato" e sostituito dal carattere inviato dal tasto. Quesito: trovereste comodo che il testo resti selezionato? sempre, o solo in alcuni casi, per alcuni specifici tool? --Alex brollo (disc.) 15:15, 18 nov 2014 (CET)[rispondi]

Spostamento pulsante OCR[modifica]

Ho spostato il pulsante OCR nel gruppo "Avanzate", è molto più comodo per averlo sottomano in fase di edit insieme agli altri gadget di uso comune (il lasci aperto sempre il menu Avanzate quando edito). Se vi è scomodo, avvisatemi. --Alex brollo (disc.) 10:09, 19 nov 2014 (CET)[rispondi]

Bravo. --Aubrey (disc.) 10:49, 19 nov 2014 (CET)[rispondi]

Problemi con i CSS in homepage[modifica]

Le scritte si sovrappongono

Regà, ci sono problemi con i CSS nella pagina principale!

Uso Arch Linux con Firefox Nightly (la versione di AUR) --→ Airon Ĉ 10:19, 19 nov 2014 (CET)[rispondi]

Aspettiamo che esista lo screenshot (stavo per chiederlo poi ho visto il codice inaspettato) :-) --Alex brollo (disc.) 10:46, 19 nov 2014 (CET)[rispondi]
Che scemo: non funziona con le immagini su Commons perché ifexist funziona localmente :/ --→ Airon Ĉ 11:00, 19 nov 2014 (CET)[rispondi]
Io ho lo stesso problema con Firefox su Ubuntu. --Aubrey (disc.) 12:04, 19 nov 2014 (CET)[rispondi]
Ok, la soluzione ai linuxiani, sotto Windows non vedo nulla di strano (che brutta risoluzione però, quei caratteri "schiacciati"...) --Alex brollo (disc.) 12:09, 19 nov 2014 (CET)[rispondi]
È lo stesso problema di visualizzazione che ho anche io. Uso Windows 7 e Mozilla.--Federicor (disc.) 15:24, 19 nov 2014 (CET)[rispondi]
Ho provato a eliminare tutti i margin-top negativi che ho trovato nel codice Pagina principale/Sezioni, sezione Titolo. Come va adesso? --Alex brollo (disc.) 16:46, 19 nov 2014 (CET)[rispondi]
Le due scritte sono ancora più sovrapposte.--Federicor (disc.) 18:18, 19 nov 2014 (CET)[rispondi]
screenshot Federicor
Ora si vede benissimo. Grazie!--Federicor (disc.) 19:33, 19 nov 2014 (CET)[rispondi]
Il problema stava nell'altezza fissa, in pixel, della div di intestazione; a sua volta necessaria per "fondere" bene l'immagine sulla destra con il confine arrotondato della div. Un bel problema.... adesso l'immagine non è sistemata bene come prima, ma mi pare che la priorità vada data alla chiarezza dei link. Se l'immagine fosse esattamente circolare (identiche altezza e larghezza) forse potrebbe essere resa "dinamicamente ridimensionata" con FreedImg, che permette di gestire bene la larghezza. --Alex brollo (disc.) 08:24, 20 nov 2014 (CET)[rispondi]

(rientro) Grazie mille a tutti! :) --→ Airon Ĉ 22:35, 24 nov 2014 (CET)[rispondi]

Compleanno di Wikisource[modifica]

Meno di una settimana :-) E' tutto pronto? --Aubrey (disc.) 12:15, 19 nov 2014 (CET)[rispondi]

Fra l'altro, se volete mettere a posto un bel libro, potete partire da questo: Indice:Manuale 150 ricette di cucina di guerra.djvu. E' della Biblioteca Nazionale di Firenze e sarebbe bello averlo pronto per il contest. --Aubrey (disc.) 22:38, 19 nov 2014 (CET)[rispondi]
Ottima notizia questa collaborazione, la BCNF ha scansionato migliaia di testi che sono catalogati su SBN e presenti su Google Books
Si potrebbe avere qualche dettaglio in più sulla natura della collaborazione? Chi sono i referenti BCNF e WIkimedia, quali sono i termini, quali sono gli obiettivi, etc... ? --Accurimbono (disc) 09:33, 20 nov 2014 (CET)[rispondi]
Il referente Wikimedia sono io, e la collaborazione l'ho firmata direttamente con la Direttrice della BNCF. La collaborazione è ad ampio raggio, nel senso che Wikisource è solo uno dei progetti a cui sono interessati: per esempio, adesso stiamo parlando di un wikipediano in residenza, cioè quindi di una collaborazione strutturata e speriamo di successo.
Ad essere sinceri, non ci sono obiettivi scritti, soprattutto per quel che riguarda Wikisource: io ci tenevo che ci fornissero del materiale digitalizzato per il compleanno, e siamo riusciti in poco tempo a trovare questo manualetto di ricette che secondo me è perfetto per un primo approccio. Per il resto, e non mi scorderò mai di ricordarlo, spetta a noi, cioè a voi (anche): se la comunità vuole, e si prende un impegno serio, io posso tirare su il telefono e dire che siamo disposti a lavorare con 5, 10, 50, 100 libri. Ma (davvero, non è retorica) le collaborazioni si devono fare, per adesso siamo rimasti a piccoli passi perchè le persone coinvolte sono sempre le stesse e sempre poche. Io non ci metto molto a chiedere altri libri, per esempio, ma vorrei prima capire quanto la comunità di Wikisource è con me in questo progetto. Se siamo anche solo in 3-4, gli scrivo subito :-) Aubrey (disc.) 11:41, 20 nov 2014 (CET)[rispondi]
Di libri scansionati BCNF ne ha a migliaia che sono già pubblicamente presenti in Google Books e catalogati in SBN. Il problema siamo noi utenti Wikisource ad essere pochi. --Accurimbono (disc) 10:36, 21 nov 2014 (CET)[rispondi]

Avviso su Pedia[modifica]

Ho sparso la voce su Pedia: speriamo di ricevere molti visitatori da lì. Bisognerà aggiungere una paginina riassuntiva delle principali operazioni di formattazione che necessitano nelle pagine grezze... appena possibile ci provo. Intanto teniamoci pronti a rispondere a chi chiede lumi. - εΔω 17:56, 23 nov 2014 (CET)[rispondi]

L'anno scorso abbiamo avuto molti più rilettori delle altre source perché nella pagina principale di pedia c'era l'annuncio del concorso al posto della rilettura del mese. Sarebbe possibile farlo anche quest'anno? Inoltre sarebbe utile avere un bell'avviso sulla nostra pagina principale. --Luigi62 (disc.) 18:03, 23 nov 2014 (CET)[rispondi]
Sugggerisco, per noi e per loro, una roba del genere:
Partecipa al concorso indetto per l' 11° anniversario della nascita di Wikisource
Più rileggi e più probabilità avrai di vincere uno dei premi messi in palio... ma sbrigati: hai tempo dal 24 novembre al 1° dicembre.
Buona rilettura!
Leggi attentamente le regole del concorso e scegli uno dei testi che sono stati scelti dalla comunità per l'occasione!

--Aubrey (disc.) 18:21, 23 nov 2014 (CET)[rispondi]

Magar gli cambiamo solo il colore e al posto di rilettura mettiamo un'altra guida? Io sono in treno, non arrivo a casa fino a stanotte, fate voi! :-) Aubrey (disc.) 18:31, 23 nov 2014 (CET)[rispondi]

C'è qualcosa di ironico oggi in 'Source[modifica]

Ciao! C'è qualcosa di ironico nella scelta della rilettura del mese. Ovviamente sorridono solo quei 4 matti che seguono le storie ferroviarie. Ma il testo di Giuliani e Ciardi messo in rilettura è stato pubblicato per proporre un tracciato verso Prato, alternativo e "avversario" della Porrettana di cui, proprio in questi giorni, si stanno festeggiando i 150 anni tondi tondi dell'inaugurazione (03/11/1864). Sorrido. :-D --Silvio Gallio (disc.) 18:41, 19 nov 2014 (CET)[rispondi]

L'ho messo in rilettura solo perché sono poche pagine e abbiamo pochi giorni prima del concorso per il compleanno wikisuorciano, ma quasta ricorrenza mi fa piacere! :) --Accurimbono (disc) 09:30, 20 nov 2014 (CET)[rispondi]

Gutenberg Project[modifica]

Mi sono reso conto che la quasi totalità di questi libri:

http://www.gutenberg.org/browse/languages/it

sono presenti con le scansioni in Internet Archive. Un giorno, sarebbe bello avere una persona che si inventa un tool per caricare i djvu su Commons (e quello, in realtà, si può già fare facilmente) e poi fare un match and split serio... Sarebbe bello che Wikisource potesse inglobare seriamente il progetto Gutenberg, una volta per tutte :-) --Aubrey (disc.) 11:44, 20 nov 2014 (CET)[rispondi]

Bello ma: hai controllato aprendo su IA? Moltissimi testi Gutemberg sono caricati in sola modalità testo. Se hai già verificato ok, altrimenti farò un controllo campionario. --Alex brollo (disc.) 12:47, 20 nov 2014 (CET)[rispondi]
Quello che dice Alex è vero. Io ho fatto solo una prova con Matilde Serao e ho trovato perfetta corrispondenza con il testo Cristina: in questi casi come si vuole procedere? Va tutto al 75%, qualità Gutenberg, e si rimette comunque in rilettura del mese per coinvolgere la comunità, o se ne va dritto dritto fra i testi al 100%? --Xavier121 14:10, 20 nov 2014 (CET)[rispondi]
Non ho capito. Le scansioni e i djvu ci sono o no? Io continuo a trovare solo Full text e talora html, ma niente scansioni. Link di esempio a casi concreti e specifici per favore! --Alex brollo (disc.) 18:26, 20 nov 2014 (CET)[rispondi]


@Alex brollo Ho capito quello che dici, ma cercando il titolo in Archive mi sono reso conto che spesso il titolo non è lo stesso, quindi ogni tanto le scansioni sono da un'altra parte. Per esempio, "Il diavolo nell'ampolla" su Internet Archive è [5] Il diavolo nell'ampolla, novelle]. E in questo caso non è neppure caricata la versione solo testo che dici tu (che ho visto in altri casi). Insomma, bisognerebbe fare delle query ad IA via API, e veder che risultati ti dà.
@Xavier considerando come sono attenti quelli del progetto Gutenberg, io passerei direttamente al 100%. Manterrei però una categoria "Testi importati dal Progetto Gutenberg", che può sempre risultare utile. --Aubrey (disc.) 18:34, 20 nov 2014 (CET)[rispondi]
Io se non c'è la scansione con testo a fronte NON importerei niente. Se c'è la scansione DjVu allora ben venga l'uso del testo trascritto su Project Gutemberg come base per il M&S e successiva rilettura. --Accurimbono (disc) 10:34, 21 nov 2014 (CET)[rispondi]
In effetti, vedo che spesso la fonte di Gutemberg è Google, e moltissimo Google (immagini) è importato in IA indipendentemente; su IA Gutemberg è importato, ma in soli due formati utilizzabili:
  1. puro testo
  2. html
L'html Gutemberg è predisposto con filosofia molto diversa da quella wikisource, ossia: con stile standard Gutemberg (eccellente), mentre lo stile di formattazione wikisource tende a riprodurre, per quanto possibile, quello originale dell'edizione. Conclusione: dovremmo (trovate le scansioni della stessa edizione: cosa da fare, aimè, manualmente e con una certa fatica) importare il puro testo Gutemberg e le scansioni, eseguire M&S, e ripassare formattando. Risparmiamo la correzione dell'OCR, ma resta un lavoro ben lontano dall'automatismo. --Alex brollo (disc.) 01:44, 22 nov 2014 (CET)[rispondi]
Mi sembra che sarebbe comunque una ottima idea creare una tabella in una pagina dedicata, dove siano affiancati i link delle trascrizioni Gutemberg e i link delle scansioni dell'edizione usata come fonte o estremamente simile. --Alex brollo (disc.) 08:41, 22 nov 2014 (CET)[rispondi]
Non si potrebbe fare anche un lavoro diverso: Prendere tre (o di più se ci sono) progetti similari: Wikisource, Guttemberg, Liber Liber, che si muovono, però, con regole diverse.Aggiungere, se lo si ritiene, anche altre collane creative commons come Reti medievali Cercare di creare sinergie: se non è troppo impegnativo indici generali comuni, se no almeno cominciare a farlo per autori o temi specifici. L'impatto verso il mondo esterno potrebbe essere di peso.-Mizar (ζ Ursae Maioris) (disc.) 10:50, 22 nov 2014 (CET)[rispondi]
In un clima di cooperazione piuttosto che di competizione, io sarei favorevole a linkare qui esplicitamente, in pagina Autore, le opere già presenti in forma digitale, (testo-testo e immagini-immagini) in altri progetti selezionati: Opal, LiberLiber, Gutemberg, Internet Archive, Google. Ma mi rendo conto che l'idea è un po' "forte" e la sottopongo solo alla vostra attenzione, senza minimamente spingerla. --Alex brollo (disc.) 12:36, 22 nov 2014 (CET)[rispondi]
Io sono favorevole per i testi che non sono presenti a inserire questi link. Alcuni li ho già inseriti. Consiglierei solo che i link vengano inseriti tramite dei semplici template che servano per uniformare la formattazione e categorizzare le pagine che contengono i link per tracciabilità ed eventuale lavoro sporco. --Accurimbono (disc) 13:21, 22 nov 2014 (CET)[rispondi]
Ho cominciato a caricare anch'io dei link a Liber Liber e a Gutenberg sulle voci di autori già presenti in WS, ma per testi che non sono presenti. Sarebbe auspicabile un template per uniformare la formattazione.. Per ora ho caricato link sulle voci:Giuseppe Cesare Abba, Augusto Agabit, Iacopo Alighieri, Leandro Alberti, Leon Battista Alberti, Cletto Arrighi. Se ho sbagliato, si corregge.-Mizar (ζ Ursae Maioris) (disc.) 17:42, 22 nov 2014 (CET)[rispondi]
Fermo restando che la comunità deve essere d'accordo sull'affrontare il rischio di incoraggiare/indurre lettori a lasciare il progetto (seguendo link esterni), per essere utili anche a noi i link esterni dovrebbero avere due caratteristiche:
  1. dovrebbero essere privilegiati, o perlomeno messi in evidenza, i link "completi", ossia che contengano sia il riferimento all'opera in formato testo (liberliber, gutemberg) che alla stessa opera (possibilmente alla stessa edizione) in formato immagine;
  2. ci vuole un sistema (template che generi categorie, direi) in modo di poter trovare questi link a colpo sicuro, senza dover rovistare autore per autore. --Alex brollo (disc.) 08:11, 23 nov 2014 (CET)[rispondi]
Sono d'accordo per un link (io lo faccio, quando possibile, per i testi citati che non possediamo) ma discreto. Proporrei un template da mettere dopo il titolo in cui la piattaforma sia scritta in piccolo: provate a immaginare come verrebbe la pagina di Autore:Emilio Salgari. se le scritte fossero dello stesso carattere del testo. --Luigi62 (disc.) 08:57, 23 nov 2014 (CET)[rispondi]
Io la vedo come una opportunità: se riusciamo a creare un indice corposo dei testi scelti che si trovano nella rete (almeno dei siti migliori) potrà diventare un'abitudine diffusa passare dall' indice per autori di WS-Mizar (ζ Ursae Maioris) (disc.) 14:08, 23 nov 2014 (CET)[rispondi]
Io rifletterei bene su un'alternativa al linkaggio delle opere "possibili" in pagina Autore; vedrei piuttosto bene una serie di pagine separate, magari in Progetto:Trascrizioni, con delle belle tabelle (magari organizzate per autore) con tutti i link necessari per agire (link alla versione testo, link alla versione immagini, link a Commons con titolo già predisposto "come si deve"). Poi niente impedisce di linkare (o persino transcludere) queste tabelle anche in pagina Autore; ma se devono essere uno strumento operativo, secondo me è opportuno tenerle riunite in pagine di Progetto. --Alex brollo (disc.) 17:46, 23 nov 2014 (CET)[rispondi]
Qualche pensiero sparso: con il mio nuovo lavoro per MediaLibrary Online, quello che vorrei proprio fare è un portale che raccolga link e metadati di risorse diverse (appunto, Wikisource, Liber Liber, Gutenberg (con la N)), oltre che spartiti, videogiochi, cose che non sono libri. ma quello è il mio lavoro, non c'entra qui.
Su Wikisource, io punterei a rendere semplice l' importazione di testi da Internet Archive (magari con un pulsante che lo schiacci e ti importa il file già presente su IA, il tool già esiste), o ancora meglio l'importazione di digitalizzazioni su IA e poi da noi. Ma (vorrei ripeterlo ancora una volta) è tutta questione di workflow, cioè di creare sistemi talmente semplici e immediati che le persone da sole capiscono cosa devono fare. Non è per niente una cosa banale, e lo sappiamo. Wikisource è un "sistema integrato", funziona bene quando i testi riusciamo a importarli qui da noi. Solo che l'importazione e formattazione di testi è ancora un qualcosa di difficile. Aubrey (disc.) 17:51, 24 nov 2014 (CET)[rispondi]
E' difficile, e lo resterà: perchè è obiettivamente difficile. Su Gutenberg le competenze richieste per i numerosi passaggi sono suddivise rigidamente in una vera e propria "gerarchia di livelli di competenza" e nonostante questo anche i passaggi più semplici non sono semplici affatto. Qui ci aspettiamo di rendere così facile questa operazione complessa, da spèerare di consentire a un utente non esperto di compiere da solo, in autonomia, tutti i passaggi. Come se non bastasse, non usiamo un software specificamente progettato per questo lavoro, ma un software generalista fatto per gestire molti progetti completamente diversi, prima di tutti wikipedia; il che significa, inventarci ogni momento "trucchi" che servono solo a wikisource (vedi l'estensione proofread; vedi i numerosi gadget che sono indispensabili per adattare la formattazione all'edizione). Non ce la possiamo fare, a rendere le cose molto più semplici! Già abbiamo fatto miracoli, secondo me. Già siamo molto, molto bravi: e questo vale per tutti gli utenti, sono molto orgoglioso di far parte di questo paziente, volonteroso, pacifico e laborioso gruppo. --Alex brollo (disc.) 21:32, 24 nov 2014 (CET)[rispondi]

BEIC co-finanzia il concorso di compleanno[modifica]

Per chi non avesse visto in Wikisource:Undicesimo compleanno di Wikisource, segnalo. :-) Avremmo voluto fare anche di piú, ma speriamo che sia utile! --Federico Leva (BEIC) (disc.) 18:32, 21 nov 2014 (CET)[rispondi]

Il mondo come volontà e rappresentazione[modifica]

La versione presente su Liber liber del libro di Schopenhauer è di pubblico dominio (traduzione del 1928 di Paolo Savj-Lopez e Giovanni Di Lorenzo). Chi fosse interessato (qualcuno più esperto di me su Wikisource) può caricarlo.--StefanoRR (disc.) 18:03, 22 nov 2014 (CET)[rispondi]

Il caricamento di testi da altri siti web SENZA scansione a fronte è sconsigliato. --Accurimbono (disc) 10:22, 24 nov 2014 (CET)[rispondi]

Avviso: soppressione del gadget "Emula Alex"[modifica]

Sono atterrito dall'idea che qualcuno, attraverso il gadget "Emula Alex", si trovi in un terribile pasticcio di funzioni in corso di continui test e modifiche, un ambiente tutto meno che "stabile", tale da causare terribili cefalee a un geek smaliziato. Ho deciso quindi di eliminare il gadget; chi vorrà "emularmi" può comunque importare il mio common.js e il mio common.css, e tirare ad indovinare (o chiedermi) quali gadget uso e quali invece non uso :-(. --Alex brollo (disc.) 17:22, 23 nov 2014 (CET)[rispondi]

Ho effettuato la migrazione a EmulaBarbaNew... Incrociamo le dita... - εΔω 17:39, 23 nov 2014 (CET)[rispondi]
Se ti trovi male, metti nel tuo common.js
importScript("Utente:Alex brollo/common.js");
ma... sei sicuro di fare una simile avventatezza? :-( --Alex brollo (disc.) 18:42, 23 nov 2014 (CET)[rispondi]

@OrbiliusMagister come incrociamo le dita? Ci sono malfunzionamenti e io non ne so nulla? Avvisatemi quando qualcosa non va, altrimenti non posso rimediare.--Barbaforcuta (disc.) 17:04, 29 nov 2014 (CET)[rispondi]

@Barbaforcuta, tu non ne hai alcuna coloa: purtroppo il buon vecchio Mac con cui lavoro, più anziano di mia figlia, carica il gadget con estrema lentezza e, ad esempio, mentre scrivo non ha ancora caricato il menu strumenti dotato di tutti gli aggeggini indispensabili per la rilettura, poi notavo che le abbreviazioni da tastiera per le lettere con accento acuto, alt+( e poi lettera da accentare — non funzionano con questo gadget caricato, e nei testi con accentazione "carducciana" devo demandare a un giro di cerca-sostituisci che allunga ulteriormente i tempi di lavoro. Il mio incrociare le dita si riferisce al fatto che sono in attesa di passare alla fibra ottica e di tornare a contribuire con un pizzico di maggior velocità. - εΔω 23:14, 29 nov 2014 (CET)[rispondi]
Beh purtroppo c'erano alcune pecche dopo gli aggiornamenti degli ultimi tempi, ma dovrei aver sistemato.
@OrbiliusMagister in realtà non credo di aver capito di cosa si tratti (forse un gadget?): con qualche indicazione potrei darci un'occhiata, ma per i problemi di connessione non potrò aiutarti :-P.
@Alex brollo vedo ancora il messaggio di lavori sul gadget Spiriti che avevo disabilitato (avevo anche un pulsante per eseguire l'operazione, che ho soppresso dopo il tuo avviso). C'è qualcosa che non so?--Barbaforcuta (disc.) 18:18, 30 nov 2014 (CET)[rispondi]

Ho aperto la pagina Progetto:Trascrizioni/Tecniche di edit alternative mettendoci dentro qualche riga su quello che stiamo sperimentando. Sono tutte cose sperimentali e molto innovative, ai confini della temerarietà. Vi suggerisco di attivare Preferenze->Casella di modifica->Abilita la barra degli strumenti di modifica avanzata, altrimenti troverete difficoltà nell'edit normale (i pulsanti "non ci stanno") e non comparità il pulsante OCR, necessario se volete cautamente provare il gadget textSelect. --Alex brollo (disc.) 00:53, 24 nov 2014 (CET)[rispondi]

La pagina è non categorizzata ed è orfana. Archiviata questa discussione al bar fra qualche giorno chi potrà raggiungerla? --Accurimbono (disc) 10:20, 24 nov 2014 (CET)[rispondi]
Se qualcuno - chiunque la trovi interessante - la categorizza e la linka mica mi offendo :-) --Alex brollo (disc.) 17:39, 24 nov 2014 (CET)[rispondi]

Concorso iniziato![modifica]

Come vedete ho modificato il banner qui sopra e sto cercando di fare mettere la scritta anche su Pedia (grazie Edo per il messaggio). Qualcuno dei tecnici per favore potrebbe controllare la cosa più importante, cioè che da subito riusciamo a contare i voti? Io non ricordo esattamente come si faccia, ma abbiamo lo storico e possiamo chiedere ai nostri amici catalani che stanno facendo il concorso da una settimana. --Aubrey (disc.) 08:41, 24 nov 2014 (CET)[rispondi]

Molto bene, il banner (che non so dove sta) ha un errore da correggere: manca l'apostrofo in "l11". --Accurimbono (disc) 09:12, 24 nov 2014 (CET)[rispondi]
@Accurimbono MediaWiki:Sitenotice. Modificabile solo da un amministratore. --FRacco (disc.) 12:29, 24 nov 2014 (CET)[rispondi]

──────────────────────────────────────────────────────────────────────────────────────────────────── Ciao, stavo rileggendo Wikisource:Convenzioni di trascrizione per prepararmi alla rilettura in occasione dell'11esimo compleanno del progetto (scusate ma da wikiquotiano mi sono un po' arrugginito qui). Avrei alcune richieste:

  1. è possibile aggiungere tra i caratteri speciali anche le virgolette tedesche singole invertite (‘,) che al momento non vedo? Credo sia necessaria una modifica di un amministratore in MediaWiki:Wikimedia-copyrightwarning.
✔ Fatto (ma vedi anche sotto riguardo il gadget "Virgolette") Alex brollo (disc.) 17:41, 24 nov 2014 (CET)[rispondi]
  1. nell'esempio Pagina:Della congiura di Catilina.djvu/26 ci sono degli spazi tra virgolette e testo: « Lucio Catilina a Quinto... Mi sembra invece di aver capito che andrebbero sempre rimossi, posso correggere l'esempio?

Spero di avere un po' di tempo in queste serate per poter contribuire all'iniziativa.
PS: al bar di quote ho girato il codice del banner/avviso da inserire in pagina principale per pubblicizzare l'iniziativa, se di qui lo modificate passate anche di là che aggiorniamo. Grazie. --FRacco (disc.) 12:29, 24 nov 2014 (CET)[rispondi]

Ciao @FRacco, benvenuto! Per me puoi correggere l'esempio e inserire le virgolette tedesche, se preferisci. E' la prima volta che ne sento parlare (delle virgolette), per cui per me sono opzionali: su Wikisource cerchiamo di essere fedeli alla fonte, ma senza impazzire e cercando di puntare anche alla leggibilità. Buona rilettura e grazie! Aubrey (disc.) 15:41, 24 nov 2014 (CET)[rispondi]
Sono desolatissimo di aver contribuito poco e male (diciamo pure: niente) all'iniziativa Compleanno, ma il tempo che ho devo per forza riservarlo alle stranezze che mi passano per la mente, altrimenti "dimentico tutto". Chi programma mi capirà. Virgolette singole invertite? Questo posso farlo subito. Chi avesse la pazienza di rovistare nel gadget Virgolette, vedrebbe che è possibile "truccarlo" in modo da fargli convertire qualsiasi tipo di virgolette in qualsiasi altro tipo. La pressione ripetuta "inverte la serie", permettendo di alternare le chiusure con le aperture. Basta che le virgolette siano appaiate, o meglio: siano una sequenza regolare di aperture e chiusure. --Alex brollo (disc.) 16:25, 24 nov 2014 (CET)[rispondi]
Avendo attivato i gadget di base (Strumenti per la rilettura, Bottoniera) il codice da aggiungere per un bottone che chiama Virgolette "alla tedesca" è:
newButton("virgolette","Virgolette('‘','‚')","es","Virgolette alla tedesca")
Massima attenzione: copiaincollare! la seconda virgola dei parametri sembra una virgola ma è una virgoletta, è un carattere Unicode diverso dalla virgola! --Alex brollo (disc.) 16:44, 24 nov 2014 (CET)[rispondi]
...Azz! La medaglietta!! dobbiamo marchiare tutti i nuovi contributori!
Ecco il codice:
- εΔω 18:16, 24 nov 2014 (CET)[rispondi]
Scusate, ma il passaggio dal SAL 25% a SAL 75% è considerato formattazione?--Piaz1606 (disc.) 20:12, 24 nov 2014 (CET)[rispondi]
Si @Piaz1606, lo è. Aubrey (disc.) 22:19, 24 nov 2014 (CET)[rispondi]
Grazie--Piaz1606 (disc.) 23:02, 24 nov 2014 (CET)[rispondi]

────────────────────────────────────────────────────────────────────────────────────────────────────Partendo dal logo dell'anno scorso ho provato a caricare un logo per il concorso di quest'anno: 011. Vedete un po' voi se utilizzarlo per la medaglietta. --FRacco (disc.) 12:35, 26 nov 2014 (CET)[rispondi]

Script per contare i partecipanti e i punti[modifica]

Qualche pythonista serio ci può guardare?

https://gist.github.com/Aubreymcfato/445ae33d78ef58f3b49c

--Aubrey (disc.) 00:13, 25 nov 2014 (CET)[rispondi]

Ciao ragazzi, questa cosa è seria. @Alex brollo, @Candalua, non riuscite a darci un'occhiata? dobbiamo contare tutto, prima o poi. --Aubrey (disc.) 12:18, 28 nov 2014 (CET)[rispondi]
Io che c'entro? Hai menzionato pythonisti seri ;-)
Scherzi a parte: sono ormai molto arrugginito con python, lo uso una volta ogni morte di papa e Francesco sta benissimo. --Alex brollo (disc.) 13:13, 28 nov 2014 (CET)[rispondi]

Mi spiace molto ma proprio in questo periodo sono via e riesco a venire qui molto di rado Candalùa (disc.) 13:53, 28 nov 2014 (CET)[rispondi]