Wikisource:Bar/Archivio/2011.11: differenze tra le versioni

Da Wikisource.
Contenuto cancellato Contenuto aggiunto
Lagrande (discussione | contributi)
Riga 633: Riga 633:
:: Ragazzi, questa è la più bella discussione dell'anno, sento un fermento... :D --'''[[Utente:Xavier121|<span style="color:orange;">X</span><span style="color:black;">avier</span>]][[Discussioni_utente:Xavier121|<span style="color:orange;">1</span><span style="color:black;">21</span>]]''' 10:30, 14 dic 2011 (CET)
:: Ragazzi, questa è la più bella discussione dell'anno, sento un fermento... :D --'''[[Utente:Xavier121|<span style="color:orange;">X</span><span style="color:black;">avier</span>]][[Discussioni_utente:Xavier121|<span style="color:orange;">1</span><span style="color:black;">21</span>]]''' 10:30, 14 dic 2011 (CET)
::: Io mi dichiaro attenta "revisora" e "rilettrice", poco addentro alle diavolerie, ma disponibile ad imparare tutto ... :) --[[User:Lagrande|Lagrande]] ([[User talk:Lagrande|disc.]]) 11:36, 14 dic 2011 (CET)
::: Io mi dichiaro attenta "revisora" e "rilettrice", poco addentro alle diavolerie, ma disponibile ad imparare tutto ... :) --[[User:Lagrande|Lagrande]] ([[User talk:Lagrande|disc.]]) 11:36, 14 dic 2011 (CET)
:::: ma tu Lagrande, sai che razza di rivoluzione hai innestato, tanto tempo fa, con qualche accenno ai trucchi Gutemberg per aiutare gli utenti correggendo automaticamente gli "scannos" (che io per la prima volta ho sentito nominare da te)? Tutte le novità che trovi originano da quelle notizie! Quindi, anche "musa ispiratrice".... :-) --[[Speciale:Contributi/193.43.176.29|193.43.176.29]] 12:09, 14 dic 2011 (CET)

Versione delle 13:09, 14 dic 2011

Archivio delle discussioni del mese di novembre dell'anno 2011

Categoria: Archivio Bar 2011 Bar   Archivio    novembre 2011 


Novità RigaIntestazione e tramonto del tool RigaIntestazione

Vi comunico che non serve più spostare RigaIntestazione nell'header; ho modificato il codice rendendolo implitamente noinclude (meglio: non visualizzato in ns0). Può quindi essere lasciato tranquillamente in cima al testo della pagina senza inconvenienti. Stessa cosa per il tl PieDipagina. Il trucco risolve anche alla radice il problema degli spazi eccessivi fra RigaIntestazione e inizio testo.

Datemi feedback per capire se ci sono inconvenienti che non ho previsto. Se la cosa funziona come spero, il tool RigaIntestazione del gruppo Strumenti per la rilettura (che sposta il template nel/dall'header) non serve più. --Alex brollo (disc.) 11:33, 31 ott 2011 (CET)[rispondi]

Io ho una domanda, che forse non centra molto: il Template {{PieDiPagina}} può essere reso più veloce da scrivere, ad esempio {{PDP}} o almeno tutto in minuscolo {{piedipagina}}? Samuele 12:08, 31 ott 2011 (CET)[rispondi]
Rispondo a entrambi:
Alex, la soluzione è pratica ma formalmente scorretta: lo spazio "header" è il posto "naturale" per le intestazioni. Io piuttosto propenderei per uno spostamento via Alebot dei limitati casi di posizione scorretta man mano che ricorrono.
Samuele, come è accaduto per {{RigaIntestazione}} che ha il suo alias nel template:Ri nulla impedisce di creare dei rinvii ad un template, purché questi periodicamente vengano orfanizzati (la cosa migliore sarebbe se anche questo venisse eseguito da un bot). - εΔω 12:56, 31 ott 2011 (CET)[rispondi]
PieDiPagina è già un redirect (a RigaIntestazione), se servono alias è bene trasformarlo in template vero per evitare doppi redirect. Quanto alle modifiche via bot, avrete notato che in questo periodo stiamo lavorando per eliminarne il maggior numero possibile, trasformandole in routine js; questo evita inutili appesantimenti della cronologia della pagina e dà un nostro (insignificante come quantità, ma "ecologicamente" importante come qualità) al carico di server e memorie di massa. Se lo facessero tutti i progetti, sarebbe bello! Gira invece l'idea che non sia un argomento da considerare.
Per lo spostamento di RigaIntestazione nell'header: OK, vedrò di appiccicare qualcosa al "postOCR automatico" js, o a un altro dei tanti script che scattano in upload, per spostare "al volo" il template nell'header. Sta il fatto che editare RigaIntestazione nell'header è molto scomodo, come tutti avranno notato: non funzionano nè la la toolbar nè i pulsanti. --Alex brollo (disc.) 14:31, 31 ott 2011 (CET)[rispondi]
Devo segnalare un altro errore che causa l'inserimento di RigaIntestazione nell'header. La differenza si nota tra questa e questa. Nella prima il template è inserito nell'header e vi è molto spazio tra l'Intestazione e il testo, nella seconda, è inserito nel testo ed è più vicino al testo, come dovrebbe infatti essere. Samuele 15:05, 31 ott 2011 (CET)[rispondi]
Mi blocco e non faccio niente, ma sottolineo che dal punto di vista del controllo della formattazione e anche dell'elaborazione i vantaggi che offrirebbe il fatto di mettere tutto, ma proprio tutto il nostro codice nella sezione testo, lasciando header e footer alla gestione automatica e "canonica" del software mediawiki, avrebbe dei vantaggi. Propongo che i due pareri (quello di Edo e quello che ho proposto) vengano discussi e che vengano soppesati tutti i pro e contro, sia dal punto di vista dell'utente normale, che dal punto di vista dell'utente anormale (come me ....) --Alex brollo (disc.) 11:00, 2 nov 2011 (CET)[rispondi]
Alla fine cosa è stato deciso?? Sto rileggendo "Il mio carso" e ho messo la "RigaIntestazione" nella sezione testo e adesso vedo che l'utente Vasco 73 li sta spostando tutti nell'header. Grazie e ciao Gimilzor (disc.) 19:15, 17 nov 2011 (CET)[rispondi]

Meno burocrazia per tutti!

Cari amici,

a partire dalla provocazione di Silvio Gallio, prevedendo che nel lungo periodo le pastoie burocratiche possano aumentare, ho importato da Pedia Wikisource:Ignora le regole.

Dato che purtroppo tale pilastro è fraintendibile e dato che il nostro lavoro è assai diverso da quello di Pedia, desidererei un lavoro di riformulazione comunitaria: la preoccupazione principale che ha richiesto questa importazione è il pericolo di "avvitamenti burocratici" o di cavillosità, mentre di fatto il lavoro molto strutturato di questo nostro progetto prevede una componente fisiologica di burocrazia; mi sono dunque trovato a disagio nel distinguere questo nella formulazione della pagina: chi voglia metterci mano è il benvenuto. - εΔω 09:45, 1 nov 2011 (CET)[rispondi]

Caro Edo, noto una sottile vendetta alla mia decisione di non usare il nick e utilizzare Source per i miei (bassi, bassissimi!) fini auto-propagandistici :P Per carità sospendi, a parte i motivi burocratici :), vorrei essere Silvio e basta. Grazie! (si risparmia anche qualche bit :P). E non c'è pericolo che "quell'altro" Silvio venga a dare una mano. In ogni caso (meno burocrazia!) ci penseremo se e quando. :PP
A parte questo per ora (ma mi tengo libero di farmi venire delle idee) l'unica cosa che mi viene in mente è di "contestare" la traduzione della citazione quando dice "...e torna al tuo lavoro". Così formulata, può essere interpretata in due modi (imho) :
  • "Vai avanti con i contributi che stai dando qui",
  • "Vai a farti un giretto dove ti danno da mangiare".
A memoria, è stata presa pari pari da 'Pedia (ma sono passati anni da che l'ho letta) e quindi, sia chiaro, non è certo una critica personale. Non solo! Mi dispiace perfino che ti senta a disagio! :D
Purtroppo le mie scelte terminologiche troppo spesso non corrispondono ai canoni di questa -per fortuna- quieta e sonnacchiosa biblioteca e potrebbero spaventare -non sia mai!- qualche utente novello. Quindi la riformulazione la lascio a voi. :P

Bye! --Silvio Gallio (disc.) 10:58, 1 nov 2011 (CET)[rispondi]

La nostra differenza con Pedia, da questo punto di vista, è radicale. Il pediano scrive un testo libero, noi abbiamo la fonte da rispettare. Purtroppo, da questa regola (che se ne trascina dietro parecchie altre, aimè, comprese le nostre avventure di formattazione e convenzioni di trascrizione) non sfuggiamo. Il vantaggio è che non possiamo litigare sui contenuti :-) --Alex brollo (disc.) 11:02, 2 nov 2011 (CET)[rispondi]
Ma per l'appunto, Alex: di per sé non avremmo bisogno di questa pagina per il nostro lavoro in ns0, ma si è resa necessaria nella vita comunitaria. Teoricamente, finché siamo in quattro gatti e ci troviamo cordialmente a scambiarci consigli per la biblioteca le rispettive questioni si discutono con pacatezza e si arriva a un consenso con tranquillità, ma ho notato con disagio che nel cercare di mettere i puntini sulle "i" nelle politiche comunitarie (gli ultimi dibattiti su admin-bot e inattività degli admin ne hanno mostrati i segni) lo sforzo di delimitare la lettera della legge apre il varco ad una deriva burocratica che può creare problemi (ho portato l'esempio dell'edit isolato di un admin assente un giorno prima della scadenza dell'anno di inattività). in caso di evidente tentativo di forzare le regole noi amministratori (e per le azioni comuni anche gli altri utenti) possono valutare se la fedeltà letterale alla regola sia un bene o un danno per il progetto e agire di conseguenza. Io di fatto tendo ad applicare questa regola nel momento in cui "chiudo un occhio" di fronte ad alcuni testi senza fonte per i quali la settimana canonica di attesa per una fonte si sta estendendo in maniera scandalosa: se un testo è palesemente fuori dal copyright e se un altro admin non lo segnala ritengo meno orrendo che qualcuno trovi una fonte piuttosto che cancellare di brutto. So di sbagliare ma lo faccio a fin di bene :D - εΔω 18:33, 2 nov 2011 (CET)[rispondi]
Caro Edo se, come credo di capire, temi di andare contro i "voleri" della comunità, per quanto mi riguarda sappi che hai tutto l'appoggio (per quello che vale). Ovviamente non posso parlare a nome di tutti ma credo che l'atteggiamento sia piuttosto generale. Certo, finora il gruppo è piccolo e compatto. Certo le cose possono cambiare. Ma credo che sia meglio essere vigili e interpellarci nel caso che succeda, senza fasciarci la classica testa prima dell'urto. Che, magari (magari!) non verrà mai. Però è giusto fare come i boyscout che stanno "parati" e possono reagire in fretta. Poi, se davvero ti serve supporto per le decisioni credo che basti dirlo. Come hai fatto finora, d'altra parte. Vorrà dire che - rompendo una mia abitudine- il mio supporto non sarà "Tacito" (Dedimus profecto grande patientiae documentum (Agr. 1.2) (:P) ma metterò anche il mio voto in chiaro. Finora non ce n'è stato bisogno. Vai così:) --Silvio Gallio (disc.) 18:57, 2 nov 2011 (CET)[rispondi]
Ho riformulato la traduzione e adesso dovrebbe essere inequivocabile.
Infine ho provato a dare un'occhiata alla cronologia della pagina di en.wiki: nel corso del 2005 la pagina è passata dalla proposta di cancellazione alla definizione di "essay" a quella di "Pillar": una carriera non indifferente. εΔω 19:03, 2 nov 2011 (CET)[rispondi]

Mi Cho'nToy

Visto che tutti lamentano il problema del -non layer- di testo in DjvuToy ho pensato di scrivere all'amico in Mongolia Inferiore, quello che ha prodotto il singolare aggeggio. Ho fatto finta (benissimo e senza fatica!) di non aver capto un tubo del suo programma e la risposta è la seguente.

Sorry, you can't get text layer in "Maker" page of DjVuToy. To get text layer, you should use OCR function in "Hidden Text" page after you made DjVu. If you want, you also can export hidden text as XML, correct them, then import in DjVu. DjVuToy's OCR is based on MODI (Microsoft Office Document Imaging), that means, you must install MODI component of MS Office 2003 or 2007. For Office 2007, you must install SP1 or SP2, otherwise MODI is unusable.

Come si vede non è in cinese e quindi non la traduco. :P

Se ho "tempo" aggiornerò le "guide" (inverted commas). Ma mi sembra che non incontrino grossi favori quindi sarebbe lavoro inutile.

Spero che questo post serva a qualcuno/qualcosa perché io, a suo tempo, proprio questo avevo fatto: OCR col MODI dopo aver creato il djvu) ma non funzionommi :( . Bye! --Silvio Gallio (disc.) 13:59, 3 nov 2011 (CET)[rispondi]

...a Sirvioooo e qui tessbagli!!! :) le tue guide sono preziosissime (diffidato dall'abbandonare il lavoro!!!), mai avrei approfondito l'arcano djvutoy without you... Comunque, ho provato, tempo fa, ad inserire il layer ma non funzionava, certamente sbagliavo qualcosa, adesso riproverò con maggiore attenzione, spendendo qualche serata a capirci qualcosa con i componenti MODI. Non mi abbandonare! :( --Xavier121 19:00, 3 nov 2011 (CET)[rispondi]


BINGO! Dopo aver installato il coponente MODI l'ocr di djvutoy funziona perfettamente: test positivo con un centinaio di pagine prova, qualità medio-alta. Cerchio chiuso. A questo punto solo il tempo impedisce caricamenti di massa di qualsiasi cosa ci passa per la testa!!! Forse ho realizzato il nulla perché molti di voi già avevano risolto con questo sistema, però per me adesso, con gli script python di Alex e le funzioni di djvutoy, qualsiasi testo di OPAL non presenta difficoltà... :) --Xavier121 01:55, 5 nov 2011 (CET)[rispondi]

Proprio adesso che ho dei problemi col office! Vabbé Xavier, visto che hai capito, ti dispiacerebbe mettere per bene il procedimento nella guida? In questi giorni davvero ho poco tempo per cose complicate come il reset del computer. :( Silvio slogged)193.138.160.115 06:36, 5 nov 2011 (CET)[rispondi]

Esperimento 0

Ho smanettato sul testo de Le Cento novelle antiche, anche conosciuto come Novellino, prima edizione a stampa del 1525 di Carlo Gualteruzzi. Il nostro programmino mi ha restituito un djvu di ottima qualità e un text layer fantastico. Ho usato una compressione conservativa con Photo (1 layer) qualità 100%: il file restitutito è delle stesse dimensioni del PDF di partenza (giocando con la qualità si puo ridurre la dimensione, ma il dubbio che possa inficiare l'OCR mi astiene da qualsiasi altro test). Ultima verifica: comportamento del M&S con l'edizione presente qui da noi. NOTA: il MODI di Office 2003 soffre l'OCR in italiano (non ho trovato un modo per inserire la nostra lingua, neanche con tutti i service pack 1-2-3). Con Office 2007 NESSUN PROBLEMA: consiglio questa versione per evitare frustranti lavori di configurazione. --Xavier121 01:20, 7 nov 2011 (CET)[rispondi]

Un pagina a caso... e un M&S liscio liscio, che ve ne pare? --Xavier121 22:31, 7 nov 2011 (CET)[rispondi]
Io sto battendo una strada diversa, da stasera (dovrei riuscire a sfruttare le coordinate per le linee di testo del djvu di IA infilandoci dentro le corrispondenti linee di testo interpretate dal mio FineReader); ma questa tua strada mi interessa parecchio. Tuttavia ho difficoltà a attivare MODI per Office 2007 (ha un Office pre-montato sul pc e la procedura di attivazione mi dà un errore). Posso scaricare MODI per Office 2007 da qualche sito? Che difficoltà si incontrano nell'installazione? --Alex brollo (disc.) 00:51, 8 nov 2011 (CET)[rispondi]
Dove era premontato un Office 2007 non c'è stato alcun problema, è bastato attivare il MODI dalla pagina di upgrade del programma stesso e indicare, al solito, il lancio del tool direttamente dal computer ecc. ecc. (cose che si capiscono facilmente quando si va in Rimuovi/Installa Applicazioni: ovviamente non bisogna rimuore ma solo attivare funzioni non considerate all'inizio). Più dificoltoso dove c'era una versione 2003: è spuntato un errore che non ho ben compreso, vista la tarda ora, e l'aggiornamento al 2007 è sfumato; questa sera ci riprovo e ti faccio sapere. Nel frattempo ci sarebbe bisogno di un tuo feedback in una discussione correlata più sotto :) --Xavier121 11:43, 8 nov 2011 (CET)[rispondi]
Nel frattempo, mi mandi/mi segnali un djvu con strato testo fatto da MODI + DjvuToy, che "lo smonto" per bene? :-) --Alex brollo (disc.) 11:57, 8 nov 2011 (CET)[rispondi]
Non serve! Ho attivato MODI per Office 2007 su una macchina che lo consentiva, ho lanciato l'OCR di djvutoy su un grosso file djvu... e velocissimamente ho ottenuto lo strato testo. Molto interessante! Lo strato testo è organizzato in linee di testo, niente male come dettaglio (i dettagli superiori, parole e carattere, non hanno utilità pratica per quello che voglio fare io :-) ). (alex slogged) --193.43.176.29 13:01, 8 nov 2011 (CET)[rispondi]

Mi sembra impossibile, nel mio office 2007 non c'è MODI! O, più probabile, non so come stanarlo da dove si è nascosto. Viene quindi buona la domanda di Alex più sopra! si trova da qualche parte? @ Xavier: Quando avete trovato il busillis per il layer di testo, fra te e Alex, ce lo spiegate anche a noi poveretti? Vi confesserò che a volte leggere questa pagina del Bar è piuttosto frustrante... :( Silvio Gallio (disc.) 13:54, 8 nov 2011 (CET)[rispondi]

Dice il proverbio: chi di djvutoy ferisce.... :-)
Allora, apri Pannello di controllo; Installazione Applicazioni; posizionati su Microsoft Office 2007. OK? Premi il pulsante "Cambia". Si apre un box dove devi scegliere "Aggiungi/Rimuovi caratteristiche". Continua. Si apre un elenco di cose: clicca "Strumenti di Office". Ci siamo quasi! Clicca Microsoft Office Document Imaging. A questo punto non posso più procedere passo-passo perchè io ho già installato, ma si tratta di attivare la voce "esegui da questo computer". parte un programma, dopo una attesa (piuttosto lunga) la cosa finisce lì. Chiudi tutto fino a Pannello di controllo compreso. Vai a Tutti i programmi, Microsoft Office, Strumenti di Office e dovresti vedere nell'elenco due novità: Microsoft Office Document Imaging e Scanning. Non serve che li apri: adesso djvuToy li troverà e li userà "in autonomia". devi però mettere "English" nelle "OCR options".
facile no? :-) --Alex brollo (disc.) 14:23, 8 nov 2011 (CET)[rispondi]
Adesso, io sono uno cui piace l'understatement. Non pensiate, però che sia completamente digiuno (peso oltre 100 kg) di cose informatiche. :P la copia di Office 2007 me l'ha passata w:Heinrich Schliemann. Indovinate dov'era... Ma il MODI me lo procuro fra un paio di giorni. Ppoi mi metto sotto con gli esperimenti. Ma devo proprio mollare tutto il resto accidenti. Non ho mica quattro mani e due vite parallele, io! Sono Silvio, non Plutarco!Silvio Gallio (disc.) 14:29, 12 nov 2011 (CET)[rispondi]

notizie da oldwikisource

Sullo Scriptorium di oldwikisource [1] si trovano a volte discussioni interessanti che riguardano l'intero progetto Wikisource e la collaborazione tra le varie lingue. Il problema è che siamo sempre i soliti "four cats" a partecipare... ed è un vero peccato. Che ne pensate di rendere visibili anche qui da noi le 2-3 discussioni più recenti? Una roba tipo così, da mettere da qualche parte (il riquadro è appena abbozzato, eh... ci ho messo la barra di scorrimento giusto per non occupare troppo spazio):

Le ultime notizie dal Wikisource Multilingue

caricamento di oldwikisource:Wikisource:Scriptorium in corso...

Ovviamente è trascluso "in tempo reale" e non necessita di alcun aggiornamento qui da noi, solamente lato oldwikisource andrebbe modificato ogni tanto lo Scriptorium per escludere le discussioni troppo vecchie.

Che ne dite? Candalùa (disc.) 22:11, 3 nov 2011 (CET)[rispondi]

Sarebbe carino avere una pagina a parte, o una sezione vera e propria. Ma, domanda: da quando abbiamo la transclusione interwiki? credevo solo nel ns Pagina. Funziona anche con Wikipedia?! --Aubrey McFato 22:54, 3 nov 2011 (CET)[rispondi]

Sono anch'io ancora indeciso su dove starebbe meglio. Una pagina a parte temo non sarebbe più vista di quanto sia vista la pagina originale... La trasclusione interwiki non-nsPagina era uno dei segreti meglio custoditi fino a poco tempo fa, quando ho trovato per caso il template:Iwtrans e mi son messo a diffonderlo in giro per le source. Al momento funziona solo per Wikisource, ma senza dubbio si può allargare a Wikipedia. Perché, che cc'ha' 'n mente? Candalùa (disc.) 23:57, 3 nov 2011 (CET)[rispondi]

La transclusione interwiki è potenzialmente una delle cose migliori che potevano capitarci. Un sogno nelsoniano, in teoria. In pratica, non sarà facile. Credo però che sarebbe bello, ad esempio, che aforismi e frasi fossero sempre transclusi da Quote, e che citazioni dei testi fossero sempre tranclusi da noi. pensa a quante poesie potrebbero stare su pedia, transcluse da noi, con il commento. O su Wikibook e Wikiversity, per esempio. Noi potremmo transcludere dei dati singoli (si arriverà a Wikidata in un paio di anni), magari le biografie. Con template ad hoc, cercando di non ammazzare i server, possono farsi un sacco di cose belle, secondo me. (scherzi a parte, qualcuno si ricorda di w:Ted Nelson)? Aubrey McFato 00:09, 4 nov 2011 (CET)[rispondi]
Restando al topic, visto che sono "notizie", suggerirei di transcludere nel Wikisourciano. E di linkare nella pagina principale o la bar. (bella la pagina che si accorcia). :) Bye! --Silvio Gallio (disc.) 08:04, 4 nov 2011 (CET):[rispondi]
Giusto stamattina pensavo al fatto che se esiste il template IwPage, che è transclusione interwiki, doveva pure esistere un sistema di generalizzare la cosa.... va bè, l'argomento è affascinante ma non ci perdo tempo perchè altrimenti la lista delle mie "cose da fare". che è già troppo lunga, si allunga ancora. :-) --Alex brollo (disc.) 09:55, 4 nov 2011 (CET)[rispondi]
BUG: Bill Gates ci vuole male: su IE per Window$ si vede il riquadro, l'intestazione, un [page] ma per il tresto un gran riquadro bianco... εΔω sloggato 14:52, 4 nov 2011 (CET)[rispondi]

SBUG! "a me" Bill mi vuole bene, allora! Vedo tutto normale (un po meno bello che su Chrome (Seven, Crome, IE Ultimo (credo)) (Silvio sloggato per usare IE) 151.41.147.215 15:33, 4 nov 2011 (CET) Ritorno :) Silvio Gallio (disc.) 15:35, 4 nov 2011 (CET)[rispondi]

Su ie8 si vede tutto. Che versione usi, Magister? Candalùa (disc.) 15:48, 4 nov 2011 (CET)[rispondi]
Con IE 6 oltre che vedere il box bello bianco il logo wikisource si piazza al centro della pagina e lì sta immobile, grazie al trucco di "bloccarlo" in alto a sinistra.... Non ci sono nemmeno i pulsanti di base, figuriamoci quelli personalizzati... occorrerà scriverlo da qualche parte, che è incompatibile con wikisource. :-(
Mica sempre e mica dappertuto è facile fare un upgrade di IE.... :-( ma sempre e dappertutto si può utilizzare un buon browser versione portable :-) Alex brollo (disc.) 19:01, 4 nov 2011 (CET)[rispondi]
IE6 è incompatibile con buona parte del mondo, direi che per noi è un non-problema :-) Candalùa (disc.) 19:51, 4 nov 2011 (CET)[rispondi]
Uhm forse è un semiproblema! Sto usando un computer che non dovrei qui c'è xp e I.E.7 (e non 6). Si vede un quadro bianco esattamente come quello descritto da Edo :( Fatevobis... :) (sempre io...)193.138.160.115 06:43, 5 nov 2011 (CET)[rispondi]

Dunque: dopo aver perso un paio d'ore di sonno, sono giunto alle seguenti conclusioni:

  • sulle altre pagine la trasclusione funziona anche su ie7, quindi il problema non è la trasclusione
  • su questa pagina il mancato funzionamento è scatenato da #Impariamo_il_triestino che contiene un <pages; togliendolo tutto funziona
  • effettivamente andando su [[2]] con ie7 mi compare un bel "Proprietà o metodo non supportati per l'oggetto"
  • su pagine non del dizionario funziona tutto bene anche su ie7
  • la pagina del dizionario su chrome e firefox non segnala errori

Ergo, domando ad Alex: cosa c'è in MediaWiki:Common.js che funziona diversamente dal solito sulle pagine del dizionario? forse la storia delle section con la @? Candalùa (disc.) 01:35, 6 nov 2011 (CET)[rispondi]

Come ti ho notificato, le modifiche che ho fatto in Commons riguardano il meccanismo di aggiunta del "SAL pagina":
se esistono section, la lista completa viene depurata da:
  1. doppioni
  2. tag section con carattere @ all'interno. Può essere che si tratti di un carattere sfortunato, che scatena qualcosa? Potrei provare a sostituirlo con qualcos'altro, magari un prefisso più "normale". Forse basterebbe un punto a inizio parola. Provo. --Alex brollo (disc.) 20:40, 6 nov 2011 (CET)[rispondi]

Boh, francamente non saprei neanch'io, ad occhio mi sembra impossibile che non funzioni... comunque prova, non si sa mai Candalùa (disc.) 23:49, 6 nov 2011 (CET)[rispondi]

Provo a sostituire il @ con un no. (@abaco->no.abaco) in pagina 16. --Alex brollo (disc.) 06:23, 7 nov 2011 (CET)[rispondi]

Quiz sul dialetto triestino

In Indice:Dizionario triestino (1890).djvu sono elencati circa 13400 lemmi. In che percentuale questi lemmi sono esclusivi del dialetto, ossia: non sono reperibili in un dizionario italiano, come it-IT.dic (quello usato da Mozilla)? --Alex brollo (disc.) 22:31, 4 nov 2011 (CET)[rispondi]

Unicode copia e incolla

Ci può interessare? --Aubrey McFato 13:01, 5 nov 2011 (CET)[rispondi]

Dati, template, scripts ecc. specifici per opera

Ho la sensazione che la questione sia affascinante ma complessa.... più adatta a Bar tecnico. "Clono" là il mio intervento e propongo di continuare là le elucubrazioni. --Alex brollo (disc.) 09:23, 7 nov 2011 (CET)[rispondi]

Test bug di Dizionario

Ho sostituito in pag 16 tutti i @ con un prefisso no. e ho modificato il tl DtLemma. La transclusione funziona:

  • sm. abbaco, abaco, libréttine — „Impara l’abbaco.“ ― „È alle libréttine.“ (vedi)

ma... il bug persiste sotto IE7. (alex sloggato) 79.51.236.233 06:36, 7 nov 2011 (CET)[rispondi]

Facendo puntare il pages su una diversa pagina di Dizionario (pag 6), che ha un codice "normale", il bug sparisce. Quindi: dipende da qualcosa che c'è nelle pagine di Dizionario con lemmi, ma sembra che non sia il carattere @, che non c'è nè in pagina 6, nè in pagina 16. Cerco di riprodurre il bug in pagina delle prove. --79.51.236.233 06:43, 7 nov 2011 (CET)[rispondi]
Il bug è riprodotto in Wikisource:Pagina delle prove. Ma si scatena solo con la pagina 16; transcludendo la pag. 17 tutto fila lissio.... Cosa c'è nella pagina 16 che non c'è nella pagina 17 (il carattere @ non c'entra)? Rollbacko le mie modifiche a pag. 16 e a DtLemma. --Alex brollo (disc.) 07:01, 7 nov 2011 (CET)[rispondi]
Il problema sta nel lemma A. Mascherato il lemma A, il bug non si riproduce.
Il problema sta nel codice {{lemma|A}}. Trasformandolo in {{lemma|Aaa|A}} il bug non si riproduce. Devo ancora capire perchè esattamente, ma siamo sulla strada buona....in realtà, avevo un certo disagio con i lemmi brevissimi, qualcosa mi diceva che la cosa era delicatuccia (non saprei dirvi perchè ma ricordo questa sensazione). Per questo sono andato quasi "a colpo sicuro". --Alex brollo (disc.) 07:30, 7 nov 2011 (CET)[rispondi]

Testo modificatore

ciao, Mi chiedevo se uno dei vostri utenti saavy tecnologia potrebbe aiutare me impliment il testo in formato modificatore trovato sulle tue pagine. A es.ws, (Espanol Wikisource) ci piace, e potrebbe sicuramente beneficiare di averlo. C'è una sola stipula, però, ci piacerebbe che fosse visto sotto "Opzioni di visualizzazione" nella colonna più a sinistra rispetto alla lenti flottanti, che interrompono alcuni del nostro testo (non usiamo "prosa" Pagine di classe con margini su ogni lato in genere. c'è qualche anima gentile che è disposto ad aiutare un impliment amatoriale techie questo?

Stavamo pensando a qualcosa del tipo:

Testo: Grande Piccolo

o

testo: grandi dimensioni dimensioni più piccole

Si prega di tornare a me! grazie - Theornamentalist (disc.) 22:58, 7 nov 2011 (CET)[rispondi]

Fonte: Biblioteca italiana?

Casualmente, nel fare alcuni esperimenti con djvutoy, mi sono imbattuto in una edizione del Novellino, presente sul nostro progetto, ma senza più una fonte verificabile. Non so se capita solo a me, ma io non riesco più a collegarmi al sito della Biblioteca italiana. Poiché ho lavorato qualche sera su questa prestigiosa edizione delle Cento novelle antiche, che, curata da Tosi e pubblicata nel 1825, ripropone, con note, il testo della prima edizione a stampa del Gualteruzzi, amico del Bembo, che cosa ne pensate se M&Splitto tutto e recupero un testo di altissima qualità? Attendo pareri. --Xavier121 13:46, 8 nov 2011 (CET)[rispondi]

Confermo Biblioteca Italiana è irraggiungibile anche per me. In più ho grossi problemi anche con Emeroteca Braidense quando provo a fare delle ricerche "via Google". Essenziali se non ricordi la testata esatta, il fascicolo esatto, la pagina esatta. Tristezza. Quanto al Novellino, sei fra i maggiori esperti locali perché chiedi l'approvazione di noi comuni mortali? :) Vai Vai| --Silvio Gallio (disc.) 14:30, 8 nov 2011 (CET)[rispondi]

Tesi sulla FAO

Lo scorso maggio avevo segnalato un bel lavoro sulla FAO premiato dall'università di Roma nella sezione tesi e lavori scientifici. Ora OTRS ha rilasciato il Ticket Si può procedere a metterla su wikisource?93.34.62.46 16:08, 8 nov 2011 (CET) ero sloggatoMizar (ζ Ursae Maioris) (disc.) 16:12, 8 nov 2011 (CET)[rispondi]

Ciao Mizar. Per l'inserimento "fisico" non ci sono problemi, credo. Io stesso ho caricato qualche mio povero prodotto. Basta creare il testo al solito modo e inserire l'OTRS nella "Discussione" (Esempio).
Qualche problema potrebbe venire dal proofreading. Poche settimane fa ho avuto un interessante scambio di opinioni con Marcok (su 'Pedia) relativamente all'inserimento di tesi in Commons. (Pare che le linee guida del sito "sorello" siano piuttosto strane). Più di così non so. Bye! --Silvio Gallio (disc.) 18:47, 8 nov 2011 (CET)[rispondi]
Se Commons fa storie, allora carico, almeno per il momento, solo il testo. Poi se ci saranno i chiarimenti, mi accingerò al proofreading in cui sono particolarmente principiante.--Mizar (ζ Ursae Maioris) (disc.) 11:32, 9 nov 2011 (CET)[rispondi]
Chiarimenti? In Kommons? bwwwwhhhhhihihihihi ehm! --Silvio Gallio (disc.) 22:14, 9 nov 2011 (CET)[rispondi]

Il primo file DjvuSource :-)

Mi è riuscito di far caricare il codice sorgente wiki delle pagine pagina nello strato testo di un file djvu. Una vecchia idea, non so bene a cosa potrebbe servire, ma la cosa mi piace. :-)

Prossimo obiettivo, caricare non il codice wiki, ma il codice html; qui la cosa si fa interessante, perchè una volta che il file djvu avesse al suo interno la rappresentazione formattata html del testo, allora si potrebbe pensare a un visualizzatore che - anche fuori di wiki - presenti fianco a fianco l'immagine della pagina e il suo contenuto formattato e "iperlinkato". Per ora mi accontento di un file DjvuSource, con le immagini djvu e il testo source.

Il primo DjvuSource è il file djvu collegato a Indice:Sulla reciproca influenza della libertà politica e dell'industria mecanica dei popoli.djvu. --Alex brollo (disc.) 23:44, 9 nov 2011 (CET)[rispondi]

Il secondo (e per ora basta) è File:Georgiche.djvu. Per ora, la cosa è pressochè inutile, un puro (ma utile) esercizio di manipolazione e di "stressaggio" degli strati testo.
Per vedere "l'effetto che fa" ho chiesto ospitalità a candalua su vec.source; c'è là un vec:Indice:Georgiche.djvu, provate ad aprire una nuova pagina (ma evitate di salvare, perchè il file e i file Pagina andranno cancellati a fine test, meno facciamo lavorare i sysop di vec e più immagino saranno contenti)--Alex brollo (disc.) 08:56, 10 nov 2011 (CET)[rispondi]

Atto di nascita di Michelangelo

Sto dando una mano a Utente:Theornamentalist su es.source, e in cambio lui mi ha segnalato questa chicca: l'atto di nascita (originale, da quel che sembra) di Michelangelo, ovvero michelagnolo buonaroti. Chi di voi mi aiuta a decifrare la calligrafia dell'epoca? Lo trovate qua: Pagina:Atto di nascita Michelangelo.jpg. Candalùa (disc.) 00:48, 12 nov 2011 (CET)[rispondi]

Aggiunti piccoli suggerimenti (da vagliare da esperti) trovato altro materiale (vedi discussione) ;) --Silvio Gallio (disc.) 11:16, 12 nov 2011 (CET)[rispondi]
Sfrutto l'occasione perchè ho avuto un problema analogo: che si fa quando si ha un jpg di una pagina e si vuole caricare su source? Usiamo il ns Pagina e va bene, ma evitiamo il ns Indice? Purtroppo, essendo in jpg e non in djvu non su può usare il tag pagelist... Di casi simili ce ne possono essere a bizzeffe, pensate a tutti i manifesti, atti, avvisi antichi che si trovano, e da poco hanno aperto l'Archivio Pensa su Commons... --Aubrey McFato 12:23, 12 nov 2011 (CET)[rispondi]
Perchè non riunire varie pagine singole in una collezione-indice (separandole poi, come si vuole, in ns0)? --Alex brollo (disc.) 03:15, 13 nov 2011 (CET)[rispondi]
Dal basso della mia incompetenza; ma è proprio obbligatorio che nella pagina Indice si sia un djvu o pdf? Chiaro che non avendo un layer di testo i jpeg o tif ecc non possono generare il testo nascosto. Ma in questi casi di testi brevi e perfino scritti "a mano" non è possibile creare il file in NS0 e collegarlo poi? Sono perplesso ma esco dal turno di notte e non vorrei creare dei pasticci con le prove. Non oggi. Bye!--Silvio Gallio (disc.) 14:19, 12 nov 2011 (CET). Inoltre sembra che il buon Xavier sia riuscito (v. sopra) a generare un layer usando il Toy.Trasformando il jpeg in djvu e unendo il layer, il pagelist dovrebbe funzionare... o no?[rispondi]
Mi dispiace, io sto usando un traduttore.
Certamente possibile utilizzare un file. Jpg per creare un indice, ma non usare la funzione pglist (vedi qui)
Se lo fai convertirlo in formato pdf o djvu, funzionerà da usare pglist, tuttavia, se si tratta di una singola pagina, esso non hanno la capacità di tornare al file di indice dalla pagina, una soluzione è quello di creare un separato pagina vuota come una seconda pagina. Per tutto questo lavoro extra, ho solo utilizzano in genere l'. Formato jpg. Spero che questo aiuti!
Inoltre, se ci sono gli altoparlanti bilingue italiano / spagnolo, qualcuno potrebbe venire a tradurlo in es.ws? - Theornamentalist (disc.) 15:27, 12 nov 2011 (CET)[rispondi]
Vi sarete accorti che con pazienza ho eliminato ogni libro fatto di collezioni di jpg.... non reinfilatemeli per carità! E, se potete, evitate anche i pdf. Il djvu dovrebbe diventare il nostro standard: il layer di testo è una cosa che suppongo diventerà importante! Se i jpg a pagina unica sono pochi mi offro io di fare la conversione e di aggiungere la pagina vuota (grazie Theornamentalist per il suggerimento!!). Ottimo anche caricare il testo su ns0 come primo passo. Basta che mi mandiate un messaggio in pagina discussione (se caricate su Commons il jpg, con un bel template Information, template e categorie, mi agevolate parecchio il lavoro!) --Alex brollo (disc.) 02:49, 13 nov 2011 (CET)[rispondi]
Eccolo: File:Atto di nascita Michelangelo.djvu; Indice:Atto di nascita Michelangelo.djvu.

Suggerirei di trascrivere fedelmente (anche le abbreviazioni) espandendole invece in ns0 con largo uso del tl|Pt. Non so come compilare vari campi dell'Indice nel caso di manoscritti... :-( --Alex brollo (disc.) 03:07, 13 nov 2011 (CET)[rispondi]

Hai ragione, Alex: ho spostato a Pagina:Atto di nascita Michelangelo.djvu/1. Se hai tempo e voglia, qui all'inizio della lista ci sono alcune altre pagine che usano una singola .jpg che si potrebbe convertire in un .djvu di una singola pagina. Candalùa (disc.) 10:07, 14 nov 2011 (CET)[rispondi]

Per il bug della pagina singola che non genera la freccia verso l'Indice, c'è il bug 30725 che contiene già la soluzione. Metteteci il vostro voto, così magari ce lo sistemano. Candalùa (disc.) 10:15, 14 nov 2011 (CET)[rispondi]
Perchè non creare Indice:Archivio Pensa.djvu con l'intera collezione dei file di testi contenuta in Commons? Eviteremmo di creare pagine singole... --Alex brollo (disc.) 11:20, 14 nov 2011 (CET)[rispondi]

Nuova pagina doc: Progetto:Trascrizioni/Routine DjvuLibre

Mi sono deciso, ormai parecchi utenti girano attorno allo strato testo dei file djvu e una pagina di doc è opportuna. Anzi, due:

In entrambe ho messo una sezione Utenti interessati; annotate il vostro nick, se lo siete, e siate spietati nella richiesta di chiarimenti (in pagina di discussione). La prima pagina vorrebbe essere "per tutti"; la seconda è rivolta prevalentemente a chi mastica python, ma anche a chi non lo mastica, tanto per sapere "cosa bolle in pentola". --Alex brollo (disc.) 10:51, 14 nov 2011 (CET)[rispondi]

Siccome nel mentre che si insegna, in realtà si impara, vi comunico che ho scovato un sito che mette online magnifici djvu dotati di metadati: http://nips.djvuzone.org/. Adesso possiamo procedere! --Alex brollo (disc.) 13:45, 15 nov 2011 (CET)[rispondi]

Dimensioni leggibili

Mi scuso per la mia scarsa presenza da qualche tempo. Mala tempora currunt.

Vorrei rapidamente sottoporre un problemino che mi è sorto e che, immagino, possa essere di comune interesse. O forse è già stato trattato millanta volte; nel qual caso un link e un buffetto saranno sufficienti.

Qualche giorno fa mi sono imbattuto in un testo (ebbene si, ferroviario) presente in una pagina di giornale. Abbiamo presente le (enormi) dimensioni di una antico foglio di giornale e dei (microscopici) caratteri ivi stampati?

Problema di proofreading:

  • Se inserisco la pagina intera il testo è troppo piccolo e quindi illeggibile o quasi.

Posso rendere tutto leggibile se spezzo le colonne del testo in quattro o più parti - in relazione alle necessità. Ma allora:

  • creo un "falso" in cui le pagine sono del tutto artificiali.

Nel mio disco rigido ho "risolto" con cinque file "pagina"; il primo con il foglio di giornale intero e gli altri quattro con pezzi delle colonne ingranditi abbastanza da renderli proofleggibili.

Può andare bene come "soluzione"?

È una problema già trattato?

SI / NO / :)

Se si, qual è la soluzione? Grazie. --Silvio Gallio (disc.) 16:24, 14 nov 2011 (CET)[rispondi]

Facciamo come fanno su en.source o su fr.source. Come fanno? Boh? Chi va a dare un'occhiata? :-) --79.45.239.151 17:19, 14 nov 2011 (CET)[rispondi]
http://en.wikisource.org/wiki/Page:The_New_York_Times,_1901-08-01.djvu/1
No buono, l'immagine è "per finta", totalmente illeggibile. --Alex brollo (disc.) 17:26, 14 nov 2011 (CET)[rispondi]

Io direi che può andar bene la soluzione che hai prospettato, nella prima pagina il foglio intero, nelle successive i vari settori del foglio ingranditi, un po' come le carte geografiche con il "quadro d'unione" all'inizio e su ogni pagina un settore del quadro. Candalùa (disc.) 12:32, 15 nov 2011 (CET)[rispondi]

Volendo esagerare, si potrebbe costruire un'immagine jpg "mappata" e linkare le singole pagine sulle aree corrispondenti alla loro "regione"; il punto ideale per inserire questa cosa avventurosa direi che potrebbe essere il campo Sommario dell'Indice.

Quindi animo Silvio! Procedi con lo sminuzzamento e il montaggio dei frammenti su un bel djvu.. all'immagine mappata ghe pensi mi. :-) --Alex brollo (disc.) 12:51, 15 nov 2011 (CET)[rispondi]

N.B. su commons le immagini accettano delle "annotazioni" con wikicodice, dunque ogni "frammento" su commons potrà essere collegato agli altri. - εΔω 17:26, 15 nov 2011 (CET)[rispondi]

OK, un paio di giorni e arriva. Bye! Silvio Gallio (disc.) 21:48, 15 nov 2011 (CET)[rispondi]

Orpo... la nota di Edo è oscura anche per me. In ogni caso non dovrebbero esserci, su Commons, immagini multiple, o meglio: dovrebbe esserci una immagine jpg "a piena pagina", e un file djvu contenente un frammento per pagina; nient'altro. Questi due file vanno, effettivamente, collegati fra loro. --Alex brollo (disc.) 22:47, 15 nov 2011 (CET)[rispondi]

Mannaggia. Capito tubo uno! Allora, come le devo confezionare 'ste pagine? Io al momento ho UNA pagina tipo giornale con due colonne -nemmeno intere- scritte e due sbiancate (il pezzo è piuttosto corto). Ingrandito ne ho tratto quattro file (due per ogni colonna). Non ho capito come li devo caricare. CINQUE file.djvu (che posso trasformare in altro formato) diversi ognuno col suo bravo nome (articolo.djvu, articolo1.djvu, articolo2.djvu ecc.) che poi i solito mago elabora e attacca, due file (sotto e sopra), UN file djvu come se fosse un libretto? altro? Attendo fuori linea :P Silvio Gallio (disc.) 16:11, 16 nov 2011 (CET)[rispondi]

Sicuramente un unico file djvu, con 5 pagine: la paginona + i 4 ingrandimenti. Poi, se ho ben capito, Alex prenderebbe la pagina 1 del djvu e ne farebbe una jpg su cui sarebbero mappate le altre 4 pagine. Ma questa è una cosa in più, assolutamente non indispensabile. Tu intanto carica pure il djvu Candalùa (disc.) 17:56, 16 nov 2011 (CET)[rispondi]
Fatto; purtroppo l'OCR non mi funziona. Con calma inserirò anche il testo in NS0. Quelli bravi facciano quello che possono grazie. Silvio Gallio (disc.) 18:59, 16 nov 2011 (CET)[rispondi]
Ottimissimo Silvio! Devo dire che io sono più di bocca buona, mi sembra leggibile anche il "paginone", ma è una bella occasione di sperimentare qualcosa di nuovo. per vedere una pagina veramente illeggibile, ripeto il linketto a en.source: qui :-)
Per l'OCR e tutto il resto degli sperimenti, ghe pensi mi (sempre che qualcuno non mi anticipi: nel caso, non mi offendo....). --Alex brollo (disc.) 10:42, 17 nov 2011 (CET)[rispondi]
Uffa, l'immagine mappata confligge con qualcosa dei template della pagina Indice. L'ho allora ficcata in pag. 1, dentro un tl Pt, date un'occhiata. Test eh.... accetto pomodori. --Alex brollo (disc.) 11:56, 17 nov 2011 (CET)[rispondi]
Ogni tanto mando i miei saluti a John Vandenberg; l'ho fatto ancora, segnalandogli il trucco della jpg mappata, e buttando là una frase sul fatto che stiamo "semantizzando senza semantic wiki". Se la cosa lo interesserà, avrò bisogno di aiuto per spiegargli i vari trucchi semantizzanti....--Alex brollo (disc.) 11:43, 18 nov 2011 (CET)[rispondi]
Una variante del problema la trovate qui. Ho continuato col Rimorchiatore del buon Dietz ma anche qui il testo è problematico (meno). Un'altra soluzione, in questo caso poteva essere il tagliare una parte dell'immagine (da un tropico all'altro) per concentrare l'altezza. Ovvio che la soluzione Alex è la più elegante in assoluto. Questo post era per chiedere se sia accettabile una soluzione cruenta in termini di dimensioni della pagina. (Io propendo per il no). Infine Se qualcuno bravo vuole mettere a posto i miei pasticci con i nomi dei file... :-( (non mi ero accorto del puntino in fondo al tiutolo) Scusate tanto. --Silvio Gallio (disc.) 16:54, 20 nov 2011 (CET)[rispondi]
Un dubbio. A questo punto, visto che possiamo fare una "estrazione mirata" del testo che ci interessa, non vi pare che sarebbe meglio lasciare intatta la pagina originale, usata come "quadro di insieme"? Mi sembra che potrebbe essere un gesto di "rispetto della fonte". Inoltre, Silvio mi ha manfestato un certo entusiasmo per la mia idea delle "immagini mappate", ma prima di procedere vorrei sentire qualche altra opinione. Ho scritto poche righe di aiuto in Aiuto:Immagini mappate. --Alex brollo (disc.) 18:29, 20 nov 2011 (CET)[rispondi]

No, per me no. Ci ho pensato molto qualche tempo fa quando mi è successo di scegliere se togliere o meno alcuni pezzi di testo. Sono arrivato alla (sempre più modestissima) conclusione che la pulizia della pagina, in caso di opere a molte mani che sullo stesso ripiano mostrano a volte molti articoletti e trafiletti, va fatta, anche se non obbligatoria. Non è questione di mancanza di rispetto ma di evidenziazione del topic. Esempio banale questa stessa pagina alla fine dell'articolo che ho lasciato, porta un intero trafiletto e l'inizio di un altro articolo. Il trafiletto è completo e per di più parla di alcune statistiche relative alla strada di San Germano. Eppure l'ho tolto. Per evidenziare l'altro. Solo per quello. Dovessimo decidere che le statistiche del 1836, relative al traffico della ferrovia Paris-Saint Germain en Laye, interessano a qualcuno siamo sempre in tempo a ripetere l'operazione. Diverso (sempre secondo la suddetta conclusione) sarebbe un intero giornale con il quale si può "giocare" a spezzettarlo e mapparlo. Però lo devi fare "tutto"! Poi, come sempre mi adeguo. Ma obtorto collo :) bye!Silvio Gallio (disc.) 20:11, 20 nov 2011 (CET)[rispondi]

Uhm, dopo aver salvato mi è venuto (strano) un pensiero. Sempre non obbligatorio, sarebbe possibile evidenziare solo il testo interessato ma senza cancellare tutto il resto. Pensavo a un ingrigimento del testo NON interessato. Più o meno come i tasti dei programmi che usiamo che diventano neri quando sono attivi e grigi quando "che" no. Adesso grattiamoci coralmente la pera. :P Silvio Gallio (disc.) 20:15, 20 nov 2011 (CET)[rispondi]

Sono passato al test: sempre in compagnia dell'amico Dietz, "meccanico alemanno" ho prodotto questa pagina spero così salvando i capri dei Alex e la cavola di Silvio. Spero che qualcuno si degni di esprimere un'opinione "a grandi linee". Bye!Silvio Gallio (disc.) 10:57, 21 nov 2011 (CET)[rispondi]
Più ci penso più mi intrufolo nell'idea che la soluzione grafica sia questa. Osservare prego la prima e l'ultima pagina diquesto novello pezzo di Cattaneo. A parte l'ennesimo errore nel nome del file (già in Commons...). Pietà! Silvio Gallio (disc.) 18:35, 21 nov 2011 (CET)[rispondi]

Sul computer di chi scrive havvi un file (.pdf) con le quattro povesie presenti nel testo in questione.

Che fo?

  1. Carico direttamente il file così come sta
  2.  Trovo chi vuole convertirlo in .djvu
  3. Lo metto su archive, così il djvu lo fanno loro

Il file è scaricabile qui: http://www.morino.it/download/

--Carlo M. (a.k.a. zi' Carlo) (disc.) 19:36, 14 nov 2011 (CET)[rispondi]

Per stavolta, ma SOLO per stavolta, te l'ho convertito io (ho usato pdf2djvu, per i curiosi): File:Li quattro mejo fichi der bigonzo.djvu. Però se c'hai anche i dati dell'edizione dovresti andare a scriverli su Commons. Domandina: queste so' le pagine da 47 a 50... non è che c'avresti pure il resto del libro? Candalùa (disc.) 21:04, 14 nov 2011 (CET)[rispondi]

SI e NO. SI nel senso che è sul mio tavolo. NON perché non c'è per caso.

Di più: a breve è il centenario della morte (13 dicembre 1911) mentre l'altr'anno è stato il 150nario della nascita. Ci sono state diverse manifestazioni (culturali), perché Zanazzo oltre a poeta è stato grande studioso delle tradizioni popolari romane e laziali. Quindi, visto che ho alcuni testi inizierò a "scannare" quelli che non sono disponibili in rete. Spero che poi ci sia un aiutino da parte di altri nelle fasi successive. Comincerò dalle altre pagine di questo volume. --Carlo M. (a.k.a. zi' Carlo) (disc.) 10:17, 15 nov 2011 (CET)[rispondi]

Risolto il Silvio's Bug

Grazie a Nemo, che ha "aperto un bug" specifico, e dopo qualche insistenza (non molte!), il "bug della pagina 192" del libro di Piola è risolto.

L'ha beccato Bawolff che ha messo in lista bugzilla il seguente messaggio: "Appears to be fixed by fix of bug 31680. Marking dupe." Potete visualizzare la risoluzione del bug vedendo Pagina:Delle strade ferrate e della loro futura influenza in Europa.djvu/206, dove compariva ostinatamente l'immagine della pagina 194 invece che quella della pagina 192.

In pratica, avveniva che vecchie immagini di versioni precedenti di un file djvu persistevano ostinatamente in visualizzazione, mentre in modifica compariva l'immagine giusta; il che creava grande confusione, e grandissimo scoraggiamento di Silvio, oltre che incoraggiare tentativi di correzione che risultavano in un grave peggioramento della già notevole confusione di pagine. Grazie ancora quindi a Nemo, che ha preso a cuore la questione, e a Bawolff, che ha risolto il bug (che datava da molti mesi ma che negli ultimi tempi si era incattivito). --Alex brollo (disc.) 10:34, 17 nov 2011 (CET)[rispondi]

Sembrerebbe di si. con I.E, che non uso quasi mai, in effetti, la situazione pare normalizzata le due pagine 192 e 194 vanno di lusso.. In Chrome no. La 192 mostra la 1984 e la 194 non si vede proprio. Sto pulendo al massimo ma al momento sono ancora lì :( Cosa si deve fare per pulire davvero la cache di Chrome? Silvio Gallio (disc.) 17:38, 17 nov 2011 (CET)[rispondi]

Ma alla fine il RigaIntestazione va nella sezione testo o nell'header???

Ciao a tutti!!! Vorrei che mi chiariste dove mettere l'ormai famoso "RigaIntestazione"!!!! Teso o header? Sto rileggendo "Il mio Carso" e l'ho messo nel testo; ora vedo che l'utente Vasco73 me li sta spostando tutti nel header. Vanno bene entrambi? Grazie a tutti Ciao Gimilzor (disc.) 23:08, 17 nov 2011 (CET)[rispondi]

Va messo nell'header, posto apposito per l'intestazione della pagina.--Barbaforcuta (disc.) 01:23, 18 nov 2011 (CET)[rispondi]
Confermo (anche se vorrei riparlarne... ma per ora il suo posto è nell'header). Se attivate il gadget "Strumenti per la rilettura", un modo rapido per spostarla al suo posto è la usare la funzione postOCR (che la sposta in header e ce la lascia) oppure RigaIntestazione (che la sposta alternativamente dall'header al corpo del testo). --Alex brollo (disc.) 02:11, 18 nov 2011 (CET)[rispondi]
Candalua, appena puoi, potresti montare le istruzioni "spostatorie" di RigaIntestazione in postOCR automatico, non appena viene definitivamente escluso che RigaIntestazione possa/debba stare in corpo pagina? --Alex brollo (disc.) 12:28, 18 nov 2011 (CET)[rispondi]
Negativo. postOCRAutomatico() scatta solo entrando in creazione di una Pagina. La funzione che cerchi tu è verificaPagina(), che scatta sul salvataggio di ogni Pagina. Candalùa (disc.) 12:44, 18 nov 2011 (CET)[rispondi]
Ho perso il controllo di Common.js, il che non è, in sè, un male (soprattutto per gli altri utenti) :-) --Alex brollo (disc.) 12:58, 18 nov 2011 (CET)[rispondi]
Ehm, direi che è ora di entrare nel rifugio antiatomico! - εΔω 18:03, 18 nov 2011 (CET)[rispondi]

Microformat

Aubrey mi segnala questa pagina: Microfotmat (avevo sbagliato link, mi scuso...) Ho il piacere di ricordarvi che noi stiamo usando il meccanismo "microformat" da parecchi mesi, dopo aver sviluppato un set di script che lo trasformano in qualcosa di automatico e totalmente trasparente per l'utente. L'implementazione del meccanismo consente il nuovo tipo di visualizzazione del SAL pagina, e dell'utente che l'ha raggiunto, nel linketto pagina in ns0. Le prime implementazioni sono del marzo, le rifiniture del giugno.

Se leggete Progetto:Qualità/Semantizzazione troverete una breve descrizione dei "due metodi di semantizzazione" che it.source usa correntemente. Il secondo, Meccanismo della semantizzazione via inclusione di codice html, è esattamente il "microformat".

Non so dirvi se abbiamo lanciato l'idea, che poi qualcuno ha raccolto, oppure le idee sono state sviluppate indipendentemente. In ogni caso, sembra che siamo sulla strada giusta. :-) --Alex brollo (disc.) 19:58, 20 nov 2011 (CET)[rispondi]

Perchè sono "perso" nello strato testo djvu

Negli ultimi giorni un manipolo di noi (per ora, io e Samuele, ma spero che il gruppetto si ampli) ha "addentato" il problema dello strato testo dei file djvu. Vorrei spiegarvi l'obiettivo, con l'aiuto dell'immagine della pagina a sin, Pagina:Gli elogi del porco.djvu/44. Senza ingrandire l'immagine, cosa vedete? non potete leggere il testo. Al massimo potete indovinare a fatica qualche parola. Eppure vedete chiarissimamente alcuni dati importanti. Vedete che c'è un'intestazione pagina. Vedete che il testo è diviso in blocchi di tre righe ciascuna. Indovinate che si tratta di versi (la chiave è il margine destro "seghettato" delle righe, e il fatto che le righe non riempiono la larghezza della pagina). Vedete perfino che il primo verso di ciascuna terzina è indentato a sinistra.

Bene, tutti questi dati, che hanno a che fare con la formattazione, sono assenti nel testo OCR puro e semplice; ma sono presenti nel text layer completo dei file djvu, perchè lì ogni elemento del testo è associato alle sue coordinate spaziali, ossia alla sua esatta posizione nella pagina e alla sua grandezza. Nel momento in cui sarà eseguito un perfetto parsing di questi dati (e ci siamo quasi) e verranno scritti gli algoritmi per interpretarli (e qui la cosa si fa dura), un sacco di formattazione (intestazione, applicazione poem, suddivisione in terzine, indentatura del primo verso...) potrebbe essere applicata automaticamente. Ecco l'obiettivo. --Alex brollo (disc.) 08:10, 21 nov 2011 (CET)[rispondi]

Go Alex Go! Questa idea è *fantastica*. --Aubrey McFato 09:30, 21 nov 2011 (CET)[rispondi]
Tutto lo sviluppo del progetto, al momento, è fatto su una cartella dropbox, condivisa fra me, Samuele e Aubrey . Chiunque mastichi python (con cui lavoro io) o php (con cui sta lavorando Samuele), e desideri dare un'occhiata, o contribuire, sarà benvenuto. La pagina di riverimento qui, per un po' di documentazione su quello che via via scoveremo, è Progetto:Trascrizioni/Strato testo dei file djvu, ma per forza di cose (non si può essere dappertutto...) questa pagina sarà sempre piuttosto "indietro" rispetto al progetto (aimè, o si sviluppa, o si documenta, oppure si è professionisti...) --Alex brollo (disc.) 09:55, 21 nov 2011 (CET)[rispondi]
LOL! Alla pagina di riverimento arriverò quando e se ci sarà qualcosa da riverire :P. In ogni caso io mi chiamo fuori per incapacità :) Intanto fammi capire una cosa. Nei testi con giustificazione "normale" e con le parole mandate a capo come si faceva una volta, con trattino, cosa succede? Anche nel testo elettronico le parole vengono tagliate dal trattino e quindi tutto l'ambarand si autogiustifica? Comunque associo i miei ai complimenti di Aubrey. Sembra proprio una trovata geniale. Riverenze! XD --Silvio Gallio (disc.) 14:39, 21 nov 2011 (CET)[rispondi]

Test semantizzazione dati Autore

Il secolo di attività di Autore:Abate di Tivoli è il Template:Abate di Tivoli.

Si, funzia; Alebot sta rielaborando tutti i template che hanno il nome degli autori, abilitando la "semantizzazione" di tutti i dati contenuti nel Template:Autore. I sati sono ottenuti in modo molto intuitivo con un template che ha il nome dell'autore e un parametro, che può essere il nome completo del parametro del template Autore o un suo alias abbreviato o almeno "minuscolificato". Esempio, "Giorno e mese di nascita" può essere passato come tale, ma anche come "gmn" che si fa prima.

Esempio:

Modificando il solo template {{Aut}} si possono ottenere anche combinazioni di dati, indicati semplicemente da un parametro che ne rappresenta la sigla:

Nota tecnica
Il template sfrutta l'area dati della pagina autore, che viene aggiornata automaticamente via js al momento di qualsiasi modifica fatta da un utente. Il template quindi non necessita di alcun aggiornamento. Sfrutta la "semantizzazione di primo tipo", via transclusione selettiva, che ha il vantaggio di essere accessibile via template, ma lo svantaggio di essere pesantuccia per il server. Ergo, usare con una certa moderazione. --Alex brollo (disc.) 10:41, 21 nov 2011 (CET)[rispondi]
Ottimo. Mi raccomando, per non perderne traccia, tutte queste spiegazioni vanno inserite nella documentazione dei template. --Accurimbono (disc) 10:49, 21 nov 2011 (CET)[rispondi]
Pensa: il template accetta anche un parametro "doc"!
Comuque ho modificato il "motore", adesso i parametri non sono più filtrati dal template, ma vengono comunque inoltrati a Template:Aut. Questo permette di aggiungere altre "aggregazioni o elaborazioni" agendo sul solo template Aut. Ecco, per esempio, le due routine aggiunte al volo, link e link+; vediamo se capite perchè il secondo si chiama così. Codice: {{Claudio Corte|link}} e {{Claudio Corte|link+}} rispettivamente, con questi due risultati:
Template:Claudio Corte, Template:Claudio Corte. --Alex brollo (disc.) 20:14, 21 nov 2011 (CET)[rispondi]

In mezzo a tutti questi mostri di informatica

...io ci faccio, e lo so, la figura del pollo (coo, coo). Però uno di questi citati, me lo spiega perché nei gironi scorsi qui sulla colonna di sinistra sotto "Strumenti" si legge "carica un file", poi ieri che ho caricato della robetta, c'era "Carica su Commons" e oggi c'era di nuovo "Carica un file" a adesso, in modalità lettura c'era "carica un file", mentre in modalità scrittura, adesso adesso, c'è di nuovo "carica su Commons". Ma mentre sono in scrittura di qua, in un'altra finestra in lettura (contestuale) c'era ancora "carica su Commons" (ma che è apparso dopo un ripensamento di due o tre secondi). Wow! buonanotte gente! coo coo vado a letto con le galline(lle) :P --Silvio Gallio (disc.) 21:00, 21 nov 2011 (CET)[rispondi]

qualche giorno fa ho notato che i server facevano un po' fatica a caricare, alle volte si vedeva la pagina "nuda", senza gli stili, altre volte si vedeva la pagina apparentemente normale ma senza javascript (l'etichetta "Carica un file" viene modificata in "carica su Commons" appunto via javascript, quindi se quest'ultimo non funziona...). Dopo un po' tutto è tornato normale. Se ti capita ancora, forse ti è solo rimasta in cache un po' di robaccia, fai un bel CTRL-F5 come di consueto. Candalùa (disc.) 21:34, 21 nov 2011 (CET)[rispondi]

FineReader good news

Ho scaricato e testato FineReader 11. Le cose si fanno semplici: può effettivamente salvare il suo output in un file djvu completo di strato testo (il dettaglio è la linea, cosa più che sufficiente). La qualità grafica dello strato immagine non è fenomenale, ma a fare un "trapianto di strato testo" da un djvu all'altro non si sta poi tanto... Penso che mi farò questo "regalo". --Alex brollo (disc.) 00:36, 23 nov 2011 (CET)[rispondi]

Non solo. Il testo html è semplicemente sorprendente (su una pagina test di Dizionario triestino non ha sbagliato un grassetto nè un italico, oltre che interpretare esattamente oltre il 99% delle parole, anche di quelle dialettali). Ora, cosa succede se "fondo" il meglio dei due strati: testo djvu e html? Vedo in un vicino orizzonte delle belle cose.... almeno qua. (alex sloggato)
Rinnovo l'invito agli smanettoni: anche questi test sono fatti nella cartella dropbox che costituisce il "laboratorio djvu condiviso". Chi è interessato a curiosare/a contribuire, mi mandi la sua email e lo "invito" nel laboratorio. Nella cartella condivisa c'è anche la raccolta completa di routine DjvuLibre, quindi i test sono agevoli anche se non si "mastica python" o se non si sono installate le routine DjvuLibre sul proprio pc. --Alex brollo (disc.) 09:11, 23 nov 2011 (CET)[rispondi]

Sentenza Trizzino

Buon giorno. Qui http://digilander.libero.it/lacorsainfinita/guerra2/schede/trizzino.htm c'e' il testo della sentenza Trizzino. E' possibile metterla su wikisource? Grazie, http://it.wikipedia.org/wiki/Utente:Ipvariabile

Ci sono le immagini (o il testo) della sentenza completa? Se sì, certo: le sentenze sono atti pubblici, wikisource ne contiene varie. --Alex brollo (disc.) 11:45, 24 nov 2011 (CET)[rispondi]
Alex ho messo il link. Guarda tu per favore e dimmi che ne pensi. Grazie, http://it.wikipedia.org/wiki/Utente:Ipvariabile
Data la mancanza di risposta avviso che sto creando la voce qui http://it.wikisource.org/wiki/Sentenza_Corte_di_appello_Penale_di_Milano_Vicenda_Trizzino

Pagina principale due anni dopo

Cari amici,

Il layout della nostra pagina principale sta per compiere due anni.

Nulla di strano per i calmi ritmi del nostro progetto. In effetti quest'anno sono intervenuti dei cambiamenti non invisibili grazie alla Wikiguida e al riquadro del centocinquantenario, solamente mi piacerebbe lanciare un sondaggino informale nella comunità con le seguenti domande:

  1. La nostra pagina principale va bene com'è? dove ci sono margini di miglioramento?
  2. su, facciamo tutti un giro per le pagine principali delle varie source: dubitando che la nostra sia la migliore, quali sono le più efficaci?

Il suggerimento sotteso è il seguente: magari non saremo una comunità folta di grafici e tecnici come quella di Pedia, ma sarebbe bello

  • evidenziare i punti di forza delle diverse pagine principali
  • provare in una (o più) sandbox una loro contaminazione in stile "spaghetti Frankenstein"
  • inserirvi un qualche elemento di novità e pensare a una nuova pagina principale qui

ricordo che due anni fa decisi di provarci — senza avere grandi competenze — e fu un'epserienza fantastica dalla quale ho imparato moltissimo sia in termini tecnici sia in termini di crescita dell'interazione con le comunità (chiesi aiuto in diverse lingue e in diversi progetti); l'unica avvertenza è che crescendo la comunità i punti di vista aumentano e il consenso diventa più complesso da raggiungere, ma nessuno ci corre dietro. - εΔω 18:40, 24 nov 2011 (CET)[rispondi]

Su Discussione:Pagina_principale#Nuova_pagina_principale avevamo iniziato un paio di mesi fa a raccogliere idee in proposito, direi che possiamo ripartire da lì. Candalùa (disc.) 23:26, 24 nov 2011 (CET)[rispondi]
(in fretta, ma altrimenti non lo faccio più) Una, fra le altre, cose che mi piace degli inglesi è un bel template dedicato alle collaborazioni/partnership. Mi pare un'ottima idea, che va di pari passo con il nostro Aiuta Wikisource, che tanto ci ha portato bene in questo anno, e che secondo me dovrebbe essere ancora più bello e ancora più grande. io poi metterei (da qualche parte), una barra customizzata per la ricerca di Autori e Opere, e la metterei bella visibile e centrata. Il browsing è ancora interessante, ma credo poco utilizzato (non abbiamo statistica da guardare...) Aubrey McFato 10:08, 25 nov 2011 (CET)[rispondi]

Informazioni sulla fonte dei testi: where do we go from here?

Cari amici,

l'argomento era stato accennato, molto di striscio, ma prima o poi bisognerà affrontarlo se non altro per prendere le misure della questione e disporre una roadmap che possa essere posta in pratica:

  • Dopo la rivoluzione dell'interfaccia proofread e il progressivo viraggio verso questa modalità di lavoro
  • Dopo la rivoluzione della comparsa dell'area dati e la sua ormai navigata sperimentazione

come vogliamo mettere in evidenza le fonti dei testi? Il Template:Infotesto è ancora utile? Come fare in modo che le indicazioni sulla fonte siano indicabili in maniera umana per gli utenti non scafati?

Il mio ideale consisterebbe nella massima razionalizzazione (se le fonti sono già indicate altrove come ad esempio nei file di commons non c'è bisogno di duplicare informazioni già inserite ecc. ecc.) e nella massima semplificazione, ma io sono un sognatore molto prima che un tecnico, ecco perché penso occorra che tutti dicano la loro e soprattutto i tecnici. - εΔω 18:49, 24 nov 2011 (CET)[rispondi]

Intanto che ci pensate, tre "pensieri laterali" sull'argomento da parte mia:
  1. più i dati su Commons diventano importanti, e sono d'accordissimo sull'evitare ogni ripetizione, più diventa opportuno passare dall'uso del template Information al template Book su Commons, scegliendo magari una configurazione semplice, mettendo qui una bella pagina di aiuto e iniziando a convertire da Information a Book i template dei file djvu su Commons;
  2. i file djvu possono contenere metadati;
  3. considero terminata la sperimentazione dei "template autore", ma l'ho iniziata pensando a un più ampio progetto, ossia di estendere la cosa creando dei "template opera". --Alex brollo (disc.) 22:43, 24 nov 2011 (CET)[rispondi]
Oh bene! Direi che è il momento di ri-tirare fuori la mia soluzione "alla veneta" per il problema delle fonti (di cui tra l'altro si sta dibattendo anche su la.source). Take a look a una pagina a caso: un riquadro in basso nella pagina riporta tutte le informazioni sull'edizione e la fonte del testo. In questa maniera qualunque utente non scafato le trova immediatamente, a meno di essere proprio cecati. I dati che vengono mostrati provengono:
  • dalla pagina Indice per le opere proofread
  • da un paio di campi del template Intestazione per le opere non proofread.
senza alcuna ripetizione di informazioni (tranne, a dire il vero, tra l'Indice e la pagina in Commons, ma questa temo sia quasi inevitabile - tra l'altro non mi fiderei troppo a mettere i dati solo su Commons, che è un progetto su cui non abbiamo sufficiente libertà d'azione e che già periodicamente ci dà dei grattacapi).
Noi oggi quello che potremmo fare con poco sforzo è aggiungere questo riquadro in basso, che riporti (in maniera totalmente automatizzata) i dati presenti nella pagina Indice, o in mancanza quelli del Template:Infotesto. In un secondo tempo si può decidere di procedere alla progressiva eliminazione di Infotesto. I due migliori candidati per contenere questi dati sono:
  • il ns0, come su vec.source
  • il nsIndice stesso. Quest'ultima soluzione tra l'altro l'ha appena proposta il buon Doug nella discussione già citata su la.source: in pratica si utilizzerebbero gli Indici come contenitori di dati anche in assenza del file con le scansioni (che può magari arrivare in un qualche futuro). Anche se a prima vista può sembrare una boiata, la cosa ha un suo senso; mi piacerebbe sapere così "a pelle" cosa ne pensate, visto che io stesso sono indeciso in merito. Candalùa (disc.) 23:52, 24 nov 2011 (CET)[rispondi]
  • A pelle: l'idea di una pagina specifica e unica in tutti i casi, come contenitore di metadati relativi all'opera, mi piace moltissimo. Condivido le preoccupazioni nell'uso di dati provenienti da Commons, e ribalterei il problema: su Commons dovrebbero essere replicati (se possibile automaticamente) i metadati contenuti in source, non l'inverso. Per farlo però occorre comunque tener conto della struttura dati di Book su Commons; e i dati di Indice ci si avvicinano molto.
Esiste una relazione "uno a molti", che mi intoppa in alcune idee, fra Indice e ns0, in quanto nulla impedisce di derivare più di una versione ns0 da un solo Indice; un altro buon modivo per considerare Indice, o il nome di Indice, come punto di riferimento unico per i metadati dell'opera.
Vorrei solo che venisse presa in considerazione, a questo punto, l'ipotesi di costruire una pagina Template per ognuno degli indici, analogamente alla pagina Template che nei giorni scorsi ho inaugurato per gli autori; un'altra cosa che farei subito è una modifica del tl Intestazione in modo da fargli accettare, nel campo "URL della versione cartacea a fronte", il nome base della pagina Indice, per dire, lo stesso che viene usato nel tag pages, perchè dal nome base sarebbe molto più facile ricavare via template sia i nomi delle pagine Pagina, sia l'eventuale nome del "template opera". --Alex brollo (disc.) 10:42, 25 nov 2011 (CET)[rispondi]
Il nome base lo puoi già ottenere, {{PAGENAME:Indice:Poemi (Byron).djvu}} dà come risultato Poemi (Byron).djvu.
Sul "template opera" avrei bisogno di capire meglio... alla fine, se ho ben capito, i template per gli autori non fanno altro che recuperare i dati dalla pagina autore più o meno come fa il Template:Dato. Solo che i template degli autori c'erano già, erano diventati inutili e tu li ha solamente "rigenerati" e resi nuovamente utili a qualcosa. Ma i template per le opere bisognerebbe crearli da zero, e prima di creare migliaia di template nuovi, vorrei capire se c'è qualcosa che mi sfugge e se questi template fanno davvero qualcosa di nuovo rispetto a ciò che già esiste. Candalùa (disc.) 11:35, 25 nov 2011 (CET)[rispondi]
Mica sapevo che PAGENAME accetta parametri. Ok, un trucco in più.
Quanto ai template Nomeautore e al connesso template Aut, vero, per gran parte i primi hanno solo una funzione di "smistamento" e di usability (per me, la sintassi che permettono, {{Alessandro Manzoni|Giorno e mese di nascita}} per ottenere il giorno e mese di nascita di Alessandro Manzoni è proprio bella), e questo vale per tutti i dati che sono già presenti in qualche area dati; ma il loro meccanismo consente anche di utilizzarli come contenitori di dati diversi, tipici e caratteristici di un caso particolare, "fuori standard", in numero indeterminato e di formato indeterminato. L'idea era proprio di sperimentare il meccanismo "deviatore per dati standard-contenitore per dati non standard", e devo dire che la cosa funziona. Visto che stiamo parlando di "pagina contenitore", mi sembrava giusto considerare anche questa possibilità. Tenendo conto di quello che diceva Candalua, si tratterebbe di aprire, ad. es. , un Template:Georgiche.djvu che permetta la sintassi {{Georgiche.djvu|autore}}, {{Georgiche.djvu|editore}}.... --Alex brollo (disc.) 12:03, 25 nov 2011 (CET)[rispondi]

Tool "cancellatore" di formattazione

Io trovo più fastidioso cancellare la formattzione (quando serve) che aggiungerla; ci sono molti pulsante, ecc per aggiungere cose, ma nessuno per toglierle. Ho un prototipo di "script cancellatore" che elimina grassetto, corsivo e qualsiasi tag tipo html dal testo selezionato (operativamente: si seleziona il testo dove eseguire la cancellazione, si clicca e il testo selezionato viene "ripulito"). Chi fosse interessato a provarlo, mi avvisi (chi si destreggia in js, basta che scopiazzi da sè dal mio vector.js i due script removeTags() e gst() ). --Alex brollo (disc.) 17:23, 26 nov 2011 (CET)[rispondi]

Aggiungo: il tool aggiusta paragrafi è aggiustato. Il tool aggiunge una riga bianca nei testi da OCR fra un paragrafo e l'altro, "indovinando" la presenza di una paragrafo dal carattere finale di una riga. Il tool "salta" le aree in versi, identificate da una coppia di poem; quindi, volendo utilizzarlo, sul testo OCR bruto è opportuno mettere i tag poem come primissimo passo. --Alex brollo (disc.) 12:19, 28 nov 2011 (CET)[rispondi]
Riguardo ai tool "Trumenti per la rilettura", ho in mente di cancellarne due, sostituendoli con "richieste interattive".
  1. aggiungi tag poem. Nei datiPagina esiste il dato "tipo="; se tipo=poesia e SAL=25%, postOCR dovrebbe, per prima cosa, aggiungere poem di default all'intero testo (poi magari il tag sarà trascinato nel punto giusto). Negli altri casi un pulsante basta e avanza. Questo potrebbe essere il primo passo del tool postOCR (se si lancia postOCR e il tool "si mangia" le interruzioni di riga a fine verso, addio)
Ho montato il trucco in una copia di postOCR, è veramente molto utile. Adesso però sento l'esigenza di un "cancellatore di prima riga del testo OCR". :-)
  1. aggiusta paragrafi. Eccellente ma... chi lo usa? Lo sostituirei con una valutazione via js, nelle sole pagine SAL 25%, della probabile opportunità di usarlo (presenza di probabili fine paragrafo); in caso affermativo, js potrebbe chiedere "Eseguo aggiusta paragrafi?".


Che ne dite? --Alex brollo (disc.) 13:44, 29 nov 2011 (CET)[rispondi]

Habemus FineReader 11

Abbiamo un FineReaader 11, che converte automaticamente qualsiasi cosa in un djvu con OCR FineReader "incorporato". Le eventuali pagine doppie tipo OPAL sono automaticamente splittate. Insomma: dal pdf al djvu+OCR in un solo colpo. Sto facendo una prova con La pastorizia di Cesare Arici, incuriosito dal fatto che Leopardi parla benissimo dello sconosciutissimo (per me) autore. Finite le prove, metto FR 11 a vostra disposizione. --Alex brollo (disc.) 01:33, 29 nov 2011 (CET)[rispondi]

Preciso: per fare pratica su casi concreti, non solo sono disponibile, ma invito chiunque abbia un pdf da convertire in djvu+ocr a farmelo pervenire. Chiederei solo due cortesie: 1° che si tratti di opere che effettivamente saranno "lavorate", in tempi brevi; 2° che mi venga anche fatto pervenire in qualche modo un elenco dei dati necessari per caricare il file djvu su Commons (megklio ancora, il testo del template Information bello e pronto) e per compilare il template della pagina indice. --Alex brollo (disc.) 12:14, 29 nov 2011 (CET)[rispondi]
Ecco, ti sei fregato con le tue mani: appena posso, ti mando una mezza decina di pdf di Scientia... :-P --Aubrey McFato 13:25, 29 nov 2011 (CET)[rispondi]
Vedi punto 1°. ;-) Guarda che poi controllo. --Alex brollo (disc.) 13:35, 29 nov 2011 (CET)[rispondi]
Uomo di poca fede :-D Il progetto Scientia procede lento ma procede, soprattutto grazie agli utenti delle altre Source :-). Io l'ho pure sponsorizzato in Pedia, con pochi risultati adesso come adesso. A far le cose fatte bene, uno dovrebbe andare nelle cronologie delle voci degli scienziati e spammare il progetto... --Aubrey McFato 18:33, 29 nov 2011 (CET)[rispondi]
Ehi, che ne diresti del Fedro tradotto da Trombelli proveniente da GoogleBooks? Ci servirebbe giusto un djvu con layer di testo per il M&S! - εΔω 19:07, 29 nov 2011 (CET)[rispondi]
In lavoro. --Alex brollo (disc.) 20:21, 29 nov 2011 (CET)[rispondi]
Non so se ho fatto bene, ma ho caricato l'intero libro e l'ho chiamato, visto il contenuto, File:Lucrezio e Fedro.djvu. La qualità della scansione non è buona, non spero miracoli dall'OCR. Provo ad aprire anche l'Indice. --Alex brollo (disc.) 22:41, 29 nov 2011 (CET)[rispondi]
Nel dubbio... hai fatto bene! Quanto alla qualità dell'OCR quel che conta è la sola presenza di un layer di testo per preparare il Match&Split, la trascrizione è già stata fatta. - εΔω 23:10, 29 nov 2011 (CET)[rispondi]
Molto interessante, ma non ti voglio assillare con i miei testi :) Che cosa significa FR11 a vostra disposizione? Qualcosa tipo any2djvu? Cioè si carica il .pdf (OPAL o GOOGLE books) su questa piattaforma e un bot ce lo restituisce lavorato pronto per Commons e NsPagina? --Xavier121 19:27, 29 nov 2011 (CET)[rispondi]
No Xavier, intendo che mi offro io come volontario e possessore di un FR con regolare licenza. Recentemente, in lista wikisource, è stato citato un caso analogo nella wikisource svedese. Quindi niente automatismi; solo volontariato e "divisione di compiti". --Alex brollo (disc.) 20:06, 29 nov 2011 (CET)[rispondi]
In lista Wikisource ho proposto (Alex lo sa) il progetto dell'acquisto di un FR11 da mettere sul toolserver, per far funzionare di nuovo il pulsante OCR e magari per delle conversioni. La discussione va avanti e ci sono cose interessanti, secondo me sarebbe carino averlo per vari motivi, ma forse il costo è proibitivo... Comunque, continuiamo a discutere (potete venire anche voi, anzi! più siamo meglio è). Intanto, scopro pure questo: http://finereader.abbyyonline.com/en/Account/Welcome Aubrey McFato 10:00, 1 dic 2011 (CET)[rispondi]
Aimè; se c'è un servizio OCR online a pagamento della ABBYY, sarebbero dei veri idioti a "dar via" il suomotore in modo che possa essercene uno online gratuito. :-( Temo che non siano idioti. --Alex brollo (disc.) 07:53, 5 dic 2011 (CET)[rispondi]
In realtà, è comparso in lista wikisource un dato: la reale necessità di pagine ocr di tutte le wikisource del mondo (ossia,il numero di pagine che il "sistema wikisource" è in grado di smaltire ogni giorno) è di circa 900. Se ci organizzassimo, basterebbe UNA licenza FR11 per tutte le wikisource del mondo! --Alex brollo (disc.) 07:53, 5 dic 2011 (CET)[rispondi]

Spostiamoci in Progetto:Trascrizioni/FineReader 11

Proporrei di aprire una sottopagina "di lavoro" come da titolo; butto giù in breve qualche caratteristica e qualche possibilità del programma e poi ci organizzeremo per le "richieste" e lo "stato di avanzamento" dei lavori. Ci vediamo di là! --Alex brollo (disc.) 00:14, 30 nov 2011 (CET)[rispondi]

Idee balzane

Mi è venuta un'idea stupidissima: perchè non contatare scuole/corsi di dattilografia e mostrargli Wikisource come piattaforma per esercizi e compiti? Abbiamo testi con ogni tipo di difficoltà 8da quelli giuridici a quelli matematici); abbiamo un avanzamento qualità per la rilettura, con le diff per vedere gli errori; abbiamo il timestamp e le ultime modifiche, per seguire i tempi; abbiamo tutto. Ci manca solo trovare degli aspiranti dattilografi che facciano i compiti qui da noi :-) --Aubrey McFato 11:39, 29 nov 2011 (CET)[rispondi]

Io! Io! Io! Voglio fare la dattilografa! Così mi sembrerà di tornare a quando ero giovane e carina ... --Lagrande (disc.) 17:01, 29 nov 2011 (CET)[rispondi]
Ma allora, Grisone (che non è seicentesco ma cinquecentesco, e ha una qualità molto buona) va bene! :-P --Alex brollo (disc.) 01:02, 30 nov 2011 (CET)[rispondi]
Ma se sono solo da correggere, e non da scrivere, a che servono i dattilografi? --Lagrande (disc.) 07:48, 30 nov 2011 (CET)[rispondi]
Io comunque non ho la più pallida idea di come fare a contattarli... Mi sembrava solo un ottimo target :-) se qualcuno ha idee ben venga. @Lagrande, secondo me hai ragione tu, ma magari gli interessa pure correggere bozze in fretta, oltre che trascrivere da capo... Poi, ogni tanto, quando l'OCR è messo molto male, si fa prima a rifare da capo piuttosto che correggere. Aubrey McFato 09:57, 30 nov 2011 (CET)[rispondi]
Giusta l'osservazione di Lagrande. La mia non era una battuta: gli unici testi da proporre come "esercizio dattilografico" sarebbero quelli che non sono assolutamente interpretati dall'OCR, e che hanno proprio le caratteristiche indicate da Edo come inadatte: sono di pessima qualità grafica oppure sono scritti in italiano "alieno". In conclusione: i testi adatti sono quelli che sono inadatti. :-(
Approfitto per ripetere un'osservazione: non ho mai sentito parlare, qui, di inserimento di testi mediante l'uso di programmi di interpretazione vocale. Dopo un bel po' di training, questi programmi danno risultati sorprendenti e potrebbero essere l'uovo di Colombo per i testi antichi. Purtroppo il mio Dragon di tanti hanni fa si rifiurta di funzionare sul mio portatile attuale, cosa che mi ha impedito, finora, di fare una prova. Però... a pensarci bene... forse agli aspiranti dattilografi potremmo passare i file vocali da lettura umana del testo.... che ne dite? Di certo anche i dattilografi umani farebbero un bel po' di errori, ma chissà... forse meno che un OCR. --Alex brollo (disc.) 10:10, 30 nov 2011 (CET)[rispondi]
Ma se ti capita un dattilografo con un forte accento locale, o quelli che mia madre, maestra in pensione, definisce "colpiti da analfabetismo di ritorno"? In sostanza, il software funziona lo stesso se qualcuno non sa leggere bene? --Lagrande (disc.) 11:03, 30 nov 2011 (CET)[rispondi]
Per quanto riguarda il mio amato Dragon, il suo sistema di "training" era veramente eccellente, indovinava moltissimo una volta "inquadrato il lettore". La difficoltà nasceva nel momento in cui gli si insegnano cose un po' più difficili (ma possibili) come aggiungere formattazione, o decodificare sigle, o codificare testi in sigle... lì si vede se l'operatore è smanettone o no; se è smanettone, sono convinto che si potrebbe arrivare a dettare comodamente testo e codice wiki.
Per quanto riguarda l'idea, più banale, di procurare ai dattilografi umani file vocali con testo dettato, bè, lì le cose sono diverse e forse più facili: si potrebbe infatti dettare anche la formattazione, un dattilografo di intelligenza normale non dovrebbe aver problemi a interpretare una cosa come "due graffe aperte autorecitato barra verticale virgilio due graffe chiuse". --Alex brollo (disc.) 11:47, 30 nov 2011 (CET)[rispondi]

Motivational advertising!

La misura del tuo successo è quella degli ostacoli che devi superare per giungere alle METE!

Cari amici,

questo messaggio non è particolarmente necessario, ma sentivo che un po' di motivazione la si può ricavare:

  • Il nostro contatore di testi è parzialmente inaffidabile, e infatti non stiamo qui a contare troppo, ma
    1. Avevamo da poco stappato lo spumante per il cinquantamillesimo testo...
    2. ...quand'ecco che è intervenuta la falciatura di testi di cinquemila... quasi seimila pagine tra fine settembre e inizio ottobre
    3. ciononostante nel corso di due mesi abbiamo riguadagnato i cinquantamila testi! Guardate le date dei link e le attuali statistiche o anche solo in intestazione della pagina principale...

I casi sono due, o noi abbiamo inserito seimila testi in nemmeno due mesi o il contatore delle statistiche ci sta giocando qualche piacevole scherzetto. Onestamente non me ne importa: non c'è che da festeggiare la solerzia e il riscontro che il nostro progetto sta acquisendo passo passo, e qui un po' di ringalluzzimento dell'autostima non spiace: la meta di salvare e diffondere con la migliore qualità quanti più testi possibile è una sfida immane, ma noi siamo sempre in prima linea! Woohooo! - εΔω 11:06, 30 nov 2011 (CET)[rispondi]

Evviva! Non che io abbia contribuito granchè, ma ogni occasione è buona per festeggiare ... --Lagrande (disc.) 11:10, 30 nov 2011 (CET)[rispondi]
Doppiamente felice, essendo stato "la falce".... ;-) --Alex brollo (disc.) 11:39, 30 nov 2011 (CET)[rispondi]
...finché respiro... sempre con voi... :) --Xavier121 13:32, 30 nov 2011 (CET)[rispondi]
Siete stati tutti bravissimi (io mi chiamo fuori; solo una quarantina di pagine da settembre in qua :-( ). E allora evviva e complimenti. Ad majora (o a maggese...non ricordo bene) :P --Silvio Gallio (disc.) 17:31, 1 dic 2011 (CET)[rispondi]

I fine riga originali

Una delle prime cose che facciamo (anzi che fa postOCR se lo usiamo...) è rimuovere dal testo OCR i fine riga e ricongiungere le parole spezzate a fine riga. Dà molta soddisfazione (soprattutto se lo fa postOCR in un baleno). Ma.... vi siete accorti che è più facile correggere i testi in poesia che in prosa, perchè è più facile, a colpo d'occhio, trovare le righe corrispondenti? Eppure i fine riga originali non vanno conservati, o meglio: almeno le parole spezzate a fine riga vanno ricongiunte, altrimenti in visualizzazione sono una porcheria....

Possibile soluzione: conservare i fine riga originali fino a rilettura terminata, e mascherare in qualche modo le parole spezzate perchè restino spezzate, ma non si veda.

Lo fa, direi benino, il tool "parole spezzate" che aggiungo temporaneamente a Strumenti per la rilettura perchè possiate provarlo. --Alex brollo (disc.) 14:54, 30 nov 2011 (CET)[rispondi]

Sequenza "furba" di tools Strumenti per la rilettura

Sto verificando che sulle opere in prosa (soprattutto se è stato impostato il datiPagine; se non sapete cos'è, chiedete aiuto a uno qualsiasi degli utenti esperti) la sequenza più furba per fare le primissime modifiche di una pagina con OCR integrato nel djvu è:

  1. elimina riga 1 per eliminare "pattume" prima della prima riga di testo; tanti click quante sono le righe di pattume da eliminare
  2. aggiusta paragrafi, un solo click;
  3. POI postOCR cliccato per due volte consecutive (il prima "fa il lavoro" e crea RigaIntestazione, il secondo sposta RigaIntestazione nell'header)

L'errore da non fare è dare postOCR per primo, perchè poi non si possono più usare i due primi tool.

Ho sistemato i tre tool nell'ordine giusto, per aiutare a ricordare la sequenza "furba".

Nel caso delle opere in versi, le cose sono diverse, e avvio il cervello per renderle quanto più possibile uguali.--Alex brollo (disc.) 08:39, 4 dic 2011 (CET)[rispondi]

Ho in Utente:Alex brollo/vector.js una nuova versione di rimuoviPrimaRiga() che "rulla" quella di default; in effetti, adesso lo script indovina (non so ancora con che accuratezza, test in corso) se un testo è prosa oppure poesia, esaminando il solo testo della pagina, e se è poesia prima aggiunge un tag poem attorno all'intero testo, poi elimina la prima riga (salvando il tag poem). Così facendo, esclude i "danni da aggiustaParagrafi" e pure i danni da postOCR; in altri termini, quando lo script indovina, la sequenza elimina riga 1 - aggiusta paragrafi - postOCR è altrettanto sicura nei testi in prosa che in versi. Cerconsi coraggiosi volontari per stressare lo script. --Alex brollo (disc.) 13:17, 4 dic 2011 (CET)[rispondi]

Help (?)

Aiutooo! :) A suo tempo avevo cominciato a giocare con un wiki libro. Me l'ero dimenticato e me l'ha ritrovato Guggol. Oggi ci ho girato un po' per rinfrescarmi il neurone. Ma!! Non riesco più a chiudere il "banner" in alto che adesso si apre in tutte le pagine. Quando clicco "Creatore di libri (disattiva)" mi viene detto "Il creatore di libri verrà disattivato e il libro a cui si sta lavorando sarà rimosso." Ma io voglio solo chiudere il banner mica rimuovere l'intero baraccone! Oppure il testo del "warning" è un po' incorrect e non succede niente? Ma se si? Nel (orribile) dubbio mi astengo ma quel banner è un po' in mezzo ai calli. :-( --Silvio Gallio (disc.) 17:12, 4 dic 2011 (CET)[rispondi]

Dimenticavo; cliccare su aiuto non mi ha portato molto lontano. Se no non scrivevo qui... :P Scappo e fuggo. Buon resto di domenica. Silvio Gallio (disc.) 17:15, 4 dic 2011 (CET)[rispondi]

Avviso Strumenti per la rilettura

Dopo un tentativo (vedi messaggio precedente tagliato via) ho ideato un altro "trucco" forse più intuitivo.

Come aprite una nuova pagina, appena il testo OCR viene caricato parte un "postOCR automatico" creato da Candalua; la routine che tira a indovinare se il testo è prosa o poesia è inserita all'inizio di questo script. Se alla routine pare che il testo sia poesia, allora vi chiede conferma ponendovi la domanda: "E' un testo in versi?". Se confermate con un Enter, aggiunge un poem attorno al testo; se negate con Annulla, non lo appone. Potete comunque utilizzare il tool "elimina riga 1", se dopo il tag poem c'è una riga di pattume, il tag poem verrà salvato; e poi potete tranquillamente usare aggiusta paragrafi e postOCR senza devastazione degli acapo fissi del testo in versi.

Mi raccomando: datemi feedback! E fra l'altro, mi resta la insoddisfatta curiosità di sapere quanti fra voi utenti - escluso il drappello degli "utenti storici" - utilizzano il gadget Strumenti per la rilettura. --Alex brollo (disc.) 17:14, 5 dic 2011 (CET)[rispondi]

(a parte)Ti comunico Alex che ieri è passato un "progetto Usabilità" per Source, e quindi proveremo a cercare un esperto che venga da noi e ci insegni a mettere a posto tutti i nostri tool. Un mio feedback, per esempio, è che sarebbe meglio togliere il template RigaIntestazione da postOCR, perchè preferisco fare io un click in più che avere un utente non esperto che lascia dei template riga intestazione in giro senza saperlo... Inoltre, ripristinerei il tool delle virgolette, che era comodissimo. --Aubrey McFato 17:21, 5 dic 2011 (CET)[rispondi]
Ma esiste questo fantomatico utente non esperto che attiva il gadget Strumenti per la rilettura? E' questa la domanda che mi opprime.... :-( Se questo utente esiste, batta un colpo.
Aubrey... quale, precisamente, strumento per le virgolette? Quello che convertiva "" in “”? Oppure in “„ oppure in „“ oppure in «» oppure in ‘’.... quando mi son reso conto della varietà di possibilità mi sono un pochino demoralizzato. --Alex brollo (disc.) 17:36, 5 dic 2011 (CET)[rispondi]
Ho riattivato virgolette(), ma è ancora incompleto; mi tocca aggiungere un parametro virgolette:... in datiOpere in modo da registrare la "variante virgolette specifica per opera", e poi fare in modo che virgolette() legga il dato. --Alex brollo (disc.) 19:05, 5 dic 2011 (CET)[rispondi]
Dovrebbe essere ok; per attivare le "virgolette opera-specifiche" occorre aggiungere alle altre variabili di datiPagine un codice tipo:
'virgolette':'“„',
mettendo ovviamente le virgolette "giuste" per l'opera. Un esempio (che ho usato per i test) in MediaWiki:Variabili.js nei dati di Rivista di Scienza - Vol. II.djvu.--Alex brollo (disc.) 21:26, 5 dic 2011 (CET)[rispondi]
Perdonami, il tool che volevo intendere (pessima scelta di parole) era quello degli apostrofi: operazione che è terribile fare a mano, e che io faccio con postOCR, solitamente, ma ogni tanto mi smanaccia troppa roba (per es., mi mette un template intestazione che poi devo togliere). --Aubrey McFato 10:18, 9 dic 2011 (CET)[rispondi]
Ah. Quello. :-(
L'ho eliminato perchè, per quelle poche volte cha aggiunge un rigaIntestazione di troppo, la svuoto in un lampo e la metto vuota in header con un secondo click su postOCR, dove non dà alcun fastidio, anzi, e da là non si muove più. Io uso sempre postOCR per gli apostrofi. Comunque, lo riattiverò. --Alex brollo (disc.) 14:46, 9 dic 2011 (CET)[rispondi]

Portale Diritto

Come forse avete visto ho preparato una bozza del suddetto portale. Credo che ci sia ancora molto da migliorare: proposte?--Erasmo Barresi (disc.) 18:42, 7 dic 2011 (CET)[rispondi]

Ti dirò che a me piace già molto e che non vedo granché da migliorare, ma forse sono stato troppo veloce nel guardare la bozza... Sicuramente occorrerà rendere dinamici i riquadri "di vetrina" come nella pagina principale ma questo si può fare tranquillamente. - εΔω 22:49, 8 dic 2011 (CET)[rispondi]

Problemi col SAL

C'è qualche problema con le modifiche, non viene più aggiunto il SAL in fondo alla pagina (e causa problemi con gli a capo tra pagina e pagina). --Luigi62 (disc.) 19:40, 8 dic 2011 (CET)[rispondi]

Dovrei avere sistemato. Alex, stavo quasi per risponderti che purtroppo non ho tempo per seguire le tue novità, e invece mi hai fatto lavorare anche stavolta! :-) Mannagg'.... Candalùa (disc.) 20:23, 8 dic 2011 (CET)[rispondi]

Non puoi dire che faccio le cose a tua insaputa. Quando qualcosa si intoppa sai già di chi è lacolpa e dove mettere le mani. :-)
Beh, dovrei aver finito con Common.js, mi scuso del disagio e spero di portare a casa presto i frutti di questa fatica. --Alex brollo (disc.) 01:19, 9 dic 2011 (CET)[rispondi]

FILENO OLIVIERI

Salve, sono utente Esmeralda. Ho molto apprezzato il contributo Errori e soluzioni, Italia Meridionale di Fileno Olivieri. E vorrei comunicare a quanti fossero interessati all'argomento di possedere un vecchio volume inerente La Questione Meridionale, non credo sia più in commercio. Grazie.

Progetto Phe

Ho il piacere di dirvi che la primissima versione del "progetto Phe" funzia. Ma siccome so come son fatto, e quanto chiare sono le mie spiegazioni delle cose nuove e exotiche, vi risparmio le spiegazioni.... se son rose, fioriranno. :-) --Alex brollo (disc.) 01:31, 10 dic 2011 (CET)[rispondi]

L'esperimento è in corso su Indice:La pastorizia.djvu (pagina SAL 25%). --Alex brollo (disc.) 15:02, 10 dic 2011 (CET)[rispondi]
Phe ha preso atto del "progetto Phe" :-) ed è già venuto a dare un'occhiata a Indice:La pastorizia.djvu, pagine dalla 58 in poi. Siccome queste pagine contengono tutte i dati necessari al suo progetto, l'ho invitato a usarle per qualsiasi test. Io invece vado avanti con l'idea di "spingere" fin dove possibile sulla formattazione automatica. --Alex brollo (disc.) 20:56, 10 dic 2011 (CET)[rispondi]


The Teamwork Barnstar
Ad Alex Brollo Xavier121 00:13, 11 December 2011 (UTC) (fichissima questa cosa di Commons! ...la possiamo importare anche qui da noi?)
Mi confondi, Xavier... :-)
Approfitto per nuntiare vobis un risultato a cui tenevo da molti mesi: il "progetto phe" ha partorito il primo riconoscimento automatico di formattazione di un testo centrato attraverso uno script js locale, basato sull'analisi delle coordinate della riga, ed ha quindi applicato automaticamente il template centrato a una riga centrata. Si aprono interessanti scenari. Le cose sono messe in modo che chiunque lo voglia fare può provare a inventare nuovi algoritmi di formattazione automatica, riga per riga; ma ne parleremo in bar tecnico perchè non è difficilissimo, ma nemmeno semplicissimo ;-) . --Alex brollo (disc.) 09:20, 12 dic 2011 (CET)[rispondi]

Demotivator

Statistiche testi (proofread e non proofread) al 10 dicembre 2011

Bene. Vi ho lasciati sollazzare coi festeggiamenti per il 50millesimo testo (vedi #Motivational advertising!). Ora beccatevi la doccia fredda. I testi non sono così tanti. Sono "solo" 38.715. Contati uno per uno (non da me in persona, ma dal mio fido aiutante meccanico). Cifra che del resto corrisponde grossomodo con queste statistiche. E comunque, tanto per essere pignoli, vi ricordo che quelli non sono i testi bensì le pagine. Quindi i testi propriamente detti sono certamente molti di meno. Propongo quindi di togliere il contatore dalla pagina principale, visto che chiaramente non funziona. Niente in contrario a mostrare un qualche numeretto che comunichi al mondo a che punto siamo arrivati, ma cerchiamo per piacere di metterci d'accordo su che cos'è che stiamo mostrando e come va calcolata la cifra. Candalùa (disc.) 01:40, 11 dic 2011 (CET)[rispondi]

Vero, ma lo strano algoritmo di calcolo vale più per confronti interprogetto che come valore assoluto; un numero esatto, ma non confrontabile con quello di altri progetti, temo avrebbe un significato limitato. Forse sarebbe il caso di discutere il problema in lista wikisource, in modo da identificare un parametro comune.
Aggiungo a lato la rappresentazione del nostro "andamento testi", l'orrendo scalino verso il basso corrisponde alle due grandi falciature del vecchio Zibaldone e di Bibbia. :-(
Notate che i testi "rossicci" (non proofread) restano costanti, mentre gli azzurri (proofread) si incrementano con notevole regolarità; la pendenza, molto costante, indica la capacità di caricamento "fisiologica" attuale del complesso degli utenti. --Alex brollo (disc.) 08:11, 11 dic 2011 (CET)[rispondi]
Concordo. Se il contatore non funziona non ha senso tenerlo, ma sarebbe bene capire _cosa_ conta il contatore, per dare un senso ai numeri. Che in ogni caso sono importanti, ma solo fino ad un certo punto, visto che il nostro progetto è da tempo improntato alla qualità, anche se la quantità non guasta certo. --Accurimbono (disc) 16:29, 11 dic 2011 (CET)[rispondi]
Bah, a me il contatore non dispiace: so che è inaffidabile, ma finché serve per fare festa e fare i bulli o le competizioni con le altre source è un passatempo innocuo. Semmai sarebbe utile che i dati più "verisimili" siano calcolati e mantenuti da qualche parte oltre che in Speciale:Statistiche. Qualche amministratore vuole controllare in quale ordine mostrare i link posti in Speciale:Statistiche? - εΔω 19:25, 11 dic 2011 (CET)[rispondi]

I dati di Speciale:Statistiche, paragrafo "Statistiche sulla qualità", sono abbastanza affidabili. Abbastanza, perché sono comunque una sovrastima dovuta al fatto che le categorie contengono un mucchio di vecchi redirect come questo: se nessuno ha obiezioni, io quei redirect li cancellerei una buona volta, visto che sono in totale contrasto con l'architettura che abbiamo messo in piedi. Il totale della prima riga dà in questo momento 39425, che è un numero non troppo lontano dal vero, ed è quello che mostrerei io sulla pagina principale. Sarà anche un passatempo innocuo, ma millantare un 25% in più del reale non mi sembra troppo corretto da parte nostra. Poi se le altre wiki "imbrogliano" e ci bulleggiano, chisseneimporta; tanto noi lo sappiamo quali sono i numeri "veri". :-) Candalùa (disc.) 23:55, 11 dic 2011 (CET)[rispondi]

Concordo sui redirect e sul presentare in PP un dato reale. --Xavier121 00:10, 12 dic 2011 (CET)[rispondi]
Sta il fatto che il numero 50000 ecc. corrisponde alle pagine "good" (che sono tutte quelle "non stub" di un elenco definito di namespaces) calcolate con un algoritmo comune a tutti i progetti source e comparabile pure con analoghe statistiche di altri progetti; ha un certo valore, ma andrebbe definito per quello che è (di certo, non si tratta di "testi" ma di "pagine di contenuti"). Come tale potrebbe essere ancora evidenziato, con un rimando alla statistica globale che permette il confronto con altri progetti.
Quanto a statistiche più approfondite.... la mia opinione è che il tempo che abbiamo sarebbe da dedicare a incrementarle, tali statistiche, più che a calcolarle. :-D --Alex brollo (disc.) 09:28, 12 dic 2011 (CET)[rispondi]

chiamata alle armi

Sto cercando di svuotare più possibile la vecchia Categoria:Testi SAL 100% (vi ricordo che i testi proofread, una volta riletti, vanno messi in Testi Edizioni Wikisource, e non in Testi SAL 100%, che è riservata ai testi riletti ma senza versione cartacea a fronte). Ci sono in essa diverse opere importanti che sarebbe bello avere in forma proofread. Tanto per dire tre mostri sacri: i Canti del Leopardi, i Sonetti del Foscolo, le Odi del Parini. Mi aiutare a trovare sui soliti siti una buona edizione per queste tre opere (o per altre che vedete lì dentro)? L'idea a lungo termine sarebbe, una volta svuotata la categoria SAL 100% da tutto ciò che può diventare proofread, di portare ad un più prudente 75% i pochi testi che saranno rimasti, ed eliminare la categoria; di modo da ritrovarsi con 4 livelli di qualità su ogni namespace, perfettamente coerenti tra loro (vedete la tabella qui con l'evidente anomalia dei 5 livelli per i Testi e 4 per Pagine e Indici). Candalùa (disc.) 23:55, 12 dic 2011 (CET)[rispondi]

Posso aiutarti con i Canti. --Xavier121 00:23, 13 dic 2011 (CET)[rispondi]
Sono molto d'accordo con Candalua, e dirò di più: una volta esauriti i testi SAL 100% possiamo sostituire la stelletta con il quadrato "SAL 100%" uniformando così completamente la grafica tra i namespace. - εΔω 00:51, 13 dic 2011 (CET)[rispondi]
Se posso essere d'aiuto... Purchè mi diate indicazioni molto precise di cosa debbo fare, e purchè non ci sia una scadenza temporale. --Lagrande (disc.) 07:41, 13 dic 2011 (CET)[rispondi]
Ricordatevi di me, e del mio fido FineReader 11. Appena trovate delle buone scansioni, mi prenoto per fare un ottimo OCR e preparare il djvu. Basta che mi diciate dove scaricare un pdf, un djvu, una collezione di immagini. --Alex brollo (disc.) 09:11, 13 dic 2011 (CET)[rispondi]
Se c'è da sparare... :) Mi accodo a Lagrande. Qualcuno di voi "mostri sacri" butti giù la lista, e man mano che il pezzo sarà scaricato da un utente ci si mette un simbolo (stike?) per evitare doppioni. Come sapete anch'io no ho molto tempo, ma una mano arriverà di certo. Bye!--Silvio Gallio (disc.) 09:21, 13 dic 2011 (CET)[rispondi]
* Canti di Leopardi: vasta scelta su IA: [3]; problema: scegliere l'edizione più prestigiosa e meglio scannerizzata.
  • Odi di Parini: questo mi pare buono, verifico che non ci siano falli e poi lo carico
    • La scansione è un disastro di pagine mancanti e doppie.... NON caricatela, vediamo se si può restaurare. Approfitto per raccomandare a tutti una verifica puntigliosa della sequenza pagine dei djvu da google e da IA prima del caricamento (dopo tutto diventa difficile!). Non fidatevi!
  • Sonetti del Foscolo: a voi la ricerca. Alex brollo (disc.) 09:35, 13 dic 2011 (CET)[rispondi]
Alex, se te la senti, si possono recuperare ottime edizioni da OPAL, qui Parini e qui Foscolo. :) --Xavier121 13:52, 13 dic 2011 (CET)[rispondi]


Note a margine


Da un pov scientifico l'edizione del Ranieri è sempre stata criticata per le numerose sviste e per il sospetto che non sia stata rispettata compiutamente la volontà dell'autore. Per la nostra biblioteca avrebbe un volore più che altro storico. Diverso il caso di quelle a colori, sempre su IA, una di Donati e l'altra di LEVI (la prima più scarna ed essenziale con poche note, la seconda preferibile per l'ampio apparato critico, le interessanti introduzioni alle poesie e una storia editoriale del testo completa ecc.), ma per entrambi c'è il sospetto di copyviol perché il Levi è morto nel 1951, mentre non trovo alcuna data per Donati. Io sto lavorando per ottenere l'edizione del Moroncini (la più autorevole), pubblicata per la prima volta a Biologna nel 1927, ma ristampata in una miscellanea delle opere complete di G. Leopardi nel 1978. Poiché il Moroncini è morto nel 1935, dovrebbe essere di pubblico dominio in entrambi i paesi perché testo pubblicato dopo il 1977 con autore morto da 70+1 anni (chiedo conferma ai fanatici del copyright). Questo sarebbe un bel colpo, visto che ci vogliamo mettere le mani. --Xavier121 13:31, 13 dic 2011 (CET)[rispondi]
Io invece non sono d'accordo per niente nè nel metodo (discussione di 5 minuti di una procedura utilizzata da anni) né nel merito: cosa vuol dire "di portare ad un più prudente 75% i pochi testi che saranno rimasti"? Se un testo senza djvu è stato riletto deve stare al 100%, se no al 75%, come da procedura, se li metti tutti al 75% allora non ha più senso nulla (Sennò vorrà dire che domattina qualcuno si sveglia e propone di portare tutto al 50%...).
I testi che stanno al 100% si trovano lì perchè qualcuno li ha riletti, e quel qualcuno lo si può trovare nella pagina di discussione nel template infotesto alla voce "rilettore".
Oppure si decide che i testi senza testo a fronte non possono stare al 100% e buona notte, basta esser chiari, anzi si potrebbe anche decidere che un testo senza DJVU va cancellato da wikisource. Però prima di fare questi cambiamenti radicali un minimo di discussione... e anzi io eviterei di ripetere le stesse discussioni periodicamente, sennò quà quelli come me che frequentano sporadicamente il progetto non ci capiscono più nulla, oltretutto che le pagine di aiuto non tengono certo il passo delle discussioni/rivoluzioni/cambiamenti. Scusate lo sfogo, ma io mio sono stufato di questo cambiamento continuo a cui è sottoposto il progetto, per cosa poi? Per aumentare la confusione e allontare i vecchi e nuovi contributori che non hanno il ritmo degli utenti più attivi come Candalua e Alex?
--Accurimbono (disc) 14:45, 13 dic 2011 (CET)[rispondi]
Mi pare che ne stiamo discutendo! :D Io sono per uniformare i NS quindi 4 icone e via ed. Wiki. ecc. Se si stabilisce la regola che nessun testo può arrivare al 100% senza scansione, va da sé che è retroattiva altrimenti si che si crea confusione!!! Tutti i testi sono riletti, anche quelli al 50% o 75%; non è che solo quelli a 100% sono PIU' riletti degli altri. Non vedo stravolgimenti ma solo aggiustamenti di tiro e coerenza: per me genera molta più confusione l'attuale sistema di salatura a due vie. --Xavier121 15:17, 13 dic 2011 (CET)[rispondi]
(conflittato) Calma. Prima di tutto qui nessuno ha ancora deciso niente, io ho solo detto quale sarebbe la mia idea a lungo termine. Prima di applicarla se ne può ovviamente discutere, come stiamo facendo. Il problema coi testi 100% è che non c'è assolutamente modo di essere sicuri che siano stati davvero riletti. Alcuni non hanno segnato il nome del rilettore, tanto per dire. Altri sono stati portati al 100% da utenti palesemente alle prime armi, che probabilmente non avevano ben chiaro il significato di 100%. Comunque l'intenzione mia sarebbe prima di rendere proofread più opere possibile, proprio per alzare in effetti la loro qualità portandole ad Edizioni Wikisource. La retrocessione al 75% sarebbe da fare solo per quelle poche opere per le quali non si trovasse proprio una scansione, che spero saranno alla fine poche decine, dunque una perdita che ritengo trascurabile a fronte di una maggiore chiarezza nell'indicazione della qualità e di una maggiore garanzia della stessa. Ci vorrà molto tempo per arrivare a ciò, quindi non è il caso di allarmarsi ora. Non stiamo ancora parlando di rinunciare del tutto ai testi non proofread, anzi non credo che a quello arriveremo mai... ma io in effetti comincerei col vietare di aggiungere nuovi testi alla categoria SAL 100%, cioè a considerare come rilettura valida solo quella fatta in modalità proofread (e in quanto tale facilmente riscontrabile). Candalùa (disc.) 15:28, 13 dic 2011 (CET)[rispondi]

Mi sembra che il dialogo si sia animato per bene e questo è un buon segno. Siccome però ritengo che una discussione di così ampio respiro richieda il suo tempo e la giusta ponderazione (Accurimbono ha correttamente fatto notare che stavamo partendo lancia in resta con fin troppa leggerezza) proporrei di spostare in Discussioni progetto:Qualità la discussione sul significato "filosofico" della proposta (il SAL Edizioni Wikisource aveva molta più importanza nell'era pre-proofread mentre oggi i rapporti con il SAL 100% sono perfettamente rovesciati: che conseguenze vogliamo trarne?); proporrei inoltre di aprire in Discussioni progetto:Trascrizioni una lista di opere SAL 100% di cui trovare buone edizioni digitalizzate, e concentrare in tale miniprogetto le dotte e importanti indicazioni di Xavier e di chi può dare indicazioni autorevoli ai scandagliatori di archivi online. Il risultato finale dovrebbe essere una presa di posizione condivisa sull'evoluzione del sistema attuale e una buona strada di lavoro per assegnare ai nostri mostri sacri delle valide versioni proofread. Che dite? - εΔω 15:43, 13 dic 2011 (CET)[rispondi]

Molto ignaviamente mi adeguo alla maggioranza, ditemi cosa devo o non devo fare. Se avete bisogno di qualcosa dal Gutenberg fatemi sapere. --Lagrande (disc.) 16:10, 13 dic 2011 (CET)[rispondi]
Ho iniziato a preparare una lista su Discussioni progetto:Trascrizioni. Chi se ne intende può iniziare ad aggiungere lì i link alle edizioni. Ovviamente vi raccomando fin d'ora di tenere la pagina in ordine :-), e se avete in mente un layout più leggibile modificate pure. Candalùa (disc.) 20:07, 13 dic 2011 (CET)[rispondi]
Ok, allora ne sto lontano. :-P
Scherzi a parte: ritengo molto importante la fonte OPAL, e vorrei "specializzarmi" su questi testi per vari motivi:
  1. le scansioni sono in genere molto buone, e sono assolutamente "fedeli" all'originale (scansioni originali a colori)
  2. le scansioni non sono mai state pubblicate altrove nè interpretate con OCR
  3. questi testi sono i più adatti per mettere alla prova FineReader 11, che è in grado di convertirli in djvu con strato OCR in un solo passaggio ("divisione" delle doppie pagine compresa).
Purtroppo, il tempo mi si è improvvisamente esaurito, e quindi aiuto per un aspetto: opera per opera, bisognerebbe confrontare fra di loro le varie versioni (Internet Archive, Gooogle, OPAL) e segnalarmi quelle opere OPAL che "vincono" lacompetizione con le altre. --Alex brollo (disc.) 20:21, 13 dic 2011 (CET)[rispondi]
Confermo: mi sono fatto un giretto per IA e per OPAL, e ho accertato che non sono la persona adatta per scegliere fra diverse edizioni. Chi mi conosce meglio sa che io di tutto avrei pensato di occuparmi, meno che di bibliologia e letteratura :-) ed infatti il mio interesse è in realtà un metainteresse. Lascio ad altri l'ingrato compito, mentre mi confermo disponibilissimo a fare la manovalanza. --Alex brollo (disc.) 22:36, 13 dic 2011 (CET)[rispondi]

(rientro a sx)Non mi sono ancora espresso ma vedo la cosa con grande favore. Ai tempi noi eravamo talmente avanti (:-P) da capire che la rilettura di un testo senza la fonte non aveva molto senso, in sè e per sè, e inventammo le Edizioni Wikisource. Il lavoro di conversione e semplificazione credo sia dunque necessario, anche perchè con Match and Split e altre divolerie brolliane secondo me possiamo migliorare di molto la situazione (già buona) delle nostre statistiche (numero di pagine corrette e pagine rilette, ratio fra pagine nude e con scan). Sui dubbi di Accurimbono: credo che se ci prendiamo un po' di tempo per scegliere le edizioni giuste (magari anche quelle già utilizzate), si faccia abbastanza in fretta a ripasasre tutto al 100%, e già avere tutto al 75% è un ottimo risultato. Aubrey McFato 09:51, 14 dic 2011 (CET)[rispondi]

E se ci organizzassiomo (elasticamente ma formalmente) in "gruppi specialistici"? Da questa discussione emerge, ad esempio, che alcuni di noi hanno le capacità e la passione per valutare e selezionare le fonti per qualità del testo; altri sono specializzati in diavolerie; altri sono attentissimi e capaci formattatori; altri sono vocati alla divulgazione. Non per precludere a nessuno alcuna attività, figuriamoci, ma solo per avere un "punto di riferimento". --Alex brollo (disc.) 10:07, 14 dic 2011 (CET)[rispondi]
Ragazzi, questa è la più bella discussione dell'anno, sento un fermento... :D --Xavier121 10:30, 14 dic 2011 (CET)[rispondi]
Io mi dichiaro attenta "revisora" e "rilettrice", poco addentro alle diavolerie, ma disponibile ad imparare tutto ... :) --Lagrande (disc.) 11:36, 14 dic 2011 (CET)[rispondi]
ma tu Lagrande, sai che razza di rivoluzione hai innestato, tanto tempo fa, con qualche accenno ai trucchi Gutemberg per aiutare gli utenti correggendo automaticamente gli "scannos" (che io per la prima volta ho sentito nominare da te)? Tutte le novità che trovi originano da quelle notizie! Quindi, anche "musa ispiratrice".... :-) --193.43.176.29 12:09, 14 dic 2011 (CET)[rispondi]