Wikisource:Bar/Archivio/2011.11

Da Wikisource.
Archivio delle discussioni del mese di novembre dell'anno 2011

Categoria: Archivio Bar 2011 Bar   Archivio    novembre 2011 



Novità RigaIntestazione e tramonto del tool RigaIntestazione[modifica]

Vi comunico che non serve più spostare RigaIntestazione nell'header; ho modificato il codice rendendolo implitamente noinclude (meglio: non visualizzato in ns0). Può quindi essere lasciato tranquillamente in cima al testo della pagina senza inconvenienti. Stessa cosa per il tl PieDipagina. Il trucco risolve anche alla radice il problema degli spazi eccessivi fra RigaIntestazione e inizio testo.

Datemi feedback per capire se ci sono inconvenienti che non ho previsto. Se la cosa funziona come spero, il tool RigaIntestazione del gruppo Strumenti per la rilettura (che sposta il template nel/dall'header) non serve più. --Alex brollo (disc.) 11:33, 31 ott 2011 (CET)[rispondi]

Io ho una domanda, che forse non centra molto: il Template {{PieDiPagina}} può essere reso più veloce da scrivere, ad esempio {{PDP}} o almeno tutto in minuscolo {{piedipagina}}? Samuele 12:08, 31 ott 2011 (CET)[rispondi]
Rispondo a entrambi:
Alex, la soluzione è pratica ma formalmente scorretta: lo spazio "header" è il posto "naturale" per le intestazioni. Io piuttosto propenderei per uno spostamento via Alebot dei limitati casi di posizione scorretta man mano che ricorrono.
Samuele, come è accaduto per {{RigaIntestazione}} che ha il suo alias nel template:Ri nulla impedisce di creare dei rinvii ad un template, purché questi periodicamente vengano orfanizzati (la cosa migliore sarebbe se anche questo venisse eseguito da un bot). - εΔω 12:56, 31 ott 2011 (CET)[rispondi]
PieDiPagina è già un redirect (a RigaIntestazione), se servono alias è bene trasformarlo in template vero per evitare doppi redirect. Quanto alle modifiche via bot, avrete notato che in questo periodo stiamo lavorando per eliminarne il maggior numero possibile, trasformandole in routine js; questo evita inutili appesantimenti della cronologia della pagina e dà un nostro (insignificante come quantità, ma "ecologicamente" importante come qualità) al carico di server e memorie di massa. Se lo facessero tutti i progetti, sarebbe bello! Gira invece l'idea che non sia un argomento da considerare.
Per lo spostamento di RigaIntestazione nell'header: OK, vedrò di appiccicare qualcosa al "postOCR automatico" js, o a un altro dei tanti script che scattano in upload, per spostare "al volo" il template nell'header. Sta il fatto che editare RigaIntestazione nell'header è molto scomodo, come tutti avranno notato: non funzionano nè la la toolbar nè i pulsanti. --Alex brollo (disc.) 14:31, 31 ott 2011 (CET)[rispondi]
Devo segnalare un altro errore che causa l'inserimento di RigaIntestazione nell'header. La differenza si nota tra questa e questa. Nella prima il template è inserito nell'header e vi è molto spazio tra l'Intestazione e il testo, nella seconda, è inserito nel testo ed è più vicino al testo, come dovrebbe infatti essere. Samuele 15:05, 31 ott 2011 (CET)[rispondi]
Mi blocco e non faccio niente, ma sottolineo che dal punto di vista del controllo della formattazione e anche dell'elaborazione i vantaggi che offrirebbe il fatto di mettere tutto, ma proprio tutto il nostro codice nella sezione testo, lasciando header e footer alla gestione automatica e "canonica" del software mediawiki, avrebbe dei vantaggi. Propongo che i due pareri (quello di Edo e quello che ho proposto) vengano discussi e che vengano soppesati tutti i pro e contro, sia dal punto di vista dell'utente normale, che dal punto di vista dell'utente anormale (come me ....) --Alex brollo (disc.) 11:00, 2 nov 2011 (CET)[rispondi]
Alla fine cosa è stato deciso?? Sto rileggendo "Il mio carso" e ho messo la "RigaIntestazione" nella sezione testo e adesso vedo che l'utente Vasco 73 li sta spostando tutti nell'header. Grazie e ciao Gimilzor (disc.) 19:15, 17 nov 2011 (CET)[rispondi]

Meno burocrazia per tutti![modifica]

Cari amici,

a partire dalla provocazione di Silvio Gallio, prevedendo che nel lungo periodo le pastoie burocratiche possano aumentare, ho importato da Pedia Wikisource:Ignora le regole.

Dato che purtroppo tale pilastro è fraintendibile e dato che il nostro lavoro è assai diverso da quello di Pedia, desidererei un lavoro di riformulazione comunitaria: la preoccupazione principale che ha richiesto questa importazione è il pericolo di "avvitamenti burocratici" o di cavillosità, mentre di fatto il lavoro molto strutturato di questo nostro progetto prevede una componente fisiologica di burocrazia; mi sono dunque trovato a disagio nel distinguere questo nella formulazione della pagina: chi voglia metterci mano è il benvenuto. - εΔω 09:45, 1 nov 2011 (CET)[rispondi]

Caro Edo, noto una sottile vendetta alla mia decisione di non usare il nick e utilizzare Source per i miei (bassi, bassissimi!) fini auto-propagandistici :P Per carità sospendi, a parte i motivi burocratici :), vorrei essere Silvio e basta. Grazie! (si risparmia anche qualche bit :P). E non c'è pericolo che "quell'altro" Silvio venga a dare una mano. In ogni caso (meno burocrazia!) ci penseremo se e quando. :PP
A parte questo per ora (ma mi tengo libero di farmi venire delle idee) l'unica cosa che mi viene in mente è di "contestare" la traduzione della citazione quando dice "...e torna al tuo lavoro". Così formulata, può essere interpretata in due modi (imho) :
  • "Vai avanti con i contributi che stai dando qui",
  • "Vai a farti un giretto dove ti danno da mangiare".
A memoria, è stata presa pari pari da 'Pedia (ma sono passati anni da che l'ho letta) e quindi, sia chiaro, non è certo una critica personale. Non solo! Mi dispiace perfino che ti senta a disagio! :D
Purtroppo le mie scelte terminologiche troppo spesso non corrispondono ai canoni di questa -per fortuna- quieta e sonnacchiosa biblioteca e potrebbero spaventare -non sia mai!- qualche utente novello. Quindi la riformulazione la lascio a voi. :P

Bye! --Silvio Gallio (disc.) 10:58, 1 nov 2011 (CET)[rispondi]

La nostra differenza con Pedia, da questo punto di vista, è radicale. Il pediano scrive un testo libero, noi abbiamo la fonte da rispettare. Purtroppo, da questa regola (che se ne trascina dietro parecchie altre, aimè, comprese le nostre avventure di formattazione e convenzioni di trascrizione) non sfuggiamo. Il vantaggio è che non possiamo litigare sui contenuti :-) --Alex brollo (disc.) 11:02, 2 nov 2011 (CET)[rispondi]
Ma per l'appunto, Alex: di per sé non avremmo bisogno di questa pagina per il nostro lavoro in ns0, ma si è resa necessaria nella vita comunitaria. Teoricamente, finché siamo in quattro gatti e ci troviamo cordialmente a scambiarci consigli per la biblioteca le rispettive questioni si discutono con pacatezza e si arriva a un consenso con tranquillità, ma ho notato con disagio che nel cercare di mettere i puntini sulle "i" nelle politiche comunitarie (gli ultimi dibattiti su admin-bot e inattività degli admin ne hanno mostrati i segni) lo sforzo di delimitare la lettera della legge apre il varco ad una deriva burocratica che può creare problemi (ho portato l'esempio dell'edit isolato di un admin assente un giorno prima della scadenza dell'anno di inattività). in caso di evidente tentativo di forzare le regole noi amministratori (e per le azioni comuni anche gli altri utenti) possono valutare se la fedeltà letterale alla regola sia un bene o un danno per il progetto e agire di conseguenza. Io di fatto tendo ad applicare questa regola nel momento in cui "chiudo un occhio" di fronte ad alcuni testi senza fonte per i quali la settimana canonica di attesa per una fonte si sta estendendo in maniera scandalosa: se un testo è palesemente fuori dal copyright e se un altro admin non lo segnala ritengo meno orrendo che qualcuno trovi una fonte piuttosto che cancellare di brutto. So di sbagliare ma lo faccio a fin di bene :D - εΔω 18:33, 2 nov 2011 (CET)[rispondi]
Caro Edo se, come credo di capire, temi di andare contro i "voleri" della comunità, per quanto mi riguarda sappi che hai tutto l'appoggio (per quello che vale). Ovviamente non posso parlare a nome di tutti ma credo che l'atteggiamento sia piuttosto generale. Certo, finora il gruppo è piccolo e compatto. Certo le cose possono cambiare. Ma credo che sia meglio essere vigili e interpellarci nel caso che succeda, senza fasciarci la classica testa prima dell'urto. Che, magari (magari!) non verrà mai. Però è giusto fare come i boyscout che stanno "parati" e possono reagire in fretta. Poi, se davvero ti serve supporto per le decisioni credo che basti dirlo. Come hai fatto finora, d'altra parte. Vorrà dire che - rompendo una mia abitudine- il mio supporto non sarà "Tacito" (Dedimus profecto grande patientiae documentum (Agr. 1.2) (:P) ma metterò anche il mio voto in chiaro. Finora non ce n'è stato bisogno. Vai così:) --Silvio Gallio (disc.) 18:57, 2 nov 2011 (CET)[rispondi]
Ho riformulato la traduzione e adesso dovrebbe essere inequivocabile.
Infine ho provato a dare un'occhiata alla cronologia della pagina di en.wiki: nel corso del 2005 la pagina è passata dalla proposta di cancellazione alla definizione di "essay" a quella di "Pillar": una carriera non indifferente. εΔω 19:03, 2 nov 2011 (CET)[rispondi]

Mi Cho'nToy[modifica]

Visto che tutti lamentano il problema del -non layer- di testo in DjvuToy ho pensato di scrivere all'amico in Mongolia Inferiore, quello che ha prodotto il singolare aggeggio. Ho fatto finta (benissimo e senza fatica!) di non aver capto un tubo del suo programma e la risposta è la seguente.

Sorry, you can't get text layer in "Maker" page of DjVuToy. To get text layer, you should use OCR function in "Hidden Text" page after you made DjVu. If you want, you also can export hidden text as XML, correct them, then import in DjVu. DjVuToy's OCR is based on MODI (Microsoft Office Document Imaging), that means, you must install MODI component of MS Office 2003 or 2007. For Office 2007, you must install SP1 or SP2, otherwise MODI is unusable.

Come si vede non è in cinese e quindi non la traduco. :P

Se ho "tempo" aggiornerò le "guide" (inverted commas). Ma mi sembra che non incontrino grossi favori quindi sarebbe lavoro inutile.

Spero che questo post serva a qualcuno/qualcosa perché io, a suo tempo, proprio questo avevo fatto: OCR col MODI dopo aver creato il djvu) ma non funzionommi :( . Bye! --Silvio Gallio (disc.) 13:59, 3 nov 2011 (CET)[rispondi]

...a Sirvioooo e qui tessbagli!!! :) le tue guide sono preziosissime (diffidato dall'abbandonare il lavoro!!!), mai avrei approfondito l'arcano djvutoy without you... Comunque, ho provato, tempo fa, ad inserire il layer ma non funzionava, certamente sbagliavo qualcosa, adesso riproverò con maggiore attenzione, spendendo qualche serata a capirci qualcosa con i componenti MODI. Non mi abbandonare! :( --Xavier121 19:00, 3 nov 2011 (CET)[rispondi]


BINGO! Dopo aver installato il coponente MODI l'ocr di djvutoy funziona perfettamente: test positivo con un centinaio di pagine prova, qualità medio-alta. Cerchio chiuso. A questo punto solo il tempo impedisce caricamenti di massa di qualsiasi cosa ci passa per la testa!!! Forse ho realizzato il nulla perché molti di voi già avevano risolto con questo sistema, però per me adesso, con gli script python di Alex e le funzioni di djvutoy, qualsiasi testo di OPAL non presenta difficoltà... :) --Xavier121 01:55, 5 nov 2011 (CET)[rispondi]

Proprio adesso che ho dei problemi col office! Vabbé Xavier, visto che hai capito, ti dispiacerebbe mettere per bene il procedimento nella guida? In questi giorni davvero ho poco tempo per cose complicate come il reset del computer. :( Silvio slogged)193.138.160.115 06:36, 5 nov 2011 (CET)[rispondi]

Esperimento 0[modifica]

Ho smanettato sul testo de Le Cento novelle antiche, anche conosciuto come Novellino, prima edizione a stampa del 1525 di Carlo Gualteruzzi. Il nostro programmino mi ha restituito un djvu di ottima qualità e un text layer fantastico. Ho usato una compressione conservativa con Photo (1 layer) qualità 100%: il file restitutito è delle stesse dimensioni del PDF di partenza (giocando con la qualità si puo ridurre la dimensione, ma il dubbio che possa inficiare l'OCR mi astiene da qualsiasi altro test). Ultima verifica: comportamento del M&S con l'edizione presente qui da noi. NOTA: il MODI di Office 2003 soffre l'OCR in italiano (non ho trovato un modo per inserire la nostra lingua, neanche con tutti i service pack 1-2-3). Con Office 2007 NESSUN PROBLEMA: consiglio questa versione per evitare frustranti lavori di configurazione. --Xavier121 01:20, 7 nov 2011 (CET)[rispondi]

Un pagina a caso... e un M&S liscio liscio, che ve ne pare? --Xavier121 22:31, 7 nov 2011 (CET)[rispondi]
Io sto battendo una strada diversa, da stasera (dovrei riuscire a sfruttare le coordinate per le linee di testo del djvu di IA infilandoci dentro le corrispondenti linee di testo interpretate dal mio FineReader); ma questa tua strada mi interessa parecchio. Tuttavia ho difficoltà a attivare MODI per Office 2007 (ha un Office pre-montato sul pc e la procedura di attivazione mi dà un errore). Posso scaricare MODI per Office 2007 da qualche sito? Che difficoltà si incontrano nell'installazione? --Alex brollo (disc.) 00:51, 8 nov 2011 (CET)[rispondi]
Dove era premontato un Office 2007 non c'è stato alcun problema, è bastato attivare il MODI dalla pagina di upgrade del programma stesso e indicare, al solito, il lancio del tool direttamente dal computer ecc. ecc. (cose che si capiscono facilmente quando si va in Rimuovi/Installa Applicazioni: ovviamente non bisogna rimuore ma solo attivare funzioni non considerate all'inizio). Più dificoltoso dove c'era una versione 2003: è spuntato un errore che non ho ben compreso, vista la tarda ora, e l'aggiornamento al 2007 è sfumato; questa sera ci riprovo e ti faccio sapere. Nel frattempo ci sarebbe bisogno di un tuo feedback in una discussione correlata più sotto :) --Xavier121 11:43, 8 nov 2011 (CET)[rispondi]
Nel frattempo, mi mandi/mi segnali un djvu con strato testo fatto da MODI + DjvuToy, che "lo smonto" per bene? :-) --Alex brollo (disc.) 11:57, 8 nov 2011 (CET)[rispondi]
Non serve! Ho attivato MODI per Office 2007 su una macchina che lo consentiva, ho lanciato l'OCR di djvutoy su un grosso file djvu... e velocissimamente ho ottenuto lo strato testo. Molto interessante! Lo strato testo è organizzato in linee di testo, niente male come dettaglio (i dettagli superiori, parole e carattere, non hanno utilità pratica per quello che voglio fare io :-) ). (alex slogged) --193.43.176.29 13:01, 8 nov 2011 (CET)[rispondi]

Mi sembra impossibile, nel mio office 2007 non c'è MODI! O, più probabile, non so come stanarlo da dove si è nascosto. Viene quindi buona la domanda di Alex più sopra! si trova da qualche parte? @ Xavier: Quando avete trovato il busillis per il layer di testo, fra te e Alex, ce lo spiegate anche a noi poveretti? Vi confesserò che a volte leggere questa pagina del Bar è piuttosto frustrante... :( Silvio Gallio (disc.) 13:54, 8 nov 2011 (CET)[rispondi]

Dice il proverbio: chi di djvutoy ferisce.... :-)
Allora, apri Pannello di controllo; Installazione Applicazioni; posizionati su Microsoft Office 2007. OK? Premi il pulsante "Cambia". Si apre un box dove devi scegliere "Aggiungi/Rimuovi caratteristiche". Continua. Si apre un elenco di cose: clicca "Strumenti di Office". Ci siamo quasi! Clicca Microsoft Office Document Imaging. A questo punto non posso più procedere passo-passo perchè io ho già installato, ma si tratta di attivare la voce "esegui da questo computer". parte un programma, dopo una attesa (piuttosto lunga) la cosa finisce lì. Chiudi tutto fino a Pannello di controllo compreso. Vai a Tutti i programmi, Microsoft Office, Strumenti di Office e dovresti vedere nell'elenco due novità: Microsoft Office Document Imaging e Scanning. Non serve che li apri: adesso djvuToy li troverà e li userà "in autonomia". devi però mettere "English" nelle "OCR options".
facile no? :-) --Alex brollo (disc.) 14:23, 8 nov 2011 (CET)[rispondi]
Adesso, io sono uno cui piace l'understatement. Non pensiate, però che sia completamente digiuno (peso oltre 100 kg) di cose informatiche. :P la copia di Office 2007 me l'ha passata w:Heinrich Schliemann. Indovinate dov'era... Ma il MODI me lo procuro fra un paio di giorni. Ppoi mi metto sotto con gli esperimenti. Ma devo proprio mollare tutto il resto accidenti. Non ho mica quattro mani e due vite parallele, io! Sono Silvio, non Plutarco!Silvio Gallio (disc.) 14:29, 12 nov 2011 (CET)[rispondi]

notizie da oldwikisource[modifica]

Sullo Scriptorium di oldwikisource [1] si trovano a volte discussioni interessanti che riguardano l'intero progetto Wikisource e la collaborazione tra le varie lingue. Il problema è che siamo sempre i soliti "four cats" a partecipare... ed è un vero peccato. Che ne pensate di rendere visibili anche qui da noi le 2-3 discussioni più recenti? Una roba tipo così, da mettere da qualche parte (il riquadro è appena abbozzato, eh... ci ho messo la barra di scorrimento giusto per non occupare troppo spazio):

Le ultime notizie dal Wikisource Multilingue

caricamento di oldwikisource:Wikisource:Scriptorium in corso...

Ovviamente è trascluso "in tempo reale" e non necessita di alcun aggiornamento qui da noi, solamente lato oldwikisource andrebbe modificato ogni tanto lo Scriptorium per escludere le discussioni troppo vecchie.

Che ne dite? Candalùa (disc.) 22:11, 3 nov 2011 (CET)[rispondi]

Sarebbe carino avere una pagina a parte, o una sezione vera e propria. Ma, domanda: da quando abbiamo la transclusione interwiki? credevo solo nel ns Pagina. Funziona anche con Wikipedia?! --Aubrey McFato 22:54, 3 nov 2011 (CET)[rispondi]

Sono anch'io ancora indeciso su dove starebbe meglio. Una pagina a parte temo non sarebbe più vista di quanto sia vista la pagina originale... La trasclusione interwiki non-nsPagina era uno dei segreti meglio custoditi fino a poco tempo fa, quando ho trovato per caso il template:Iwtrans e mi son messo a diffonderlo in giro per le source. Al momento funziona solo per Wikisource, ma senza dubbio si può allargare a Wikipedia. Perché, che cc'ha' 'n mente? Candalùa (disc.) 23:57, 3 nov 2011 (CET)[rispondi]

La transclusione interwiki è potenzialmente una delle cose migliori che potevano capitarci. Un sogno nelsoniano, in teoria. In pratica, non sarà facile. Credo però che sarebbe bello, ad esempio, che aforismi e frasi fossero sempre transclusi da Quote, e che citazioni dei testi fossero sempre tranclusi da noi. pensa a quante poesie potrebbero stare su pedia, transcluse da noi, con il commento. O su Wikibook e Wikiversity, per esempio. Noi potremmo transcludere dei dati singoli (si arriverà a Wikidata in un paio di anni), magari le biografie. Con template ad hoc, cercando di non ammazzare i server, possono farsi un sacco di cose belle, secondo me. (scherzi a parte, qualcuno si ricorda di w:Ted Nelson)? Aubrey McFato 00:09, 4 nov 2011 (CET)[rispondi]
Restando al topic, visto che sono "notizie", suggerirei di transcludere nel Wikisourciano. E di linkare nella pagina principale o la bar. (bella la pagina che si accorcia). :) Bye! --Silvio Gallio (disc.) 08:04, 4 nov 2011 (CET):[rispondi]
Giusto stamattina pensavo al fatto che se esiste il template IwPage, che è transclusione interwiki, doveva pure esistere un sistema di generalizzare la cosa.... va bè, l'argomento è affascinante ma non ci perdo tempo perchè altrimenti la lista delle mie "cose da fare". che è già troppo lunga, si allunga ancora. :-) --Alex brollo (disc.) 09:55, 4 nov 2011 (CET)[rispondi]
BUG: Bill Gates ci vuole male: su IE per Window$ si vede il riquadro, l'intestazione, un [page] ma per il tresto un gran riquadro bianco... εΔω sloggato 14:52, 4 nov 2011 (CET)[rispondi]

SBUG! "a me" Bill mi vuole bene, allora! Vedo tutto normale (un po meno bello che su Chrome (Seven, Crome, IE Ultimo (credo)) (Silvio sloggato per usare IE) 151.41.147.215 15:33, 4 nov 2011 (CET) Ritorno :) Silvio Gallio (disc.) 15:35, 4 nov 2011 (CET)[rispondi]

Su ie8 si vede tutto. Che versione usi, Magister? Candalùa (disc.) 15:48, 4 nov 2011 (CET)[rispondi]
Con IE 6 oltre che vedere il box bello bianco il logo wikisource si piazza al centro della pagina e lì sta immobile, grazie al trucco di "bloccarlo" in alto a sinistra.... Non ci sono nemmeno i pulsanti di base, figuriamoci quelli personalizzati... occorrerà scriverlo da qualche parte, che è incompatibile con wikisource. :-(
Mica sempre e mica dappertuto è facile fare un upgrade di IE.... :-( ma sempre e dappertutto si può utilizzare un buon browser versione portable :-) Alex brollo (disc.) 19:01, 4 nov 2011 (CET)[rispondi]
IE6 è incompatibile con buona parte del mondo, direi che per noi è un non-problema :-) Candalùa (disc.) 19:51, 4 nov 2011 (CET)[rispondi]
Uhm forse è un semiproblema! Sto usando un computer che non dovrei qui c'è xp e I.E.7 (e non 6). Si vede un quadro bianco esattamente come quello descritto da Edo :( Fatevobis... :) (sempre io...)193.138.160.115 06:43, 5 nov 2011 (CET)[rispondi]

Dunque: dopo aver perso un paio d'ore di sonno, sono giunto alle seguenti conclusioni:

  • sulle altre pagine la trasclusione funziona anche su ie7, quindi il problema non è la trasclusione
  • su questa pagina il mancato funzionamento è scatenato da #Impariamo_il_triestino che contiene un <pages; togliendolo tutto funziona
  • effettivamente andando su [[2]] con ie7 mi compare un bel "Proprietà o metodo non supportati per l'oggetto"
  • su pagine non del dizionario funziona tutto bene anche su ie7
  • la pagina del dizionario su chrome e firefox non segnala errori

Ergo, domando ad Alex: cosa c'è in MediaWiki:Common.js che funziona diversamente dal solito sulle pagine del dizionario? forse la storia delle section con la @? Candalùa (disc.) 01:35, 6 nov 2011 (CET)[rispondi]

Come ti ho notificato, le modifiche che ho fatto in Commons riguardano il meccanismo di aggiunta del "SAL pagina":
se esistono section, la lista completa viene depurata da:
  1. doppioni
  2. tag section con carattere @ all'interno. Può essere che si tratti di un carattere sfortunato, che scatena qualcosa? Potrei provare a sostituirlo con qualcos'altro, magari un prefisso più "normale". Forse basterebbe un punto a inizio parola. Provo. --Alex brollo (disc.) 20:40, 6 nov 2011 (CET)[rispondi]

Boh, francamente non saprei neanch'io, ad occhio mi sembra impossibile che non funzioni... comunque prova, non si sa mai Candalùa (disc.) 23:49, 6 nov 2011 (CET)[rispondi]

Provo a sostituire il @ con un no. (@abaco->no.abaco) in pagina 16. --Alex brollo (disc.) 06:23, 7 nov 2011 (CET)[rispondi]

Quiz sul dialetto triestino[modifica]

In Indice:Dizionario triestino (1890).djvu sono elencati circa 13400 lemmi. In che percentuale questi lemmi sono esclusivi del dialetto, ossia: non sono reperibili in un dizionario italiano, come it-IT.dic (quello usato da Mozilla)? --Alex brollo (disc.) 22:31, 4 nov 2011 (CET)[rispondi]

Unicode copia e incolla[modifica]

Ci può interessare? --Aubrey McFato 13:01, 5 nov 2011 (CET)[rispondi]

Dati, template, scripts ecc. specifici per opera[modifica]

Ho la sensazione che la questione sia affascinante ma complessa.... più adatta a Bar tecnico. "Clono" là il mio intervento e propongo di continuare là le elucubrazioni. --Alex brollo (disc.) 09:23, 7 nov 2011 (CET)[rispondi]

Test bug di Dizionario[modifica]

Ho sostituito in pag 16 tutti i @ con un prefisso no. e ho modificato il tl DtLemma. La transclusione funziona:

  • sm. abbaco, abaco, libréttine — „Impara l’abbaco.“ ― „È alle libréttine.“ (vedi)

ma... il bug persiste sotto IE7. (alex sloggato) 79.51.236.233 06:36, 7 nov 2011 (CET)[rispondi]

Facendo puntare il pages su una diversa pagina di Dizionario (pag 6), che ha un codice "normale", il bug sparisce. Quindi: dipende da qualcosa che c'è nelle pagine di Dizionario con lemmi, ma sembra che non sia il carattere @, che non c'è nè in pagina 6, nè in pagina 16. Cerco di riprodurre il bug in pagina delle prove. --79.51.236.233 06:43, 7 nov 2011 (CET)[rispondi]
Il bug è riprodotto in Wikisource:Pagina delle prove. Ma si scatena solo con la pagina 16; transcludendo la pag. 17 tutto fila lissio.... Cosa c'è nella pagina 16 che non c'è nella pagina 17 (il carattere @ non c'entra)? Rollbacko le mie modifiche a pag. 16 e a DtLemma. --Alex brollo (disc.) 07:01, 7 nov 2011 (CET)[rispondi]
Il problema sta nel lemma A. Mascherato il lemma A, il bug non si riproduce.
Il problema sta nel codice {{lemma|A}}. Trasformandolo in {{lemma|Aaa|A}} il bug non si riproduce. Devo ancora capire perchè esattamente, ma siamo sulla strada buona....in realtà, avevo un certo disagio con i lemmi brevissimi, qualcosa mi diceva che la cosa era delicatuccia (non saprei dirvi perchè ma ricordo questa sensazione). Per questo sono andato quasi "a colpo sicuro". --Alex brollo (disc.) 07:30, 7 nov 2011 (CET)[rispondi]

Testo modificatore[modifica]

ciao, Mi chiedevo se uno dei vostri utenti saavy tecnologia potrebbe aiutare me impliment il testo in formato modificatore trovato sulle tue pagine. A es.ws, (Espanol Wikisource) ci piace, e potrebbe sicuramente beneficiare di averlo. C'è una sola stipula, però, ci piacerebbe che fosse visto sotto "Opzioni di visualizzazione" nella colonna più a sinistra rispetto alla lenti flottanti, che interrompono alcuni del nostro testo (non usiamo "prosa" Pagine di classe con margini su ogni lato in genere. c'è qualche anima gentile che è disposto ad aiutare un impliment amatoriale techie questo?

Stavamo pensando a qualcosa del tipo:

Testo: Grande Piccolo

o

testo: grandi dimensioni dimensioni più piccole

Si prega di tornare a me! grazie - Theornamentalist (disc.) 22:58, 7 nov 2011 (CET)[rispondi]

Fonte: Biblioteca italiana?[modifica]

Casualmente, nel fare alcuni esperimenti con djvutoy, mi sono imbattuto in una edizione del Novellino, presente sul nostro progetto, ma senza più una fonte verificabile. Non so se capita solo a me, ma io non riesco più a collegarmi al sito della Biblioteca italiana. Poiché ho lavorato qualche sera su questa prestigiosa edizione delle Cento novelle antiche, che, curata da Tosi e pubblicata nel 1825, ripropone, con note, il testo della prima edizione a stampa del Gualteruzzi, amico del Bembo, che cosa ne pensate se M&Splitto tutto e recupero un testo di altissima qualità? Attendo pareri. --Xavier121 13:46, 8 nov 2011 (CET)[rispondi]

Confermo Biblioteca Italiana è irraggiungibile anche per me. In più ho grossi problemi anche con Emeroteca Braidense quando provo a fare delle ricerche "via Google". Essenziali se non ricordi la testata esatta, il fascicolo esatto, la pagina esatta. Tristezza. Quanto al Novellino, sei fra i maggiori esperti locali perché chiedi l'approvazione di noi comuni mortali? :) Vai Vai| --Silvio Gallio (disc.) 14:30, 8 nov 2011 (CET)[rispondi]

Tesi sulla FAO[modifica]

Lo scorso maggio avevo segnalato un bel lavoro sulla FAO premiato dall'università di Roma nella sezione tesi e lavori scientifici. Ora OTRS ha rilasciato il Ticket Si può procedere a metterla su wikisource?93.34.62.46 16:08, 8 nov 2011 (CET) ero sloggatoMizar (ζ Ursae Maioris) (disc.) 16:12, 8 nov 2011 (CET)[rispondi]

Ciao Mizar. Per l'inserimento "fisico" non ci sono problemi, credo. Io stesso ho caricato qualche mio povero prodotto. Basta creare il testo al solito modo e inserire l'OTRS nella "Discussione" (Esempio).
Qualche problema potrebbe venire dal proofreading. Poche settimane fa ho avuto un interessante scambio di opinioni con Marcok (su 'Pedia) relativamente all'inserimento di tesi in Commons. (Pare che le linee guida del sito "sorello" siano piuttosto strane). Più di così non so. Bye! --Silvio Gallio (disc.) 18:47, 8 nov 2011 (CET)[rispondi]
Se Commons fa storie, allora carico, almeno per il momento, solo il testo. Poi se ci saranno i chiarimenti, mi accingerò al proofreading in cui sono particolarmente principiante.--Mizar (ζ Ursae Maioris) (disc.) 11:32, 9 nov 2011 (CET)[rispondi]
Chiarimenti? In Kommons? bwwwwhhhhhihihihihi ehm! --Silvio Gallio (disc.) 22:14, 9 nov 2011 (CET)[rispondi]

Il primo file DjvuSource :-)[modifica]

Mi è riuscito di far caricare il codice sorgente wiki delle pagine pagina nello strato testo di un file djvu. Una vecchia idea, non so bene a cosa potrebbe servire, ma la cosa mi piace. :-)

Prossimo obiettivo, caricare non il codice wiki, ma il codice html; qui la cosa si fa interessante, perchè una volta che il file djvu avesse al suo interno la rappresentazione formattata html del testo, allora si potrebbe pensare a un visualizzatore che - anche fuori di wiki - presenti fianco a fianco l'immagine della pagina e il suo contenuto formattato e "iperlinkato". Per ora mi accontento di un file DjvuSource, con le immagini djvu e il testo source.

Il primo DjvuSource è il file djvu collegato a Indice:Sulla reciproca influenza della libertà politica e dell'industria mecanica dei popoli.djvu. --Alex brollo (disc.) 23:44, 9 nov 2011 (CET)[rispondi]

Il secondo (e per ora basta) è File:Georgiche.djvu. Per ora, la cosa è pressochè inutile, un puro (ma utile) esercizio di manipolazione e di "stressaggio" degli strati testo.
Per vedere "l'effetto che fa" ho chiesto ospitalità a candalua su vec.source; c'è là un vec:Indice:Georgiche.djvu, provate ad aprire una nuova pagina (ma evitate di salvare, perchè il file e i file Pagina andranno cancellati a fine test, meno facciamo lavorare i sysop di vec e più immagino saranno contenti)--Alex brollo (disc.) 08:56, 10 nov 2011 (CET)[rispondi]

Atto di nascita di Michelangelo[modifica]

Sto dando una mano a Utente:Theornamentalist su es.source, e in cambio lui mi ha segnalato questa chicca: l'atto di nascita (originale, da quel che sembra) di Michelangelo, ovvero michelagnolo buonaroti. Chi di voi mi aiuta a decifrare la calligrafia dell'epoca? Lo trovate qua: Pagina:Atto di nascita Michelangelo.jpg. Candalùa (disc.) 00:48, 12 nov 2011 (CET)[rispondi]

Aggiunti piccoli suggerimenti (da vagliare da esperti) trovato altro materiale (vedi discussione) ;) --Silvio Gallio (disc.) 11:16, 12 nov 2011 (CET)[rispondi]
Sfrutto l'occasione perchè ho avuto un problema analogo: che si fa quando si ha un jpg di una pagina e si vuole caricare su source? Usiamo il ns Pagina e va bene, ma evitiamo il ns Indice? Purtroppo, essendo in jpg e non in djvu non su può usare il tag pagelist... Di casi simili ce ne possono essere a bizzeffe, pensate a tutti i manifesti, atti, avvisi antichi che si trovano, e da poco hanno aperto l'Archivio Pensa su Commons... --Aubrey McFato 12:23, 12 nov 2011 (CET)[rispondi]
Perchè non riunire varie pagine singole in una collezione-indice (separandole poi, come si vuole, in ns0)? --Alex brollo (disc.) 03:15, 13 nov 2011 (CET)[rispondi]
Dal basso della mia incompetenza; ma è proprio obbligatorio che nella pagina Indice si sia un djvu o pdf? Chiaro che non avendo un layer di testo i jpeg o tif ecc non possono generare il testo nascosto. Ma in questi casi di testi brevi e perfino scritti "a mano" non è possibile creare il file in NS0 e collegarlo poi? Sono perplesso ma esco dal turno di notte e non vorrei creare dei pasticci con le prove. Non oggi. Bye!--Silvio Gallio (disc.) 14:19, 12 nov 2011 (CET). Inoltre sembra che il buon Xavier sia riuscito (v. sopra) a generare un layer usando il Toy.Trasformando il jpeg in djvu e unendo il layer, il pagelist dovrebbe funzionare... o no?[rispondi]
Mi dispiace, io sto usando un traduttore.
Certamente possibile utilizzare un file. Jpg per creare un indice, ma non usare la funzione pglist (vedi qui)
Se lo fai convertirlo in formato pdf o djvu, funzionerà da usare pglist, tuttavia, se si tratta di una singola pagina, esso non hanno la capacità di tornare al file di indice dalla pagina, una soluzione è quello di creare un separato pagina vuota come una seconda pagina. Per tutto questo lavoro extra, ho solo utilizzano in genere l'. Formato jpg. Spero che questo aiuti!
Inoltre, se ci sono gli altoparlanti bilingue italiano / spagnolo, qualcuno potrebbe venire a tradurlo in es.ws? - Theornamentalist (disc.) 15:27, 12 nov 2011 (CET)[rispondi]
Vi sarete accorti che con pazienza ho eliminato ogni libro fatto di collezioni di jpg.... non reinfilatemeli per carità! E, se potete, evitate anche i pdf. Il djvu dovrebbe diventare il nostro standard: il layer di testo è una cosa che suppongo diventerà importante! Se i jpg a pagina unica sono pochi mi offro io di fare la conversione e di aggiungere la pagina vuota (grazie Theornamentalist per il suggerimento!!). Ottimo anche caricare il testo su ns0 come primo passo. Basta che mi mandiate un messaggio in pagina discussione (se caricate su Commons il jpg, con un bel template Information, template e categorie, mi agevolate parecchio il lavoro!) --Alex brollo (disc.) 02:49, 13 nov 2011 (CET)[rispondi]
Eccolo: File:Atto di nascita Michelangelo.djvu; Indice:Atto di nascita Michelangelo.djvu.

Suggerirei di trascrivere fedelmente (anche le abbreviazioni) espandendole invece in ns0 con largo uso del tl|Pt. Non so come compilare vari campi dell'Indice nel caso di manoscritti... :-( --Alex brollo (disc.) 03:07, 13 nov 2011 (CET)[rispondi]

Hai ragione, Alex: ho spostato a Pagina:Atto di nascita Michelangelo.djvu/1. Se hai tempo e voglia, qui all'inizio della lista ci sono alcune altre pagine che usano una singola .jpg che si potrebbe convertire in un .djvu di una singola pagina. Candalùa (disc.) 10:07, 14 nov 2011 (CET)[rispondi]

Per il bug della pagina singola che non genera la freccia verso l'Indice, c'è il bug 30725 che contiene già la soluzione. Metteteci il vostro voto, così magari ce lo sistemano. Candalùa (disc.) 10:15, 14 nov 2011 (CET)[rispondi]
Perchè non creare Indice:Archivio Pensa.djvu con l'intera collezione dei file di testi contenuta in Commons? Eviteremmo di creare pagine singole... --Alex brollo (disc.) 11:20, 14 nov 2011 (CET)[rispondi]

Nuova pagina doc: Progetto:Trascrizioni/Routine DjvuLibre[modifica]

Mi sono deciso, ormai parecchi utenti girano attorno allo strato testo dei file djvu e una pagina di doc è opportuna. Anzi, due:

In entrambe ho messo una sezione Utenti interessati; annotate il vostro nick, se lo siete, e siate spietati nella richiesta di chiarimenti (in pagina di discussione). La prima pagina vorrebbe essere "per tutti"; la seconda è rivolta prevalentemente a chi mastica python, ma anche a chi non lo mastica, tanto per sapere "cosa bolle in pentola". --Alex brollo (disc.) 10:51, 14 nov 2011 (CET)[rispondi]

Siccome nel mentre che si insegna, in realtà si impara, vi comunico che ho scovato un sito che mette online magnifici djvu dotati di metadati: http://nips.djvuzone.org/. Adesso possiamo procedere! --Alex brollo (disc.) 13:45, 15 nov 2011 (CET)[rispondi]

Dimensioni leggibili[modifica]

Mi scuso per la mia scarsa presenza da qualche tempo. Mala tempora currunt.

Vorrei rapidamente sottoporre un problemino che mi è sorto e che, immagino, possa essere di comune interesse. O forse è già stato trattato millanta volte; nel qual caso un link e un buffetto saranno sufficienti.

Qualche giorno fa mi sono imbattuto in un testo (ebbene si, ferroviario) presente in una pagina di giornale. Abbiamo presente le (enormi) dimensioni di una antico foglio di giornale e dei (microscopici) caratteri ivi stampati?

Problema di proofreading:

  • Se inserisco la pagina intera il testo è troppo piccolo e quindi illeggibile o quasi.

Posso rendere tutto leggibile se spezzo le colonne del testo in quattro o più parti - in relazione alle necessità. Ma allora:

  • creo un "falso" in cui le pagine sono del tutto artificiali.

Nel mio disco rigido ho "risolto" con cinque file "pagina"; il primo con il foglio di giornale intero e gli altri quattro con pezzi delle colonne ingranditi abbastanza da renderli proofleggibili.

Può andare bene come "soluzione"?

È una problema già trattato?

SI / NO / :)

Se si, qual è la soluzione? Grazie. --Silvio Gallio (disc.) 16:24, 14 nov 2011 (CET)[rispondi]

Facciamo come fanno su en.source o su fr.source. Come fanno? Boh? Chi va a dare un'occhiata? :-) --79.45.239.151 17:19, 14 nov 2011 (CET)[rispondi]
http://en.wikisource.org/wiki/Page:The_New_York_Times,_1901-08-01.djvu/1
No buono, l'immagine è "per finta", totalmente illeggibile. --Alex brollo (disc.) 17:26, 14 nov 2011 (CET)[rispondi]

Io direi che può andar bene la soluzione che hai prospettato, nella prima pagina il foglio intero, nelle successive i vari settori del foglio ingranditi, un po' come le carte geografiche con il "quadro d'unione" all'inizio e su ogni pagina un settore del quadro. Candalùa (disc.) 12:32, 15 nov 2011 (CET)[rispondi]

Volendo esagerare, si potrebbe costruire un'immagine jpg "mappata" e linkare le singole pagine sulle aree corrispondenti alla loro "regione"; il punto ideale per inserire questa cosa avventurosa direi che potrebbe essere il campo Sommario dell'Indice.

Quindi animo Silvio! Procedi con lo sminuzzamento e il montaggio dei frammenti su un bel djvu.. all'immagine mappata ghe pensi mi. :-) --Alex brollo (disc.) 12:51, 15 nov 2011 (CET)[rispondi]

N.B. su commons le immagini accettano delle "annotazioni" con wikicodice, dunque ogni "frammento" su commons potrà essere collegato agli altri. - εΔω 17:26, 15 nov 2011 (CET)[rispondi]

OK, un paio di giorni e arriva. Bye! Silvio Gallio (disc.) 21:48, 15 nov 2011 (CET)[rispondi]

Orpo... la nota di Edo è oscura anche per me. In ogni caso non dovrebbero esserci, su Commons, immagini multiple, o meglio: dovrebbe esserci una immagine jpg "a piena pagina", e un file djvu contenente un frammento per pagina; nient'altro. Questi due file vanno, effettivamente, collegati fra loro. --Alex brollo (disc.) 22:47, 15 nov 2011 (CET)[rispondi]

Mannaggia. Capito tubo uno! Allora, come le devo confezionare 'ste pagine? Io al momento ho UNA pagina tipo giornale con due colonne -nemmeno intere- scritte e due sbiancate (il pezzo è piuttosto corto). Ingrandito ne ho tratto quattro file (due per ogni colonna). Non ho capito come li devo caricare. CINQUE file.djvu (che posso trasformare in altro formato) diversi ognuno col suo bravo nome (articolo.djvu, articolo1.djvu, articolo2.djvu ecc.) che poi i solito mago elabora e attacca, due file (sotto e sopra), UN file djvu come se fosse un libretto? altro? Attendo fuori linea :P Silvio Gallio (disc.) 16:11, 16 nov 2011 (CET)[rispondi]

Sicuramente un unico file djvu, con 5 pagine: la paginona + i 4 ingrandimenti. Poi, se ho ben capito, Alex prenderebbe la pagina 1 del djvu e ne farebbe una jpg su cui sarebbero mappate le altre 4 pagine. Ma questa è una cosa in più, assolutamente non indispensabile. Tu intanto carica pure il djvu Candalùa (disc.) 17:56, 16 nov 2011 (CET)[rispondi]
Fatto; purtroppo l'OCR non mi funziona. Con calma inserirò anche il testo in NS0. Quelli bravi facciano quello che possono grazie. Silvio Gallio (disc.) 18:59, 16 nov 2011 (CET)[rispondi]
Ottimissimo Silvio! Devo dire che io sono più di bocca buona, mi sembra leggibile anche il "paginone", ma è una bella occasione di sperimentare qualcosa di nuovo. per vedere una pagina veramente illeggibile, ripeto il linketto a en.source: qui :-)
Per l'OCR e tutto il resto degli sperimenti, ghe pensi mi (sempre che qualcuno non mi anticipi: nel caso, non mi offendo....). --Alex brollo (disc.) 10:42, 17 nov 2011 (CET)[rispondi]
Uffa, l'immagine mappata confligge con qualcosa dei template della pagina Indice. L'ho allora ficcata in pag. 1, dentro un tl Pt, date un'occhiata. Test eh.... accetto pomodori. --Alex brollo (disc.) 11:56, 17 nov 2011 (CET)[rispondi]
Ogni tanto mando i miei saluti a John Vandenberg; l'ho fatto ancora, segnalandogli il trucco della jpg mappata, e buttando là una frase sul fatto che stiamo "semantizzando senza semantic wiki". Se la cosa lo interesserà, avrò bisogno di aiuto per spiegargli i vari trucchi semantizzanti....--Alex brollo (disc.) 11:43, 18 nov 2011 (CET)[rispondi]
Una variante del problema la trovate qui. Ho continuato col Rimorchiatore del buon Dietz ma anche qui il testo è problematico (meno). Un'altra soluzione, in questo caso poteva essere il tagliare una parte dell'immagine (da un tropico all'altro) per concentrare l'altezza. Ovvio che la soluzione Alex è la più elegante in assoluto. Questo post era per chiedere se sia accettabile una soluzione cruenta in termini di dimensioni della pagina. (Io propendo per il no). Infine Se qualcuno bravo vuole mettere a posto i miei pasticci con i nomi dei file... :-( (non mi ero accorto del puntino in fondo al tiutolo) Scusate tanto. --Silvio Gallio (disc.) 16:54, 20 nov 2011 (CET)[rispondi]
Un dubbio. A questo punto, visto che possiamo fare una "estrazione mirata" del testo che ci interessa, non vi pare che sarebbe meglio lasciare intatta la pagina originale, usata come "quadro di insieme"? Mi sembra che potrebbe essere un gesto di "rispetto della fonte". Inoltre, Silvio mi ha manfestato un certo entusiasmo per la mia idea delle "immagini mappate", ma prima di procedere vorrei sentire qualche altra opinione. Ho scritto poche righe di aiuto in Aiuto:Immagini mappate. --Alex brollo (disc.) 18:29, 20 nov 2011 (CET)[rispondi]

No, per me no. Ci ho pensato molto qualche tempo fa quando mi è successo di scegliere se togliere o meno alcuni pezzi di testo. Sono arrivato alla (sempre più modestissima) conclusione che la pulizia della pagina, in caso di opere a molte mani che sullo stesso ripiano mostrano a volte molti articoletti e trafiletti, va fatta, anche se non obbligatoria. Non è questione di mancanza di rispetto ma di evidenziazione del topic. Esempio banale questa stessa pagina alla fine dell'articolo che ho lasciato, porta un intero trafiletto e l'inizio di un altro articolo. Il trafiletto è completo e per di più parla di alcune statistiche relative alla strada di San Germano. Eppure l'ho tolto. Per evidenziare l'altro. Solo per quello. Dovessimo decidere che le statistiche del 1836, relative al traffico della ferrovia Paris-Saint Germain en Laye, interessano a qualcuno siamo sempre in tempo a ripetere l'operazione. Diverso (sempre secondo la suddetta conclusione) sarebbe un intero giornale con il quale si può "giocare" a spezzettarlo e mapparlo. Però lo devi fare "tutto"! Poi, come sempre mi adeguo. Ma obtorto collo :) bye!Silvio Gallio (disc.) 20:11, 20 nov 2011 (CET)[rispondi]

Uhm, dopo aver salvato mi è venuto (strano) un pensiero. Sempre non obbligatorio, sarebbe possibile evidenziare solo il testo interessato ma senza cancellare tutto il resto. Pensavo a un ingrigimento del testo NON interessato. Più o meno come i tasti dei programmi che usiamo che diventano neri quando sono attivi e grigi quando "che" no. Adesso grattiamoci coralmente la pera. :P Silvio Gallio (disc.) 20:15, 20 nov 2011 (CET)[rispondi]

Sono passato al test: sempre in compagnia dell'amico Dietz, "meccanico alemanno" ho prodotto questa pagina spero così salvando i capri dei Alex e la cavola di Silvio. Spero che qualcuno si degni di esprimere un'opinione "a grandi linee". Bye!Silvio Gallio (disc.) 10:57, 21 nov 2011 (CET)[rispondi]
Più ci penso più mi intrufolo nell'idea che la soluzione grafica sia questa. Osservare prego la prima e l'ultima pagina diquesto novello pezzo di Cattaneo. A parte l'ennesimo errore nel nome del file (già in Commons...). Pietà! Silvio Gallio (disc.) 18:35, 21 nov 2011 (CET)[rispondi]

Sul computer di chi scrive havvi un file (.pdf) con le quattro povesie presenti nel testo in questione.

Che fo?

  1. Carico direttamente il file così come sta
  2.  Trovo chi vuole convertirlo in .djvu
  3. Lo metto su archive, così il djvu lo fanno loro

Il file è scaricabile qui: http://www.morino.it/download/

--Carlo M. (a.k.a. zi' Carlo) (disc.) 19:36, 14 nov 2011 (CET)[rispondi]

Per stavolta, ma SOLO per stavolta, te l'ho convertito io (ho usato pdf2djvu, per i curiosi): File:Li quattro mejo fichi der bigonzo.djvu. Però se c'hai anche i dati dell'edizione dovresti andare a scriverli su Commons. Domandina: queste so' le pagine da 47 a 50... non è che c'avresti pure il resto del libro? Candalùa (disc.) 21:04, 14 nov 2011 (CET)[rispondi]

SI e NO. SI nel senso che è sul mio tavolo. NON perché non c'è per caso.

Di più: a breve è il centenario della morte (13 dicembre 1911) mentre l'altr'anno è stato il 150nario della nascita. Ci sono state diverse manifestazioni (culturali), perché Zanazzo oltre a poeta è stato grande studioso delle tradizioni popolari romane e laziali. Quindi, visto che ho alcuni testi inizierò a "scannare" quelli che non sono disponibili in rete. Spero che poi ci sia un aiutino da parte di altri nelle fasi successive. Comincerò dalle altre pagine di questo volume. --Carlo M. (a.k.a. zi' Carlo) (disc.) 10:17, 15 nov 2011 (CET)[rispondi]

Risolto il Silvio's Bug[modifica]

Grazie a Nemo, che ha "aperto un bug" specifico, e dopo qualche insistenza (non molte!), il "bug della pagina 192" del libro di Piola è risolto.

L'ha beccato Bawolff che ha messo in lista bugzilla il seguente messaggio: "Appears to be fixed by fix of bug 31680. Marking dupe." Potete visualizzare la risoluzione del bug vedendo Pagina:Delle strade ferrate e della loro futura influenza in Europa.djvu/206, dove compariva ostinatamente l'immagine della pagina 194 invece che quella della pagina 192.

In pratica, avveniva che vecchie immagini di versioni precedenti di un file djvu persistevano ostinatamente in visualizzazione, mentre in modifica compariva l'immagine giusta; il che creava grande confusione, e grandissimo scoraggiamento di Silvio, oltre che incoraggiare tentativi di correzione che risultavano in un grave peggioramento della già notevole confusione di pagine. Grazie ancora quindi a Nemo, che ha preso a cuore la questione, e a Bawolff, che ha risolto il bug (che datava da molti mesi ma che negli ultimi tempi si era incattivito). --Alex brollo (disc.) 10:34, 17 nov 2011 (CET)[rispondi]

Sembrerebbe di si. con I.E, che non uso quasi mai, in effetti, la situazione pare normalizzata le due pagine 192 e 194 vanno di lusso.. In Chrome no. La 192 mostra la 1984 e la 194 non si vede proprio. Sto pulendo al massimo ma al momento sono ancora lì :( Cosa si deve fare per pulire davvero la cache di Chrome? Silvio Gallio (disc.) 17:38, 17 nov 2011 (CET)[rispondi]

Ma alla fine il RigaIntestazione va nella sezione testo o nell'header???[modifica]

Ciao a tutti!!! Vorrei che mi chiariste dove mettere l'ormai famoso "RigaIntestazione"!!!! Teso o header? Sto rileggendo "Il mio Carso" e l'ho messo nel testo; ora vedo che l'utente Vasco73 me li sta spostando tutti nel header. Vanno bene entrambi? Grazie a tutti Ciao Gimilzor (disc.) 23:08, 17 nov 2011 (CET)[rispondi]

Va messo nell'header, posto apposito per l'intestazione della pagina.--Barbaforcuta (disc.) 01:23, 18 nov 2011 (CET)[rispondi]
Confermo (anche se vorrei riparlarne... ma per ora il suo posto è nell'header). Se attivate il gadget "Strumenti per la rilettura", un modo rapido per spostarla al suo posto è la usare la funzione postOCR (che la sposta in header e ce la lascia) oppure RigaIntestazione (che la sposta alternativamente dall'header al corpo del testo). --Alex brollo (disc.) 02:11, 18 nov 2011 (CET)[rispondi]
Candalua, appena puoi, potresti montare le istruzioni "spostatorie" di RigaIntestazione in postOCR automatico, non appena viene definitivamente escluso che RigaIntestazione possa/debba stare in corpo pagina? --Alex brollo (disc.) 12:28, 18 nov 2011 (CET)[rispondi]
Negativo. postOCRAutomatico() scatta solo entrando in creazione di una Pagina. La funzione che cerchi tu è verificaPagina(), che scatta sul salvataggio di ogni Pagina. Candalùa (disc.) 12:44, 18 nov 2011 (CET)[rispondi]
Ho perso il controllo di Common.js, il che non è, in sè, un male (soprattutto per gli altri utenti) :-) --Alex brollo (disc.) 12:58, 18 nov 2011 (CET)[rispondi]
Ehm, direi che è ora di entrare nel rifugio antiatomico! - εΔω 18:03, 18 nov 2011 (CET)[rispondi]

Microformat[modifica]

Aubrey mi segnala questa pagina: Microfotmat (avevo sbagliato link, mi scuso...) Ho il piacere di ricordarvi che noi stiamo usando il meccanismo "microformat" da parecchi mesi, dopo aver sviluppato un set di script che lo trasformano in qualcosa di automatico e totalmente trasparente per l'utente. L'implementazione del meccanismo consente il nuovo tipo di visualizzazione del SAL pagina, e dell'utente che l'ha raggiunto, nel linketto pagina in ns0. Le prime implementazioni sono del marzo, le rifiniture del giugno.

Se leggete Progetto:Qualità/Semantizzazione troverete una breve descrizione dei "due metodi di semantizzazione" che it.source usa correntemente. Il secondo, Meccanismo della semantizzazione via inclusione di codice html, è esattamente il "microformat".

Non so dirvi se abbiamo lanciato l'idea, che poi qualcuno ha raccolto, oppure le idee sono state sviluppate indipendentemente. In ogni caso, sembra che siamo sulla strada giusta. :-) --Alex brollo (disc.) 19:58, 20 nov 2011 (CET)[rispondi]

Perchè sono "perso" nello strato testo djvu[modifica]

Negli ultimi giorni un manipolo di noi (per ora, io e Samuele, ma spero che il gruppetto si ampli) ha "addentato" il problema dello strato testo dei file djvu. Vorrei spiegarvi l'obiettivo, con l'aiuto dell'immagine della pagina a sin, Pagina:Gli elogi del porco.djvu/44. Senza ingrandire l'immagine, cosa vedete? non potete leggere il testo. Al massimo potete indovinare a fatica qualche parola. Eppure vedete chiarissimamente alcuni dati importanti. Vedete che c'è un'intestazione pagina. Vedete che il testo è diviso in blocchi di tre righe ciascuna. Indovinate che si tratta di versi (la chiave è il margine destro "seghettato" delle righe, e il fatto che le righe non riempiono la larghezza della pagina). Vedete perfino che il primo verso di ciascuna terzina è indentato a sinistra.

Bene, tutti questi dati, che hanno a che fare con la formattazione, sono assenti nel testo OCR puro e semplice; ma sono presenti nel text layer completo dei file djvu, perchè lì ogni elemento del testo è associato alle sue coordinate spaziali, ossia alla sua esatta posizione nella pagina e alla sua grandezza. Nel momento in cui sarà eseguito un perfetto parsing di questi dati (e ci siamo quasi) e verranno scritti gli algoritmi per interpretarli (e qui la cosa si fa dura), un sacco di formattazione (intestazione, applicazione poem, suddivisione in terzine, indentatura del primo verso...) potrebbe essere applicata automaticamente. Ecco l'obiettivo. --Alex brollo (disc.) 08:10, 21 nov 2011 (CET)[rispondi]

Go Alex Go! Questa idea è *fantastica*. --Aubrey McFato 09:30, 21 nov 2011 (CET)[rispondi]
Tutto lo sviluppo del progetto, al momento, è fatto su una cartella dropbox, condivisa fra me, Samuele e Aubrey . Chiunque mastichi python (con cui lavoro io) o php (con cui sta lavorando Samuele), e desideri dare un'occhiata, o contribuire, sarà benvenuto. La pagina di riverimento qui, per un po' di documentazione su quello che via via scoveremo, è Progetto:Trascrizioni/Strato testo dei file djvu, ma per forza di cose (non si può essere dappertutto...) questa pagina sarà sempre piuttosto "indietro" rispetto al progetto (aimè, o si sviluppa, o si documenta, oppure si è professionisti...) --Alex brollo (disc.) 09:55, 21 nov 2011 (CET)[rispondi]
LOL! Alla pagina di riverimento arriverò quando e se ci sarà qualcosa da riverire :P. In ogni caso io mi chiamo fuori per incapacità :) Intanto fammi capire una cosa. Nei testi con giustificazione "normale" e con le parole mandate a capo come si faceva una volta, con trattino, cosa succede? Anche nel testo elettronico le parole vengono tagliate dal trattino e quindi tutto l'ambarand si autogiustifica? Comunque associo i miei ai complimenti di Aubrey. Sembra proprio una trovata geniale. Riverenze! XD --Silvio Gallio (disc.) 14:39, 21 nov 2011 (CET)[rispondi]

Test semantizzazione dati Autore[modifica]

Il secolo di attività di Autore:Abate di Tivoli è il {{Abate di Tivoli|secolo}}.

Si, funzia; Alebot sta rielaborando tutti i template che hanno il nome degli autori, abilitando la "semantizzazione" di tutti i dati contenuti nel Template:Autore. I sati sono ottenuti in modo molto intuitivo con un template che ha il nome dell'autore e un parametro, che può essere il nome completo del parametro del template Autore o un suo alias abbreviato o almeno "minuscolificato". Esempio, "Giorno e mese di nascita" può essere passato come tale, ma anche come "gmn" che si fa prima.

Esempio:

  • {{Antonio Fogazzaro|Giorno e mese di nascita}} ->{{Antonio Fogazzaro|Giorno e mese di nascita}}
  • {{Antonio Fogazzaro|gmn}} -> {{Antonio Fogazzaro|gmn}}

Modificando il solo template {{Aut}} si possono ottenere anche combinazioni di dati, indicati semplicemente da un parametro che ne rappresenta la sigla:

  • {{Antonio Fogazzaro|cnas}} -> {{Antonio Fogazzaro|cnas}}
Nota tecnica
Il template sfrutta l'area dati della pagina autore, che viene aggiornata automaticamente via js al momento di qualsiasi modifica fatta da un utente. Il template quindi non necessita di alcun aggiornamento. Sfrutta la "semantizzazione di primo tipo", via transclusione selettiva, che ha il vantaggio di essere accessibile via template, ma lo svantaggio di essere pesantuccia per il server. Ergo, usare con una certa moderazione. --Alex brollo (disc.) 10:41, 21 nov 2011 (CET)[rispondi]
Ottimo. Mi raccomando, per non perderne traccia, tutte queste spiegazioni vanno inserite nella documentazione dei template. --Accurimbono (disc) 10:49, 21 nov 2011 (CET)[rispondi]
Pensa: il template accetta anche un parametro "doc"!
Comuque ho modificato il "motore", adesso i parametri non sono più filtrati dal template, ma vengono comunque inoltrati a Template:Aut. Questo permette di aggiungere altre "aggregazioni o elaborazioni" agendo sul solo template Aut. Ecco, per esempio, le due routine aggiunte al volo, link e link+; vediamo se capite perchè il secondo si chiama così. Codice: {{Claudio Corte|link}} e {{Claudio Corte|link+}} rispettivamente, con questi due risultati:
{{Claudio Corte|link}}, {{Claudio Corte|link+}}. --Alex brollo (disc.) 20:14, 21 nov 2011 (CET)[rispondi]

In mezzo a tutti questi mostri di informatica[modifica]

...io ci faccio, e lo so, la figura del pollo (coo, coo). Però uno di questi citati, me lo spiega perché nei gironi scorsi qui sulla colonna di sinistra sotto "Strumenti" si legge "carica un file", poi ieri che ho caricato della robetta, c'era "Carica su Commons" e oggi c'era di nuovo "Carica un file" a adesso, in modalità lettura c'era "carica un file", mentre in modalità scrittura, adesso adesso, c'è di nuovo "carica su Commons". Ma mentre sono in scrittura di qua, in un'altra finestra in lettura (contestuale) c'era ancora "carica su Commons" (ma che è apparso dopo un ripensamento di due o tre secondi). Wow! buonanotte gente! coo coo vado a letto con le galline(lle) :P --Silvio Gallio (disc.) 21:00, 21 nov 2011 (CET)[rispondi]

qualche giorno fa ho notato che i server facevano un po' fatica a caricare, alle volte si vedeva la pagina "nuda", senza gli stili, altre volte si vedeva la pagina apparentemente normale ma senza javascript (l'etichetta "Carica un file" viene modificata in "carica su Commons" appunto via javascript, quindi se quest'ultimo non funziona...). Dopo un po' tutto è tornato normale. Se ti capita ancora, forse ti è solo rimasta in cache un po' di robaccia, fai un bel CTRL-F5 come di consueto. Candalùa (disc.) 21:34, 21 nov 2011 (CET)[rispondi]

FineReader good news[modifica]

Ho scaricato e testato FineReader 11. Le cose si fanno semplici: può effettivamente salvare il suo output in un file djvu completo di strato testo (il dettaglio è la linea, cosa più che sufficiente). La qualità grafica dello strato immagine non è fenomenale, ma a fare un "trapianto di strato testo" da un djvu all'altro non si sta poi tanto... Penso che mi farò questo "regalo". --Alex brollo (disc.) 00:36, 23 nov 2011 (CET)[rispondi]

Non solo. Il testo html è semplicemente sorprendente (su una pagina test di Dizionario triestino non ha sbagliato un grassetto nè un italico, oltre che interpretare esattamente oltre il 99% delle parole, anche di quelle dialettali). Ora, cosa succede se "fondo" il meglio dei due strati: testo djvu e html? Vedo in un vicino orizzonte delle belle cose.... almeno qua. (alex sloggato)
Rinnovo l'invito agli smanettoni: anche questi test sono fatti nella cartella dropbox che costituisce il "laboratorio djvu condiviso". Chi è interessato a curiosare/a contribuire, mi mandi la sua email e lo "invito" nel laboratorio. Nella cartella condivisa c'è anche la raccolta completa di routine DjvuLibre, quindi i test sono agevoli anche se non si "mastica python" o se non si sono installate le routine DjvuLibre sul proprio pc. --Alex brollo (disc.) 09:11, 23 nov 2011 (CET)[rispondi]

Sentenza Trizzino[modifica]

Buon giorno. Qui http://digilander.libero.it/lacorsainfinita/guerra2/schede/trizzino.htm c'e' il testo della sentenza Trizzino. E' possibile metterla su wikisource? Grazie, http://it.wikipedia.org/wiki/Utente:Ipvariabile

Ci sono le immagini (o il testo) della sentenza completa? Se sì, certo: le sentenze sono atti pubblici, wikisource ne contiene varie. --Alex brollo (disc.) 11:45, 24 nov 2011 (CET)[rispondi]
Alex ho messo il link. Guarda tu per favore e dimmi che ne pensi. Grazie, http://it.wikipedia.org/wiki/Utente:Ipvariabile
Data la mancanza di risposta avviso che sto creando la voce qui http://it.wikisource.org/wiki/Sentenza_Corte_di_appello_Penale_di_Milano_Vicenda_Trizzino

Pagina principale due anni dopo[modifica]

Cari amici,

Il layout della nostra pagina principale sta per compiere due anni.

Nulla di strano per i calmi ritmi del nostro progetto. In effetti quest'anno sono intervenuti dei cambiamenti non invisibili grazie alla Wikiguida e al riquadro del centocinquantenario, solamente mi piacerebbe lanciare un sondaggino informale nella comunità con le seguenti domande:

  1. La nostra pagina principale va bene com'è? dove ci sono margini di miglioramento?
  2. su, facciamo tutti un giro per le pagine principali delle varie source: dubitando che la nostra sia la migliore, quali sono le più efficaci?

Il suggerimento sotteso è il seguente: magari non saremo una comunità folta di grafici e tecnici come quella di Pedia, ma sarebbe bello

  • evidenziare i punti di forza delle diverse pagine principali
  • provare in una (o più) sandbox una loro contaminazione in stile "spaghetti Frankenstein"
  • inserirvi un qualche elemento di novità e pensare a una nuova pagina principale qui

ricordo che due anni fa decisi di provarci — senza avere grandi competenze — e fu un'epserienza fantastica dalla quale ho imparato moltissimo sia in termini tecnici sia in termini di crescita dell'interazione con le comunità (chiesi aiuto in diverse lingue e in diversi progetti); l'unica avvertenza è che crescendo la comunità i punti di vista aumentano e il consenso diventa più complesso da raggiungere, ma nessuno ci corre dietro. - εΔω 18:40, 24 nov 2011 (CET)[rispondi]

Su Discussione:Pagina_principale#Nuova_pagina_principale avevamo iniziato un paio di mesi fa a raccogliere idee in proposito, direi che possiamo ripartire da lì. Candalùa (disc.) 23:26, 24 nov 2011 (CET)[rispondi]
(in fretta, ma altrimenti non lo faccio più) Una, fra le altre, cose che mi piace degli inglesi è un bel template dedicato alle collaborazioni/partnership. Mi pare un'ottima idea, che va di pari passo con il nostro Aiuta Wikisource, che tanto ci ha portato bene in questo anno, e che secondo me dovrebbe essere ancora più bello e ancora più grande. io poi metterei (da qualche parte), una barra customizzata per la ricerca di Autori e Opere, e la metterei bella visibile e centrata. Il browsing è ancora interessante, ma credo poco utilizzato (non abbiamo statistica da guardare...) Aubrey McFato 10:08, 25 nov 2011 (CET)[rispondi]

Informazioni sulla fonte dei testi: where do we go from here?[modifica]

Cari amici,

l'argomento era stato accennato, molto di striscio, ma prima o poi bisognerà affrontarlo se non altro per prendere le misure della questione e disporre una roadmap che possa essere posta in pratica:

  • Dopo la rivoluzione dell'interfaccia proofread e il progressivo viraggio verso questa modalità di lavoro
  • Dopo la rivoluzione della comparsa dell'area dati e la sua ormai navigata sperimentazione

come vogliamo mettere in evidenza le fonti dei testi? Il Template:Infotesto è ancora utile? Come fare in modo che le indicazioni sulla fonte siano indicabili in maniera umana per gli utenti non scafati?

Il mio ideale consisterebbe nella massima razionalizzazione (se le fonti sono già indicate altrove come ad esempio nei file di commons non c'è bisogno di duplicare informazioni già inserite ecc. ecc.) e nella massima semplificazione, ma io sono un sognatore molto prima che un tecnico, ecco perché penso occorra che tutti dicano la loro e soprattutto i tecnici. - εΔω 18:49, 24 nov 2011 (CET)[rispondi]

Intanto che ci pensate, tre "pensieri laterali" sull'argomento da parte mia:
  1. più i dati su Commons diventano importanti, e sono d'accordissimo sull'evitare ogni ripetizione, più diventa opportuno passare dall'uso del template Information al template Book su Commons, scegliendo magari una configurazione semplice, mettendo qui una bella pagina di aiuto e iniziando a convertire da Information a Book i template dei file djvu su Commons;
  2. i file djvu possono contenere metadati;
  3. considero terminata la sperimentazione dei "template autore", ma l'ho iniziata pensando a un più ampio progetto, ossia di estendere la cosa creando dei "template opera". --Alex brollo (disc.) 22:43, 24 nov 2011 (CET)[rispondi]
Oh bene! Direi che è il momento di ri-tirare fuori la mia soluzione "alla veneta" per il problema delle fonti (di cui tra l'altro si sta dibattendo anche su la.source). Take a look a una pagina a caso: un riquadro in basso nella pagina riporta tutte le informazioni sull'edizione e la fonte del testo. In questa maniera qualunque utente non scafato le trova immediatamente, a meno di essere proprio cecati. I dati che vengono mostrati provengono:
  • dalla pagina Indice per le opere proofread
  • da un paio di campi del template Intestazione per le opere non proofread.
senza alcuna ripetizione di informazioni (tranne, a dire il vero, tra l'Indice e la pagina in Commons, ma questa temo sia quasi inevitabile - tra l'altro non mi fiderei troppo a mettere i dati solo su Commons, che è un progetto su cui non abbiamo sufficiente libertà d'azione e che già periodicamente ci dà dei grattacapi).
Noi oggi quello che potremmo fare con poco sforzo è aggiungere questo riquadro in basso, che riporti (in maniera totalmente automatizzata) i dati presenti nella pagina Indice, o in mancanza quelli del Template:Infotesto. In un secondo tempo si può decidere di procedere alla progressiva eliminazione di Infotesto. I due migliori candidati per contenere questi dati sono:
  • il ns0, come su vec.source
  • il nsIndice stesso. Quest'ultima soluzione tra l'altro l'ha appena proposta il buon Doug nella discussione già citata su la.source: in pratica si utilizzerebbero gli Indici come contenitori di dati anche in assenza del file con le scansioni (che può magari arrivare in un qualche futuro). Anche se a prima vista può sembrare una boiata, la cosa ha un suo senso; mi piacerebbe sapere così "a pelle" cosa ne pensate, visto che io stesso sono indeciso in merito. Candalùa (disc.) 23:52, 24 nov 2011 (CET)[rispondi]
  • A pelle: l'idea di una pagina specifica e unica in tutti i casi, come contenitore di metadati relativi all'opera, mi piace moltissimo. Condivido le preoccupazioni nell'uso di dati provenienti da Commons, e ribalterei il problema: su Commons dovrebbero essere replicati (se possibile automaticamente) i metadati contenuti in source, non l'inverso. Per farlo però occorre comunque tener conto della struttura dati di Book su Commons; e i dati di Indice ci si avvicinano molto.
Esiste una relazione "uno a molti", che mi intoppa in alcune idee, fra Indice e ns0, in quanto nulla impedisce di derivare più di una versione ns0 da un solo Indice; un altro buon modivo per considerare Indice, o il nome di Indice, come punto di riferimento unico per i metadati dell'opera.
Vorrei solo che venisse presa in considerazione, a questo punto, l'ipotesi di costruire una pagina Template per ognuno degli indici, analogamente alla pagina Template che nei giorni scorsi ho inaugurato per gli autori; un'altra cosa che farei subito è una modifica del tl Intestazione in modo da fargli accettare, nel campo "URL della versione cartacea a fronte", il nome base della pagina Indice, per dire, lo stesso che viene usato nel tag pages, perchè dal nome base sarebbe molto più facile ricavare via template sia i nomi delle pagine Pagina, sia l'eventuale nome del "template opera". --Alex brollo (disc.) 10:42, 25 nov 2011 (CET)[rispondi]
Il nome base lo puoi già ottenere, {{PAGENAME:Indice:Poemi (Byron).djvu}} dà come risultato Poemi (Byron).djvu.
Sul "template opera" avrei bisogno di capire meglio... alla fine, se ho ben capito, i template per gli autori non fanno altro che recuperare i dati dalla pagina autore più o meno come fa il Template:Dato. Solo che i template degli autori c'erano già, erano diventati inutili e tu li ha solamente "rigenerati" e resi nuovamente utili a qualcosa. Ma i template per le opere bisognerebbe crearli da zero, e prima di creare migliaia di template nuovi, vorrei capire se c'è qualcosa che mi sfugge e se questi template fanno davvero qualcosa di nuovo rispetto a ciò che già esiste. Candalùa (disc.) 11:35, 25 nov 2011 (CET)[rispondi]
Mica sapevo che PAGENAME accetta parametri. Ok, un trucco in più.
Quanto ai template Nomeautore e al connesso template Aut, vero, per gran parte i primi hanno solo una funzione di "smistamento" e di usability (per me, la sintassi che permettono, {{Alessandro Manzoni|Giorno e mese di nascita}} per ottenere il giorno e mese di nascita di Alessandro Manzoni è proprio bella), e questo vale per tutti i dati che sono già presenti in qualche area dati; ma il loro meccanismo consente anche di utilizzarli come contenitori di dati diversi, tipici e caratteristici di un caso particolare, "fuori standard", in numero indeterminato e di formato indeterminato. L'idea era proprio di sperimentare il meccanismo "deviatore per dati standard-contenitore per dati non standard", e devo dire che la cosa funziona. Visto che stiamo parlando di "pagina contenitore", mi sembrava giusto considerare anche questa possibilità. Tenendo conto di quello che diceva Candalua, si tratterebbe di aprire, ad. es. , un Template:Georgiche.djvu che permetta la sintassi {{Georgiche.djvu|autore}}, {{Georgiche.djvu|editore}}.... --Alex brollo (disc.) 12:03, 25 nov 2011 (CET)[rispondi]

Tool "cancellatore" di formattazione[modifica]

Io trovo più fastidioso cancellare la formattzione (quando serve) che aggiungerla; ci sono molti pulsante, ecc per aggiungere cose, ma nessuno per toglierle. Ho un prototipo di "script cancellatore" che elimina grassetto, corsivo e qualsiasi tag tipo html dal testo selezionato (operativamente: si seleziona il testo dove eseguire la cancellazione, si clicca e il testo selezionato viene "ripulito"). Chi fosse interessato a provarlo, mi avvisi (chi si destreggia in js, basta che scopiazzi da sè dal mio vector.js i due script removeTags() e gst() ). --Alex brollo (disc.) 17:23, 26 nov 2011 (CET)[rispondi]

Aggiungo: il tool aggiusta paragrafi è aggiustato. Il tool aggiunge una riga bianca nei testi da OCR fra un paragrafo e l'altro, "indovinando" la presenza di una paragrafo dal carattere finale di una riga. Il tool "salta" le aree in versi, identificate da una coppia di poem; quindi, volendo utilizzarlo, sul testo OCR bruto è opportuno mettere i tag poem come primissimo passo. --Alex brollo (disc.) 12:19, 28 nov 2011 (CET)[rispondi]
Riguardo ai tool "Trumenti per la rilettura", ho in mente di cancellarne due, sostituendoli con "richieste interattive".
  1. aggiungi tag poem. Nei datiPagina esiste il dato "tipo="; se tipo=poesia e SAL=25%, postOCR dovrebbe, per prima cosa, aggiungere poem di default all'intero testo (poi magari il tag sarà trascinato nel punto giusto). Negli altri casi un pulsante basta e avanza. Questo potrebbe essere il primo passo del tool postOCR (se si lancia postOCR e il tool "si mangia" le interruzioni di riga a fine verso, addio)
Ho montato il trucco in una copia di postOCR, è veramente molto utile. Adesso però sento l'esigenza di un "cancellatore di prima riga del testo OCR". :-)
  1. aggiusta paragrafi. Eccellente ma... chi lo usa? Lo sostituirei con una valutazione via js, nelle sole pagine SAL 25%, della probabile opportunità di usarlo (presenza di probabili fine paragrafo); in caso affermativo, js potrebbe chiedere "Eseguo aggiusta paragrafi?".


Che ne dite? --Alex brollo (disc.) 13:44, 29 nov 2011 (CET)[rispondi]

Habemus FineReader 11[modifica]

Abbiamo un FineReaader 11, che converte automaticamente qualsiasi cosa in un djvu con OCR FineReader "incorporato". Le eventuali pagine doppie tipo OPAL sono automaticamente splittate. Insomma: dal pdf al djvu+OCR in un solo colpo. Sto facendo una prova con La pastorizia di Cesare Arici, incuriosito dal fatto che Leopardi parla benissimo dello sconosciutissimo (per me) autore. Finite le prove, metto FR 11 a vostra disposizione. --Alex brollo (disc.) 01:33, 29 nov 2011 (CET)[rispondi]

Preciso: per fare pratica su casi concreti, non solo sono disponibile, ma invito chiunque abbia un pdf da convertire in djvu+ocr a farmelo pervenire. Chiederei solo due cortesie: 1° che si tratti di opere che effettivamente saranno "lavorate", in tempi brevi; 2° che mi venga anche fatto pervenire in qualche modo un elenco dei dati necessari per caricare il file djvu su Commons (megklio ancora, il testo del template Information bello e pronto) e per compilare il template della pagina indice. --Alex brollo (disc.) 12:14, 29 nov 2011 (CET)[rispondi]
Ecco, ti sei fregato con le tue mani: appena posso, ti mando una mezza decina di pdf di Scientia... :-P --Aubrey McFato 13:25, 29 nov 2011 (CET)[rispondi]
Vedi punto 1°. ;-) Guarda che poi controllo. --Alex brollo (disc.) 13:35, 29 nov 2011 (CET)[rispondi]
Uomo di poca fede :-D Il progetto Scientia procede lento ma procede, soprattutto grazie agli utenti delle altre Source :-). Io l'ho pure sponsorizzato in Pedia, con pochi risultati adesso come adesso. A far le cose fatte bene, uno dovrebbe andare nelle cronologie delle voci degli scienziati e spammare il progetto... --Aubrey McFato 18:33, 29 nov 2011 (CET)[rispondi]
Ehi, che ne diresti del Fedro tradotto da Trombelli proveniente da GoogleBooks? Ci servirebbe giusto un djvu con layer di testo per il M&S! - εΔω 19:07, 29 nov 2011 (CET)[rispondi]
In lavoro. --Alex brollo (disc.) 20:21, 29 nov 2011 (CET)[rispondi]
Non so se ho fatto bene, ma ho caricato l'intero libro e l'ho chiamato, visto il contenuto, File:Lucrezio e Fedro.djvu. La qualità della scansione non è buona, non spero miracoli dall'OCR. Provo ad aprire anche l'Indice. --Alex brollo (disc.) 22:41, 29 nov 2011 (CET)[rispondi]
Nel dubbio... hai fatto bene! Quanto alla qualità dell'OCR quel che conta è la sola presenza di un layer di testo per preparare il Match&Split, la trascrizione è già stata fatta. - εΔω 23:10, 29 nov 2011 (CET)[rispondi]
Molto interessante, ma non ti voglio assillare con i miei testi :) Che cosa significa FR11 a vostra disposizione? Qualcosa tipo any2djvu? Cioè si carica il .pdf (OPAL o GOOGLE books) su questa piattaforma e un bot ce lo restituisce lavorato pronto per Commons e NsPagina? --Xavier121 19:27, 29 nov 2011 (CET)[rispondi]
No Xavier, intendo che mi offro io come volontario e possessore di un FR con regolare licenza. Recentemente, in lista wikisource, è stato citato un caso analogo nella wikisource svedese. Quindi niente automatismi; solo volontariato e "divisione di compiti". --Alex brollo (disc.) 20:06, 29 nov 2011 (CET)[rispondi]
In lista Wikisource ho proposto (Alex lo sa) il progetto dell'acquisto di un FR11 da mettere sul toolserver, per far funzionare di nuovo il pulsante OCR e magari per delle conversioni. La discussione va avanti e ci sono cose interessanti, secondo me sarebbe carino averlo per vari motivi, ma forse il costo è proibitivo... Comunque, continuiamo a discutere (potete venire anche voi, anzi! più siamo meglio è). Intanto, scopro pure questo: http://finereader.abbyyonline.com/en/Account/Welcome Aubrey McFato 10:00, 1 dic 2011 (CET)[rispondi]
Aimè; se c'è un servizio OCR online a pagamento della ABBYY, sarebbero dei veri idioti a "dar via" il suomotore in modo che possa essercene uno online gratuito. :-( Temo che non siano idioti. --Alex brollo (disc.) 07:53, 5 dic 2011 (CET)[rispondi]
In realtà, è comparso in lista wikisource un dato: la reale necessità di pagine ocr di tutte le wikisource del mondo (ossia,il numero di pagine che il "sistema wikisource" è in grado di smaltire ogni giorno) è di circa 900. Se ci organizzassimo, basterebbe UNA licenza FR11 per tutte le wikisource del mondo! --Alex brollo (disc.) 07:53, 5 dic 2011 (CET)[rispondi]

Spostiamoci in Progetto:Trascrizioni/FineReader 11[modifica]

Proporrei di aprire una sottopagina "di lavoro" come da titolo; butto giù in breve qualche caratteristica e qualche possibilità del programma e poi ci organizzeremo per le "richieste" e lo "stato di avanzamento" dei lavori. Ci vediamo di là! --Alex brollo (disc.) 00:14, 30 nov 2011 (CET)[rispondi]

Idee balzane[modifica]

Mi è venuta un'idea stupidissima: perchè non contatare scuole/corsi di dattilografia e mostrargli Wikisource come piattaforma per esercizi e compiti? Abbiamo testi con ogni tipo di difficoltà 8da quelli giuridici a quelli matematici); abbiamo un avanzamento qualità per la rilettura, con le diff per vedere gli errori; abbiamo il timestamp e le ultime modifiche, per seguire i tempi; abbiamo tutto. Ci manca solo trovare degli aspiranti dattilografi che facciano i compiti qui da noi :-) --Aubrey McFato 11:39, 29 nov 2011 (CET)[rispondi]

Io! Io! Io! Voglio fare la dattilografa! Così mi sembrerà di tornare a quando ero giovane e carina ... --Lagrande (disc.) 17:01, 29 nov 2011 (CET)[rispondi]
Ma allora, Grisone (che non è seicentesco ma cinquecentesco, e ha una qualità molto buona) va bene! :-P --Alex brollo (disc.) 01:02, 30 nov 2011 (CET)[rispondi]
Ma se sono solo da correggere, e non da scrivere, a che servono i dattilografi? --Lagrande (disc.) 07:48, 30 nov 2011 (CET)[rispondi]
Io comunque non ho la più pallida idea di come fare a contattarli... Mi sembrava solo un ottimo target :-) se qualcuno ha idee ben venga. @Lagrande, secondo me hai ragione tu, ma magari gli interessa pure correggere bozze in fretta, oltre che trascrivere da capo... Poi, ogni tanto, quando l'OCR è messo molto male, si fa prima a rifare da capo piuttosto che correggere. Aubrey McFato 09:57, 30 nov 2011 (CET)[rispondi]
Giusta l'osservazione di Lagrande. La mia non era una battuta: gli unici testi da proporre come "esercizio dattilografico" sarebbero quelli che non sono assolutamente interpretati dall'OCR, e che hanno proprio le caratteristiche indicate da Edo come inadatte: sono di pessima qualità grafica oppure sono scritti in italiano "alieno". In conclusione: i testi adatti sono quelli che sono inadatti. :-(
Approfitto per ripetere un'osservazione: non ho mai sentito parlare, qui, di inserimento di testi mediante l'uso di programmi di interpretazione vocale. Dopo un bel po' di training, questi programmi danno risultati sorprendenti e potrebbero essere l'uovo di Colombo per i testi antichi. Purtroppo il mio Dragon di tanti hanni fa si rifiurta di funzionare sul mio portatile attuale, cosa che mi ha impedito, finora, di fare una prova. Però... a pensarci bene... forse agli aspiranti dattilografi potremmo passare i file vocali da lettura umana del testo.... che ne dite? Di certo anche i dattilografi umani farebbero un bel po' di errori, ma chissà... forse meno che un OCR. --Alex brollo (disc.) 10:10, 30 nov 2011 (CET)[rispondi]
Ma se ti capita un dattilografo con un forte accento locale, o quelli che mia madre, maestra in pensione, definisce "colpiti da analfabetismo di ritorno"? In sostanza, il software funziona lo stesso se qualcuno non sa leggere bene? --Lagrande (disc.) 11:03, 30 nov 2011 (CET)[rispondi]
Per quanto riguarda il mio amato Dragon, il suo sistema di "training" era veramente eccellente, indovinava moltissimo una volta "inquadrato il lettore". La difficoltà nasceva nel momento in cui gli si insegnano cose un po' più difficili (ma possibili) come aggiungere formattazione, o decodificare sigle, o codificare testi in sigle... lì si vede se l'operatore è smanettone o no; se è smanettone, sono convinto che si potrebbe arrivare a dettare comodamente testo e codice wiki.
Per quanto riguarda l'idea, più banale, di procurare ai dattilografi umani file vocali con testo dettato, bè, lì le cose sono diverse e forse più facili: si potrebbe infatti dettare anche la formattazione, un dattilografo di intelligenza normale non dovrebbe aver problemi a interpretare una cosa come "due graffe aperte autorecitato barra verticale virgilio due graffe chiuse". --Alex brollo (disc.) 11:47, 30 nov 2011 (CET)[rispondi]

Motivational advertising![modifica]

La misura del tuo successo è quella degli ostacoli che devi superare per giungere alle METE!

Cari amici,

questo messaggio non è particolarmente necessario, ma sentivo che un po' di motivazione la si può ricavare:

  • Il nostro contatore di testi è parzialmente inaffidabile, e infatti non stiamo qui a contare troppo, ma
    1. Avevamo da poco stappato lo spumante per il cinquantamillesimo testo...
    2. ...quand'ecco che è intervenuta la falciatura di testi di cinquemila... quasi seimila pagine tra fine settembre e inizio ottobre
    3. ciononostante nel corso di due mesi abbiamo riguadagnato i cinquantamila testi! Guardate le date dei link e le attuali statistiche o anche solo in intestazione della pagina principale...

I casi sono due, o noi abbiamo inserito seimila testi in nemmeno due mesi o il contatore delle statistiche ci sta giocando qualche piacevole scherzetto. Onestamente non me ne importa: non c'è che da festeggiare la solerzia e il riscontro che il nostro progetto sta acquisendo passo passo, e qui un po' di ringalluzzimento dell'autostima non spiace: la meta di salvare e diffondere con la migliore qualità quanti più testi possibile è una sfida immane, ma noi siamo sempre in prima linea! Woohooo! - εΔω 11:06, 30 nov 2011 (CET)[rispondi]

Evviva! Non che io abbia contribuito granchè, ma ogni occasione è buona per festeggiare ... --Lagrande (disc.) 11:10, 30 nov 2011 (CET)[rispondi]
Doppiamente felice, essendo stato "la falce".... ;-) --Alex brollo (disc.) 11:39, 30 nov 2011 (CET)[rispondi]
...finché respiro... sempre con voi... :) --Xavier121 13:32, 30 nov 2011 (CET)[rispondi]
Siete stati tutti bravissimi (io mi chiamo fuori; solo una quarantina di pagine da settembre in qua :-( ). E allora evviva e complimenti. Ad majora (o a maggese...non ricordo bene) :P --Silvio Gallio (disc.) 17:31, 1 dic 2011 (CET)[rispondi]

I fine riga originali[modifica]

Una delle prime cose che facciamo (anzi che fa postOCR se lo usiamo...) è rimuovere dal testo OCR i fine riga e ricongiungere le parole spezzate a fine riga. Dà molta soddisfazione (soprattutto se lo fa postOCR in un baleno). Ma.... vi siete accorti che è più facile correggere i testi in poesia che in prosa, perchè è più facile, a colpo d'occhio, trovare le righe corrispondenti? Eppure i fine riga originali non vanno conservati, o meglio: almeno le parole spezzate a fine riga vanno ricongiunte, altrimenti in visualizzazione sono una porcheria....

Possibile soluzione: conservare i fine riga originali fino a rilettura terminata, e mascherare in qualche modo le parole spezzate perchè restino spezzate, ma non si veda.

Lo fa, direi benino, il tool "parole spezzate" che aggiungo temporaneamente a Strumenti per la rilettura perchè possiate provarlo. --Alex brollo (disc.) 14:54, 30 nov 2011 (CET)[rispondi]