Wikisource:Bar/Archivio/2008.10

Da Wikisource.
Jump to navigation Jump to search
Archivio delle discussioni del mese di ottobre dell'anno 2008
archivio
Filing cabinet icon.svg
2008
gen feb mar apr mag giu lug ago set ott nov dic

Nuvola filesystems folder blue open.png Categoria: Archivio Bar 2008 Bar  Nuvola apps noatun.png Archivio   Nuvola apps noatun.png ottobre 2008 



Lavori in corso: trasformare una pagina in un record[modifica]

Da alcuni giorni sto lavorando al problema di trasformare una pagina in un "record", ossia in una collezione di campi richiamabili individualmente. Si tratta di un ulteriore passo nello sfruttamento delle possibilità della transclusione selettiva. Non ho ancora le idee chiare sull'intero spettro delle possibilità che si dischiudono; vandenberg è informato e non mancherà di scovare qualche applicazione che non so immaginare, se l'idea è buona.

Al momento, l'ipotesi è quella di scrivere, o di far scrivere a un bot (e a questo proposito ho interpellato Pietrodn per la fattibilità), un "databox" in cui varie section, ognuna dotata di un nome che indica un determinato centenuto, identificano campi e rendono quindi disponibile il contenuto dovunque, all'interno dello stesso progetto wiki.

Al momento, sto lavorando sui dati degli autori, e per non modificare niente dell'aspetto delle pagine esistenti, ho immaginato che la migliore posizione possibile per il databox sia una sottopagina Dati del template di servizio collegato all'autore: ad esempio, il databox di Gaio Giulio Cesare è scritto in Template:Gaio Giulio Cesare/Dati.

Per verificare la cosa, aggiungerò manualmente la pagina Dati e il relativo databox per quegli autori che ho inserito io stesso (una decina). Quando Pietrodn risponderà sulla fattibilità dell'automazione via bot, discuteremo e decideremo se il gioco vale la candela; in ogni caso, sarà un "regalo" (tutto si risolve con l'aggiunta di una sottopagina, nulla verrà cambiato negli attuali templates, nè nel contenuto delle attuali pagine) e, in termini relativi al cavallo, "a caval donato non si guarda in bocca", a mio parere.

Ho cancellato l'esempio che avevo scritto, un template "per gioco" di Vandenberg, perchè richiama Template:Autore il quale crea una categoria che attira le attenzioni distruttive di Bimbot.

Risorse impiegate[modifica]

Potrebbero esserci dubbi sul fatto che questo sistema assorba troppe risorse, questo il mio quesito e la risposta di Sanberg:

Quill-Nuvola.svg
«::Thanks very much. Another question for you. Do you think that using sections to identify "costants" or "fields" into a page is so critically resource-consuming, to discourage such a trick? --Alex brollo (talk) 04:44, 25 September 2008 (UTC)
It shouldn't be. The section tags are (to the parser) a no-op, so they will require some resources to run the hook, but not as much as tag that does something, or some formatting. Extracting a lot of small sections could take more processing power than a simple template substitution, since it will have to scan through an entire long page to find the section for each call, while the templates would be smaller; but each of those templates would require a database call to retrieve, while the #lst calls (after the first) would just get the page from a local cache. -Steve Sanbeg (talk) 22:15, 26 September 2008 (UTC) »

--Alex brollo (disc.) 10:45, 29 set 2008 (CEST)

Commenti[modifica]

Sul consumo di risorse sia io che iPork e, mi sembra ma non sono sicuro, anche Aubrey siamo giunti alla conclusione che quello che oggi è lento ma efficiente va applicato comunque, in quanto non siamo noi a doverci adattare alla tecnologia, ma è la tecnologia che deve adattarsi a noi se l'idea è funzionale. Solo una domanda a fronte dell'interessante prospettiva da te aperta: oggi, se devo costruire una pagina autore senza essere un esperto di template ed esoterismi informatici, apro in modifica il primo autore che trovo, copio il codice e lo compilo sostituendo i dati nei parametri che mi chiedono in maniera esplicita cosa mettere ("abbiamo traduzioni di questo autore?"). Lo stesso canovaccio lo ritrovo in Aiuto:Autore e in Template:Autore.
A parità di niubbaggine non è che questa separazione tra contenuto e interfaccia sia un passo indietro in termini di usabilità o approccio a portata di utente? In pratica si chiede all'utente di sapere anticipatamente cosa indici la sigla {{Autore-data}}, e da lì capisca come allestire tale template, dunque un passaggio ulteriore. Ai wikigeek non dovrebbe dare particolari problemi, ma dal punto di vista dei niubbi questo approccio non mi convince, tutto qui. smentitemi per favore portando vostre esperienze (non solo Alex, grazie). - εΔω 14:28, 29 set 2008 (CEST)
Da quello che sono riuscito a capire la pagina autore e relativo templare rimarrà invariata rispetto ad oggi (per la felicità dei non-geek), ci sarà da aggiungere solo una sottopagina contenente una struttura dati semantizzante in cui il bot andrà ad inserire i singoli dati presi dal template nella pagina autore. I dati contenuti in questa sottopagina potranno poi essere "passati" e riarrangiati per altri usi (tabelle, indici, portali).
Correggetemi se mi sbaglio. --Accurimbono (disc) 14:59, 29 set 2008 (CEST)
Esatto, tutto resta assolutamente invariato. "Compare" dal nulla, generata da un bot, una speciale sottopagina Dati (spero del tutto automaticamente: l'utente non dovrebbe fare assolutamente nulla) di cui ci si può non curare affatto... o che si può utilizzare, pescando e arrangiando in ogni maniera possibile i dati puntiformi che rende accessibili. Ho messo come esempio la copia conforme di una pagina Autore solo per far intravedere le possibilità della cosa, NON per suggerire che quella dovrebbe essere la nuova modalità per compilarla! Appena ho a disposizione qualche databox in più, costruirò un esempio più creativo: una tabella, autoaggiornata, di dati degli autori, in cui le singole righe sono richiamate semplicemente menzionando il nome dell'autore. --Alex brollo (disc.) 16:54, 29 set 2008 (CEST)

Un esempio di "tabella auto-aggiornante"[modifica]

Quella che segue è una tabella riempita con i dati contenuti nei databox. Se il bot che tiene aggiornato il template con il nome dell'autore, consensualmente aggiornerà anche il databox (cosa assai semplice), tabelle di questo tipo saranno aggiornate automaticamente, senza che l'utente-principiante nemmeno sospetti l'esistenza del databox e di tutto l'ambaradan. Ovviamente, qualcuno dovrà (al momento) aggiungere i templates riga.

Utente:Alex brollo/Autore tabella1 iUtente:Alex brollo/Autore riga1Utente:Alex brollo/Autore riga1Utente:Alex brollo/Autore riga1Utente:Alex brollo/Autore riga1Utente:Alex brollo/Autore riga1Utente:Alex brollo/Autore riga1Utente:Alex brollo/Autore riga1

Adesso mi prendo una pausa creativa... ho appena terminato la trascrizione del Libro secondo di Il cavallarizzo, resta il Libro primo, solo una quarantina di capitoletti :-( --Alex brollo (disc.) 09:26, 30 set 2008 (CEST)

Ottimo Alex, mi sembra proprio quello che stavamo cercando. Basterà istruire il BimBot ha fare quello che dici, e quello che c'è da fare a mano si farà. la tabella degli autori potrebbe essere ripensata meglio, per sincronizzare le due cose.
L'unica cosa che mi viene in mente è la frequenza di aggiornamente: il bibmbot passa tutte le notti, ma a me sembra esagerato (anche eprchè così sfalsiamo le statistiche, ma non è un grosso problema). Una volta ogni 3 giorni, la settimana? Aubrey McFato 12:59, 30 set 2008 (CEST)
Abbiamo solo 500 autori, farlo passare tutte le notti non mi sembra possa comportare un carico eccessivo al server, io sarei per tutte le notti.
Conta poi che non ci sarà più bisogno di aggiornare via bot il template:autoretaldeitali perchè i parametri si potranno transcludere dalle varie section del nuovo template dati. Ciao, --Accurimbono (disc) 14:14, 30 set 2008 (CEST)
Sono per la settimana. Ciao, Xavier121|Talk 14:56, 30 set 2008 (CEST)
Intanto grazie dell'apprezzamento!
Ho compilato la tabella quasi "a caso", non appena creati un po' di databox autori, solo per farvela vedere in azione. A questo punto, ci vorrebbe qualcuno che ci pensi un po': non conosco sufficientemente bene le procedure, e il loro significato pratico. Ad esempio, non ho la minima idea sull'uso pratico del template:autoretaldeitali. Quanto alle "trasfusioni degli aggiornamenti": il Template:Autore all'interno della pagina Autore: dovrebbe rimanere l'interfaccia con l'utente, quella che l'utente integra e modifica; BimBot passa, raccoglie, e trasporta sia nel template specifico dell'autore, che nel databox. Potrebbe mettere anche i dati soltanto in databox, e il template potrebbe leggerli; ma penso che, visto che è lì, e che si tratta di due operazioni semplici, sia meglio che aggiorni sia il template che il databox. Nulla impedisce che un utente "evoluto" modifichi direttamente i dati della databox: in ogni caso la modifica (e l'eventuale incongruenza) sarà "rullata" da bimbot al successivo passaggio.
Resta inteso che dopo la pausa rifletterò un pochino sui testi, che presentano notevoli analogie nella struttura dei dati.
Vandenberg mi chiede se la comunità it.s ha accolto l'idea: ditemi voi quando posso rispondergli di sì! --Alex brollo (disc.) 18:38, 30 set 2008 (CEST)

Prospettive e proposta di trasloco[modifica]

Dal poco che ci ho capito, i template:Autore servono a fare una cosa simile a quella che ha scoperto tu, ma in maniera più stupida, non semantica (nel senso che noi con la transclusione selettiva possiamo selezionare i singoli parametri, lui inserisce tutto il template Autore). I risultati sono gli elenchi generati ogni notte dal BimBot (qui un esempio). da quel che sapevo, il bot legge nella categoria e crea l'indice: è una procedura un po' a forza bruta ma che permette di avere elenchi di navigazione, molto più navigabili delle categorie e che danno informazioni in più.
Ora, con l'innovazione di Alex, quel sistema diventa obsoleto, ma non la sua funzione. Se possibile, integrerei tutto con il nuovo databox, in modo poi da:
  • generare nuovi (e magari migliorati) elenchi di navigazione
  • avere una tabella autori aggiornata automaticamente
  • avere le tavole cronologiche aggiornate automaticamente
  • avere quello che ci pare aggiornata automaticamente
Che dite? --Aubrey McFato 22:13, 30 set 2008 (CEST)
Sono un po' impressionato dalle prospettive. In effetti, avendo unicamente una lista di tutti gli autori, e un bot/una pattuglia di bot che leggono ed esaminano i dati e ci ragionano un po' sopra, tenendo conto della potenza di python nel maneggiare stringhe, e strutture di dati complesse, non vedo molti limiti a quello che si potrebbe fare; e una lista di autori viene anche lei fornita automaticamente dalla più banale delle categorie. Quando volete, io proporrei di trasferire la discussione in toto in qualcuno dei bar specialistici (coordinamento? bot?) --Alex brollo (disc.) 01:04, 1 ott 2008 (CEST)
Non sono sicuro di esserci arrivato, ma intuisco che l'innovazione è potente. Io più che a elenchi "di navigazione" penso a elenchi "di manutenzione", come la cara vecchia Tabella degli autori che in quanto aggiornata a mano non è mai sincronizzata con la situazione reale. Per il resto sto cercando di seguire il thread come posso. Dovrò imparare a usare Python. - εΔω 07:42, 1 ott 2008 (CEST)
E io forse dovrò fare uno sforzo e studiarmi quello che mi manca fra il codice python e la costruzione e manovra di un bot. Infatti - a pensarci un po' - forse un bot potente potrebbe fare tutto quello che era elencato da Aubrey anche senza i databox... mi sembra di intuire vagamente che i databox siano più utili per un uso umano, ma prima di esserne sicuro devo capire meglio cosa un bot può fare, e cosa non può fare. --Alex brollo (disc.) 07:56, 1 ott 2008 (CEST)
Grazie, Alex, Questo è un grosso limite delle mie competenze informatiche: io so che un bot fondamentalmente cerca e sostituisce in base alle regex che gli si dà in pasto e in base a delle query SQL, ma non avendo mai affrontato la struttura del database su cui poggia il progetto vago tra un delirio di o immaginaria nnipotenza ("Ehi, potresti prendere un bot e servirmi un caffé via email ogni volta che una pagina raggiunge SAL 100%?") e una sconfortante ignoranza (ho un bot che non so usare...) - εΔω 10:41, 1 ott 2008 (CEST)
Ho una sconfinata ammirazione per chi scrive una regex; finora, io ho preferito scrivermi da solo il codice, in più righe e con grandi mal di testa da debugging, che fa quello che una regex farebbe in un attimo. Ma come si sa "ogni scarafone è bello a mamma sua". Ecco, io ho sempre cercato di essere "la mamma" dei miei codici... da quanto ho capito finora, un bot non è altro che uno pseudo-utente che può colloquiare con il server dopo essersi diligentemente "loggato". Non so se esistono limiti a quanto questo pseudo-utente può fare, ma mi sembra di intuire che può seguire link, "leggere" le pagine e il codice che le genera, modificare pagine esistenti e crearne di nuove. Siccome non è che un'estensione python, può fare anche - in locale - tutto quello che può fare un normale programma python: in particolare, leggere e scrivere file locali in cui accumulare informazioni varie. In altre parole, può fare tutto quello che potrebbe fare un utente normale. Ma adesso mi dedicherò allo studio degli aiuti sui bot, poi provo... e poi comincerò a tempestare di domande quelli del BarBot. --Alex brollo (disc.) 10:54, 1 ott 2008 (CEST)
Sulle questioni interne a Wikisource vediamo come potremo aiutarti, ma per l'apprendistato e la messa a punto di script e bot le domande ai bar locali rischiano di rimanere inevase a lungo: ti consiglio piuttosto un Wiki apposito: BotWiki! Il vero e proprio guru italiano dei pywikiediaBot è Filnik (Snowolf è un altro geniaccio italiano, ma agisce perlopiù in zona anglofona). - εΔω 23:04, 1 ott 2008 (CEST)
Grazie del suggerimento. La strada sarà lunghetta, anche perchè la trascrizione de Il cavallarizzo nel frattempo deve andare avanti. La prima guardata al materiale di aiuto sui bot, a quanto ho capito, indica che i bot sono utilizzati più per attività diffuse, elementari e ripetitive che per elaborazioni "focalizzate e complesse", il cui cuore siano veri programmi esterni a wiki, tali da ricercare, caricare, elaborare e trasformare dati specifici in profondità. Penso che mi divertirò. Incoraggio chiunque ne abbia il tempo/voglia di approfondire python: è un bellissimo linguaggio, in cui sono implementate fantastiche strutture di dati (le liste, i dizionari); già padroneggiare il contenuto di mezzo tutorial dischiude possibilità veramente notevoli nell'elaborazione di dati testuali. Esiste poi il Bugigattolo dell'hacker dove, restando perfettamente in tema, si potrebbe fare un po' di tutoraggio reciproco: sono convinto che alcuni script python potrebbero essere molto utili anche al di fuori della gestione dei bot, che vedo più come interfacce che come veri programmi. :-) --Alex brollo (disc.) 08:40, 2 ott 2008 (CEST)

Botwiki[modifica]

Mi sono registrato in BotWiki, come suggerito da Edo. Non sono ancora penetrato nella comunità (ci vuole sempre un po' di tempo per esplorarle): ma segnalo come ottima idea, un'idea da importare anche qui se fosse possibile, l'uso estensivo di ReCaptCha nelle validazioni antispam... Più lavora ReCaptCha, meno lavoriamo noi ;-) --Alex brollo (disc.) 09:12, 25 ott 2008 (CEST)

Aggiornamento: semantizzazione esterna[modifica]

In poche righe, è attivo Utente:Alebot, e superati alcuni scogli Alebot è in grado di leggere una pagina Autore e di restituire i dati del template Autore come struttura XML "semantizzando" tutti i dati e trasformandoli quindi in un insieme di variabili python facili da memorizzare su file testo e facili da "interrogare". In questo momento mi manca di buttare giù un paio di routine per leggere bene e comodamente queste strutture. Dopodichè vi saranno due strade alternative, e non mutuamente escludentesi, di procedere verso alcune automazioni: quella della "transclusione selettiva" e quella della lettura di massa ed elaborazione esterna di tutti i dati, via bot. --Alex brollo (disc.) 12:02, 21 ott 2008 (CEST)

I dati xml di tutti gli autori sono pubblicati su: Google Docs, aut_xml_old--Alex brollo (disc.) 12:36, 26 ott 2008 (CET)

Rinnovo biblioteca[modifica]

Il sondaggio è finito, e si è concluso con la decisione di dividere le aree relative ai testi classici ed ai testi moderni. La sezione dedicata prettamente ai sourciani, sarà, appunto, quella dei testi classici che, pur essendo di PD in Italia, non lo sono negli Stati Uniti. Vi prego di cominciare a discutere del riordino qui, in modo da addivenire in tempi brevi al riordino del progetto.Senpai (disc.) 14:52, 30 set 2008 (CEST)

Centro Studi Don Bosco[modifica]

In occasione del discorso intorno al libro su Luigi Comollo, era sorto il problema che il testo è già disponibile in rete scannerizzato dal CSDB che è una istituzione collegata all'Università Salesiana. In quella occasione Aubrey pregò di attendere.

Io ho ora avuto dal direttore del CSDB (Centro Studi Don Bosco) prof. Aldo Giraudo il permesso di utilizzare la loro scannerizzazione. Lo stesso direttore mi ha esortato a continuare l'opera con tutti gli altri volumi da loro scannerizzati. La collana riguarda opere di interesse religioso dell'ottocento e l'opera di scannerizzazione.

Spero che nessuno si adonti per queste opere di estrazione cattolica. Mi sono mosso anche in altre direzioni. La cultura è la cultura.--Mizar (ζ Ursae Maioris) (disc.) 10:51, 2 ott 2008 (CEST)

Evvái! Ricordo ai nuovi che Source non è Pedia, e chi si adonta non ha capito la logica del progetto: qui quel che conta non è il giudizio sul contenuto, ma la tracciabilità della fonte cartacea e la licenza d'uso del testo. Se il baciapile sopporta la presenza di autori spietatamente anticlericali, il mangiapreti sopporta le preghiere cristiane. <offtopic>Se proprio devo impegnarmi a prefigurare uno scenario di trolling o editwar in stile wikipediano mi immagino due utenti che dalla lettura di un'immagine un po' sbiadita traggano due interpretazioni diverse di una parola in grado di stravolgere il senso di un testo... ma ce ne vuole di impegno e comunque spero si tratti di dispute di livello sufficientemente alto da non degenerare mai in edit war...</offtopic>
Mizar, posso felicitarmi del permesso ottenuto, e io me sottoscritto che sarei εΔω mi fido della tua parola, ma le regole sono regole: tutti saranno tranquilli solo se a seguito del rituale invio della mail a permissions@wikimedia.org arriverà il ticket OTRS che attesta l'avvenuto accordo. Una volta ottentuo ciò dove si trova l'elenco delle opere importabili qui? - εΔω 11:42, 2 ott 2008 (CEST)

<conflittato>

Bellissima notizia!!!
Prima di procedere come per altri permessi ricevuti, c'è la necessità di ufficializzare l'autorizzazione con un ticket OTRS. Basta una mail del direttore del CSDB.
Riguardo il tuo timore di possibili adontamenti, ricordo che qui vige il massimo rispetto per il NPOV che in Wikisource si traduce in neutralità rispetto ai contenuti delle opere. Abbiamo testi di tutti i tipi e nessun contributore, che io ricordi, ha mai dato anche il solo sospetto di violare questo principio base.
Ogni testo è il benvenuto qui a prescindere da ciò che esprime!
Mica siamo una di quelle discoteche con la "selezione all'ingresso"! :)
Scherzi a parte, mi raccomando la mail all'OTRS per il ticket. --Accurimbono (disc) 11:49, 2 ott 2008 (CEST)


@EDO: neanche ci fossimo messi d'accordo nello scrivere la risposta! :D --Accurimbono (disc) 11:51, 2 ott 2008 (CEST)
Proprio perchè la massa dei testi che potremmo avere a disposizione è notevole, capisco la cautela per evitare un grosso lavoro inutile. Dal link sopra messo c'è la possibilità di recuperare il numero di telefono diretto del prof. Giraudo e forse è opportuno che il contatto venga gestito da qualche admin. Il professore è molto gentile e competente.--Mizar (ζ Ursae Maioris) (disc.) 12:13, 2 ott 2008 (CEST)--
N.B. l'elenco delle pubblicazioni de CSDB è reperibile qui. Vedi anche qui Forse qualche testo può essere considerato edixzione critica ed è meglio chiarire che l'autorizzazione le ricomprende. Il prof Giraudo aveva solo la preoccupazione della conformità al testo originario, ma l'ho assicurato che da questo punto di vista Source è già di per se ipersensibile. C'è poi anche il materiale pubblicato dal SAL - solo le opere di don Bosco sono 37 volumi per 19.200 pagine, ma ci vuole, credo, una diversa autorizzazioneMizar (ζ Ursae Maioris) (disc.) 12:13, 2 ott 2008 (CEST)

Preghiera per semplificare il processo di autorizzazione[modifica]

Questa sottosezione è il risultato di un giro in chat dove un utente cercava informazioni per proporre a un fumettista di cedergli delle immagini per Pedia: nel dargli i link alle pagine di informazione mi sono reso conto che il settore è presentato con grande disordine ed è terribilmente esoterico. Io mi trovo nelle stesse condizioni quando cerco di spiegare in maniera chiara a un non addetto ai lavori come fare per donare un testo. usciamone.

Guardiamo i fatti: noi non abbiamo una sezione di aiuto relativa alla cessione di testi alla biblioteca. Abbiamo le pagine per allontanare gli utenti ma non quelle per accontentarli quando ci vogliono concedere qualcosa: orrore! Stavo per importare le corrispondenti pagine di Pedia quando mi sono reso conto che questo non risolve il problema, data la farraginosità di tali pagine (che peraltro vanno comunque modificate in quanto le problematiche di riformulazione di Pedia sono a noi estranee). Io dovrei scrivere tali pagine invece di scrivere qui, ma la mia poca confidenza con il diritto mi scoraggia. Ciò non toglie che il lavoro compiuto sulle pagine d'aiuto nel corso dell'ultimo anno abbia lasciato qualche effetto benefico: bisogna che riportiamo qui le istruzioni per ottenere le autorizzazioni di testi, main una forma decisamente più sintetica e user friendly, magari spezzando in più pagine la materia (nello stile del Percorso guidato per il SAL), ma che sia comprensibile non solo ad avvocati o a wikiesperti di lungo corso ma al "resto di noi" in modo che se si indirizza l'utente a tali pagine questo non ne sia spaventato. Mizar, che ne pensi? - εΔω 12:53, 2 ott 2008 (CEST)

Scusa se prendo il discorso alla lontana. Recentemente al bar di 'pedia avevo sollevato la questione che il testo inglese è molto più pratico, se non altro perchè permette la concessione della licenza sulla pagina del sito d'origine, evitando di intasare l'OTRS.
Anche Senpai è intervenuto dicendo che l'autorizzazione era implicita.
Forse dovrebbe Wikimedia farsi carico di aiutare le varie comunità a darsi delle regole chiare, precise, ma senza alcuni avvitamenti che ora esistono. Per lo meno un testo di policy per Wikisource dovrebbe avere l'approvazione di quei pochi che hanno affrontato il problema con una ottica complessiva, Senpai in testa. 'pedia ha avuto storicamente altri problemi, alcuni obiettivamente molto gravi. Il modo di reagire, però non è stato sempre razionale, affidato più a gestori dei bot che ad esperti della materia. Forse è arrivata anche lì l'epoca della razionalità, senza avventure, ma anche senza isterie.--Mizar (ζ Ursae Maioris) (disc.) 13:42, 2 ott 2008 (CEST)

(Torno a sx) Mi sorge un dubbio: chi è che decide la procedura da adottare? Io ritenevo implicito che un gestore di un sito potesse cambiare la licenza direttamente sul proprio sito, anzi mi sembra una cosa ben migliore della procedura OTRS (solo a nominarla mi viene l'orticaria... sembra una malattia) dato che non ci autorizza personalmente, ma autorizza tutti gli utenti della rete. Inoltre potrebbe essere più semplice anche per gli stessi interessati. Da quello che dice Mizar en.pedia è differente rispetto a it.pedia. Possiamo dunque decidere noi e scrivere la relativa policy? Magari è l'occasione buona per scrivere l'ottima pagina proposta da Edo e magari anche qualche lettera prestampata per richiedere un'autorizzazione. --Aubrey McFato 17:10, 5 ott 2008 (CEST)

Uffa. Non ne usciamo. Si direbbe che qui (e non solo qui) l'ignoranza regni sovrana. Con questo non intendo dire che io sia meno ignorante di altri, anzi, ma semplicemente che se si rivolgono domande semplici (ad esempio: un'autorizzazione ottenuta tramite OTRS vale per tutti i progetti Wikimedia o solo per il progetto per cui il materiale oggeto di autorizzazione è stato originariamente proposto?) le risposte o non arrivano, o arrivano da utenti che non hanno certezze al riguardo. Riscontro infine una strana difficoltà di divulgazione da parte degli utenti OTRS. L'esperienza mi insegna che semplificare un argomento complesso è
  1. estremamente difficile se non si è più che padroni dell'argomento - tant'è vero che i migliori insegnanti sono quelli che riescono in questo processo
  2. relativamente facile se si è più o meno ignoranti in materia, ma con risultati decisamente erronei o esposti a facile critica - ed è questa la piaga che afligge molti insegnanti me compreso.
Conscio di questo non posso che cercare certezze da chi lavora in OTRS e chiedere a chi capisce più di me in diritto di "violentare il legalese" per farci capire il busillis. A creare il percorso guidato ci penserò io o chiunque qui abbia un po' di confidenza con Mediawiki. - εΔω 17:26, 5 ott 2008 (CEST)

Nuovo burocrate, nuova burocrazia![modifica]

Cari amici,

con la nuova richiesta di bottificazione di Alebot e con l'elezione del nuovo burocrate, che sarei poi io, ho deciso che è ora di cominciare a somigliare a un wiki adulto e impostare una procedura di accettazione comunitaria dei bot.

Finora i bot sono stati flaggati in maniera più o meno informale (con l'eccezione di iPorkBot per le prerogative di adminbot). Finché gli utenti in gioco sono pochi non vedo grossi problemi, ma non possiamo muoverci così per sempre, o ogni nuovo arrivato senza esperienza di source o di bot vorrà avere la possibilità di editare senza apparire nelle ultime modifiche. Per i bot manovrati da utenti di altre source penso di potermi muovere ancora in autonomia, controllando l'operato di tali bot su altre wiki, ma almeno per correttezza e trasparenza desidero che qui al bar gli utenti attivi diano il loro assenso o diniego all'applicazione del flag di bot a un automa manovrato da utenti italiani o di progetti in lingua italiana.

Non dico che sia ora di dedicare una pagina apposta alle elezioni dei nuovi bot, penso che una votazione qui al bar possa risultare una formalità per gli utenti attivi, e un'occasione di vaglio e controllo per gli automi di utenti nuovi o inattivi chiedendo qualche modifica dimostrativa.

E dunque si aprano le danze: se i 3/4 dei votanti entro una settimana si esprimeranno positivamente siamo a posto

Utente:Alebot[modifica]

Chi è d'accordo che io accordo lo status di bot all'utente nominato nel titolo e manovrato da Alex brollo? Con tre-quattro assensi e nessuna obiezione mi riterrò soddisfatto.

  • Pictogram voting support.svg - εΔω purché sia di parola e non si getti ad usarlo forsennatamente dieci secondi dopo il flag
  • Pictogram voting support.svg Stesse condizioni :-) --Aubrey McFato 02:12, 3 ott 2008 (CEST)
  • Pictogram voting support.svg Stesse condizioni :-) --Mizar (ζ Ursae Maioris) (disc.) 08:11, 3 ott 2008 (CEST)
  • {{0}} Nel senso che potrei anche essere d'accordo, ma non capisco cosa voglia dire "bot lettore ma non scrittore". I bot servono per fare modifiche, non per leggere, quindi vorrei che si partisse con il piede giusto, chiarendo questo aspetto. --Accurimbono (disc) 09:36, 3 ott 2008 (CEST)
Il senso è che Alex è per sua stessa ammissione digiuno totalmente di bot, e il bot lettore è sotanto nella fase iniziale. In breve: lo si flagga da subito, però lui come ha promesso ci va coi piedi di piombo. Un bot lettore non necessita neanche di un flag, secondo me, dato che non modifica le pagine. --Aubrey McFato 14:31, 3 ott 2008 (CEST)
La nota sul "bot lettore" vi dà l'idea di quanto poco avessi capito. Quello che mi interessa, comunque, al momento, è la cattura veloce di grandi quantità di testi e di schiere di templates, per vari esperimenti di elaborazione python offline; in pratica, se ho ben capito, cose che potrei fare addirittura senza loggare il bot. Ma io lo loggherò lo stesso. Rinnovo la promessa: prima di far partire script che scrivono, chiederò un tutoraggio, e comunque sarà in modalità "una pagina alla volta". Grazie a tutti delle prontissime risposte. --Alex brollo (disc.) 15:54, 3 ott 2008 (CEST)
  • Pictogram voting support.svg OK, grazie per il chiarimento e... buon lavoro! :) --Accurimbono (disc) 16:11, 3 ott 2008 (CEST)

commenti[modifica]

Ben venga tutto ciò che può aiutare. Ogni strumento può essere utile. Bisogna, dopo alcune amare esperienze in altri progetti, però mettersi d'accordo quali sono i possibili usi di un bot su wikisource. Su source la regola assoluta è che i testi sono di pubblico dominio: un bot è in grado di elencare gli altri siti su cui la pagina è presente, non certo di controllare se le regole del pubblico dominio sono state rispettate. Anche il criterio spesso usato in altri progetti della anteriorità della data di pubblicazione qui non giova. La Divina Commedia resta di pubblico dominio anche se un altro sito mi ha preceduto nel metterla in linea. In un futuro uno strumento agile come il bot potrebbe essere usato per alcuni servizi, sempre che vengano considerati utili, come ad esempio un catalogo delle varianti, un catalogo delle edizioni web ecc.--Mizar (ζ Ursae Maioris) (disc.) 08:11, 3 ott 2008 (CEST)

Gli script[modifica]

Mi inoltrerò nell'uso di Alebot in modo interattivo: non lancerò script, ma li integrerò in un ambiente interattivo python, di cui le routine pywikipedia costituiranno l'interfaccia con wiki. Gli script elementari (miniprocedure) che scriverò, dopo verifica, le riporterò nella pagina di discussione di Alebot a disposizione di eventuali curiosi. Per chi maneggia python: gli script sono pensati per essere usati dall'IDLE di python (l'interfaccia comodissima che uso di solito), e non dalla riga di comando python.--Alex brollo (disc.) 13:01, 5 ott 2008 (CEST)

Un bug[modifica]

Ho scoperto con raccapriccio che la pagina Wikisource:Elenco alfabetico degli autori C prodotta da bot (penso, Bimbot) è devastata da Gaio Giulio Cesare. Sono quasi certo che la cosa derivi da un "gioco" di Vandenberg sulla pagina Autore, che ho rollbackato da un paio di giorni. Ho già chiesto a Pietrodn di verificare: se è come penso, il prossimo giro di Bimbot dovrebbe risistemare tutto.

Nel frattempo vi informo che (come promesso) continuo a usare Alebot in sola lettura, con parecchie soddisfazioni. L'estrazione di tutte le variabili di tutti gli autori, e loro trasformazione in variabili python "con cui fare quello che si vuole" offline, è un obiettivo ormai vicinissimo. --Alex brollo (disc.) 11:22, 7 ott 2008 (CEST)

Ottimo... Il primo passo potrebbe essere quello di produrre una tabella Autori nuova di zecca, e completamente automatica.
A suo tempo credo poi che dovrai rendere la procedura del bottolo totalmente automatica, in modo da dare lo script al Bimbot da far correre periodicamente... Questo quando le cose saranno stabili. Mi piacerebbe che ognuno di noi provasse a pensare agli utilizzi di una cosa del genere, in modo da essere preparati per quando sarà pronta. --Aubrey McFato 11:43, 7 ott 2008 (CEST)
Questo è il motivo per cui bisogna usare la sandbox! :-)
Ho rollbacckato, venivano richiamati dei template chenon erano quelli d'autore.
Vediamo al prossimo giro di bot come va. Ciao, --Accurimbono (disc) 13:04, 7 ott 2008 (CEST)
Thanks, appena sento Vandenberg lo sgrido ;-)
@ Aubrey: l'innesto dello scriptone python su Bimbot sarà meglio che lo faccia qualcun altro; spero che il mio script sia intelleggibile. Chi sa usare veramente python poi lo raffinerà. Vuol dire che la prima tabella Autori la faremo in una sandbox ;-) --Alex brollo (disc.) 15:23, 7 ott 2008 (CEST)

Discussione esterna[modifica]

Discussione esterna qui. --Aubrey McFato 03:22, 3 ott 2008 (CEST)

Cormio?[modifica]

dove posso trovare notizie inerenti alla famiglia Cormio? Commento non firmato di 151.67.112.214 (discussioni) , in data 5 ott 2008 alle 08:35,.

clicca qui. - εΔω 10:09, 5 ott 2008 (CEST)

Convenzione sui wikilink[modifica]

Non vorrei essere pedante, ma questo non s'è l'è filato nessuno:

Quill-Nuvola.svg
«Quando si inserisce il {{TestoCitato}}, spesso ci si imbatte in situazione come questa.

L'opera citata è una sottopagina di un testo più vasto, ed i casi sono due:

  1. la sottopagina è un'opera a sè stante (un saggio, una novella, una fiaba)
  2. la sottopagina è un capitolo, dipendente dal resto del libro

Ora, il template {{TestoCitato}} categorizza la pagina che si immette come primo parametro, e spesso non si sa se mettere la sottopagina in quanto tale oppure un redirect, se esiste (e di conseguenza non si sa se crearlo, se non esiste) Ora, io dire che:

  • Caso 1: se il redirect non esiste si crea e si utilizza quello come primo parametro
  • Caso 2: si inserisce la sottopagina in quanto tale.

In questo modo dovremmo essere coerenti, e spingere ancora di più verso la nostra attenzione ai testi e non ai libri. Che dite? --Aubrey McFato 02:20, 28 set 2008 (CEST)

PS: il caso è quasi analogo con template {{AutoreCitato}}: con Autore:Cartesio, per esempio, ho invertito il redirect da Cartesio-->Descartes a Descartes-->Cartesio, e ho invertito dunque tutti i redirect delle categorie relative, ma la categoria Categoria:testi in cui è citato René Descartes viene creata in automatico dal template {{Autore}}.»

--Aubrey McFato 17:14, 5 ott 2008 (CEST)

Scusa Aubrey, intendi questo per redirect? Xavier121|Talk 08:23, 6 ott 2008 (CEST)
Ok, quel redirect che mi indichi é sbagliato, ma la colpa é mia e del mio messaggio incomprensibile. Quello che mi chiedo é: é meglio avere una
Con redirect intendevo la creazione di un redirect Dialogo di un venditore d'almanacchi e di un passeggere, che rimanda a Operette morali/Dialogo di un venditore d'almanacchi e di un passeggere. Il {{TestoCitato}} poi viene fatto puntare direttamente al primo, in modo da avere un nome piú semplice e comune da mettere nel primo parametro.
Infatti, se in un saggio si cita il suddetto Dialogo del Leopardi, l'utente medio é portato a scrivere solo il titolo del dialogo, non anche Operette morali/... ...
Spero di essermi spiegato meglio (appena ci siamo capiti rolbaccko la tua modifica Xavier ;-)) --Aubrey McFato 12:27, 6 ott 2008 (CEST)

Relazione parlamentare anselmi sulla p2[modifica]

Ciao a tutti, ho notato che Wikisource contiene vario materiale sulla p2 ma non la relazione parlamentare d'inchiesta dell'onorevole Anselmi. E' un documento molto interessante, molto ben leggibile ed informativo, perciò pensavo che sarebbe bello averlo in wikisource. Io ho trovato il testo qui: https://www.strano.net/stragi/tstragi/relmp2/index.html e sulla homepage del sito è scritto che loro permettono di copiare il materiale, sul quale non mettono alcun copyright. Esistono sulle commisioni parlamentari restrizioni di copyright/ come si può fare per aggirarle? Inoltre: il materiale può venire inserito in formato .tex o .pdf, oltre al .html del wiki? Ciao Odranoel (disc.) 12:36, 6 ott 2008 (CEST)

Ciao Odranoel, scusa per il ritardo della risposta.
Il testo che ci indichi mi sembra ben formattato, e con ogni probabilità di pubblico dominio, ma personalmente non ho trovato la fonte da loro utilizzata nè so se un testo del genere sia in pubblico dominio oppure no. La cosa più semplice probabilmente è scrivere una mail direttamente a loro, in cui puoi chiedere maggiori informazioni.
Qui su source per ora accettiamo soltanto il testo wikificato, ma non ti preoccupare: se è possibile inserirlo e inizi, ti daremo sicuramente un mano ;-) D'altronde non dovrebbe essere un lavoro complicato. Manda dunque una mail per chiedere spiegazioni, così sappiamo cosa fare del testo. --Aubrey McFato 16:46, 10 ott 2008 (CEST)
Credo che gli atti delle commissioni parlamentari siano (per quanto riguarda il diritto d'autore) assimilabili alle leggi, quindi pubblicabili su Wikisource. Sarebbe però da controllare per bene la legge sul diritto d'autore. --Accurimbono (disc) 16:56, 10 ott 2008 (CEST)
Ciao, ho contattato il responsabile del sito che vi avevo linkato e mi ha detto che:
a) possiamo inserire in wikisource il materiale che lui ha pubblicato sul suo sito;
b) gli atti parlamentari non sono protetti da nessun tipo di copyright;
c) la sua fonte erano gli originali pubblicati dal Parlamento.
Cosa faccio, inizio ad inserire il materiale? Magari intanto possiamo iniziare con l'inserire quell'ipertesto. Parallelamente posso richiedere al Parlamento tali atti (se non costa uno sproposito...) e poi verificare che in ciò che è stato inserito non ci siano errori. Vi sembra ragionevole? Attendo il vostro via libera. Ciao! Odranoel (disc.) 09:08, 13 ott 2008 (CEST)

Biblioteche digitali fatte bene[modifica]

Per chi ha un po' di tempo, guardate questa biblioteca digitale neozelandese:

Il core del sito é completamente diverso da nostro (una topic map, per chi sapesse che cos'é), ma il loro risultato ci potrebbe illuminare la via, imparando da alcune loro idee. Non credo sia riproducibile una struttura del genere (il software é semantico, e le pagine sono automaticamente generate), ma c'é sempre da imparare. --Aubrey McFato 16:31, 6 ott 2008 (CEST)

Salve, in attesa di potervi dare buone notizie sulla possibilità di usare liberamente le immagini dei documenti digitalizzati, Vi comunico il nuovo indirizzo del sito opal libri antichi aggiornato: www.opal.unito.it. Per quanto riguarda la discussione sulla biblioteca digitale, mi sembra, da quel poco che ho visto, che vi state muovendo bene, cercando di organizzare la vostra per contenuti semantici, oltre che come ipertesto. E questo fa la differenza tra certe biblioteche digitali che sono degli enormi contenitori con una misera finestra di interrogazione, e quei progetti che cercano di organizzare i contenuti nello spazio virtuale esattamente come se questo fosse una biblioteca reale, con stanze, scaffali, palchetti e libri. Penso che il futuro per le biblioteche digitali, oltre alla loro integrazione a livelli diversi di trattamento ed offerta dei testi, stia nella complessità ed intelligenza con le quali sono organizzate. La "sistemazione virtuale" dei libri all'interno del repository concepita per classi o soggetti p.e., è il dna che farà crescere la biblioteca in modo ordinato e organico, come un corpo sano.Opallibriantichi (disc.) 10:29, 10 ott 2008 (CEST)

Grazie dei commenti positivi.
Come Lei ha accennato, Wikisource sta tentando di muoversi in più direzioni contemporaneamente, anche inventandosi e re-invantandosi gli strumenti per poterlo fare (il lavoro di Alex Brollo) con la transclusione selettiva e gli script python da applicare ai testi ne è l'esempio più lampante.
Una benedizione da un addetto ai lavori ci fa davvero piacere. Se avesse qualche domanda o consiglio, anche riguardo alle direzioni in cui il progetto si sta sviluppando, la prego, ce la comunichi.
Cordiali saluti --Aubrey McFato 11:16, 10 ott 2008 (CEST)
Molto bello il nuovo sito OPAL! Segnalo un piccolo collegamento spezzato, da questa pagina cliccando sul link "Elenco delle 277 opere disponibili" si apre una pagina vuota. Spero che la segnalazione possa essere utile.
Apprezzabile molto il box per tenersi aggiornati sulle novità inserite, sembra una cosa banale, ma trovare le novità in mezzoa 4000 volumi non è facile se non c'è uno strumento di ricerca automatico. --Accurimbono (disc) 17:04, 10 ott 2008 (CEST)

Traduzioni originali: non tutto è perduto[modifica]

Anche oggi ci è arrivata l'ennesima traduzione originale. E financo con una facile possibilità di riscontro. Qui verrà cancellata, e me ne dolgo. sì, a me questa situazione spiace e bisognerà che ci mettiamo in circolo per escogitare un mezzo, una forma, insomma qualcosa con cui integrare questi testi. Comunque questo non è il punto. Il punto è che questi testi potrebbero essere spostati presso https://biblioteca.wikimedia.it dove manterrebbero una loro visibilità e da dove potranno essere importati se e quando avremo deciso che fare qui con essi. Certo che la discussione su biblioteca è ancora in corso ma non penso di sbagliarmi se vi dico che queta è al momento la soluzione più probabile, e a un mio cenno potremo avere un mezzo per non "congedare con un'amichevole calcio negli stinchi" chi tutto sommato contribuisce alla libera conoscenza. - εΔω 17:25, 6 ott 2008 (CEST) P.S. Ho lanciato un messaggio per stringere i tempi anche di là: ecco il link. - εΔω 17:39, 6 ott 2008 (CEST)

La soluzione può essere quella giusta. Ma mi chiedo (e probabilmente la questione è già stata posta) le traduzioni fatte da utenti in maniera collaborativa non possono stare su Wikibooks? Nella pagine su cosa può stare e cosa non può stare non ho trovato conferme ne smentite. --Accurimbono (disc) 08:45, 7 ott 2008 (CEST)
A questo ti risponderà meglio Alex, che ha provato il brivido di trasferire la sua traduzione di Raney su Wikibooks: di fatto la "pura e semplice" traduzione non si configura come un supporto didattico, e questo concetto "la spendibilità e la contestualizzazione didattica di un modulo" sono imprescindibili su books. - εΔω 17:35, 7 ott 2008 (CEST)
Una policy su Wikibooks è stata approvata qualche mese fa, in seguito anche ad una discussione sul bar di Wikisource: la trovate qua. Ho anche aggiunto la policy nella relativa pagina (grazie per la segnalazione ;) ). --Ramac (disc.) 14:19, 8 ott 2008 (CEST)
P.S.: in realtà il libro di Rarey tutt'oggi è pubblicato, guardare per credere: b:Doma dei cavalli. Nel caso si arrivasse ad una soluzione su Biblioteca poi indirizzeremo anche noi lì dalle nostre policy. --Ramac (disc.) 14:22, 8 ott 2008 (CEST)
Effettivamente, Rarey è stato una piccola via crucis; al momento è un capitolo di un'improbabile testo didattico "Doma dei cavalli", come dice Ramac, che - mi spiace ammetterlo - io non finirò mai, perchè ho abbandonato wikipedia proprio per non scrivere, sui cavalli, qualcosa di mio (da qualsiasi cosa scriva traspare un evidentissimo Not-NPOV) e se trovo difficoltà a scrivere una voce di wikipedia figuriamoci scrivere un libro... semplicemente adesso è in corso una traduzione collaborativa a più mani di un altro libro (Equitation), presente in lingua originale su en:s, su Google Documents. ;-) Il web è spazioso, e non contiene solo wiki. Nel frattempo mi sono molto appassionato a source e come sapete ho anche trovato - pur nel rispetto integrale delle fonti - il modo di esprimere un po' di creatività. Quindi, al momento, ho accantonato le traduzioni. Tuttavia questa cosa del source rigorosamente mono-lingua è un po' limitativa; la mia vision sarebbe un'unica, immensa source multilingua. Ad esempio: avendo un testo originale, mettiamo un classico latino con traduzione italiana a fronte, libero da copyright: dove lo mettete? Nella source latina o in quella italiana? --Alex brollo (disc.) 15:09, 8 ott 2008 (CEST)
<stiamo andando un po' OT>Ecco il traduttologo pronto a rispondere: se il testo è breve nulla impedisce di duplicarlo su due source. Se il testo è corposo sono affari delle singole source: qui viene caricata la parte italiana e nell'altra source la parte in altra lingua. Non è obbligatorio avere per forza l'immagine a fronte per garantire la corerggibilità di un testo. Infine, se proprio proprio si vuole replicare assolutamente il libro come esso si presenta nulla impedisce, col potere della GFDL, di creare un nuovo testo ad hoc che combini le due estrazioni come le si vuole far apparire, ma sempre se si vuole a tutti i costi replicarela struttura di un tale libro: dato che la trascrizione crea testi proprio con l'intento di affrancarli dalla "gabbia" della pagina, una volta che la fonte cartacea è disponibile in formato immagine noi con i testi "svincolati dai limiti" facciamo quel che ci pare. Nella sfaccettatura per lingue delle Wikisource non vedo nulla di limitativo, ma una conveniente categorizzazione NPOV che permette a noi locutori di lingua italiana di concentrarci sulla nostra e non su quella di altri, che avranno la loro Wikisource apposita per concentrarsi sulla loro lingua e non sulla nostra. Infine, così come tu hai messo a disposizione la tua maestria della lingua di Chaucer per en.source e non ti sei sentito straniero né la né qui, anch'io ho inserito una lettera di Manzoni su fr.source, mi aggiro piacevolmente per le source minori (ca.source è un ottimo progetto) e vedo tale azione come aspetto importante di un'opera multilingue. La "cosa" del source mono-lingua è un fattore di assoluta convenienza e per nulla preclusiva all'esperienza su altre source (a maggior ragione con il Single User Login).</stiamo andando un po' OT>. - εΔω 17:03, 8 ott 2008 (CEST)
Mi scuso dell'OT ma invoco l'attenuante della provocazione ;-)
Da appassionato della transclusione penso che belle cose si potranno fare quando sarà attivata la transclusione interprogetto, e proprio per le traduzioni, attivata la transclusione interprogetto, mi piacerebbe una specie di ambiente proofread per la traduzione con il testo di un'altra source a fronte. Passo e chiudo --Alex brollo (disc.) 01:28, 9 ott 2008 (CEST)
Per le traduzioni con testo a fronte transcluso da altro progetto la soluzione comoda e (a volte) funzionante è già implementata, basta cliccare nelle frecce vicine agli interwiki :-)
https://it.wikisource.org/wiki/Eneide/Libro_primo?match=la
Bello, eh! Ciao, --Accurimbono (disc) 10:03, 9 ott 2008 (CEST)
Capperi non lo sapevo. FDI! Eppure... perchè non hanno pensato di lasciare là a destra, "fissa", la versione nell'altra lingua mentre a sinistra si apre una finestra di editing, proprio come avviene con le immagini proofread? O si può fare e sto nuovamente facendo una FDI ;-) ?--Alex brollo (disc.) 19:25, 9 ott 2008 (CEST)
Questa è un opzione di visualizzazione a fronte. Che io sappia, non c'è la possibilità di editare avendo a lato la versione in lingua originale in maniera automatica. D'altronde è sufficiente tenere due finestre browser aperte una accanto all'altra, e implementare una cosa del genere significherebbe incasinare ulteriormente il sistema wiki con un'altra estensione tipo proofread page.
Inoltre tieni presente che i testi in realtà non sono mai "uguali", cioè traduzioni fotocopia, in quanto l'Eneide è stata tradotta decine e decine di volte in italiano e noi potremmo avere tutte queste diverse edizioni; idem per le altre lingue, ci sono decine di edizioni critiche dell'Eneide in latino... quale utilizziamo come "testo orginale"... è per questo che sono stato sempre contrario a traduzioni di utenti... già ne abbiamo a decine edite che sono da pubblicare e trascrivere.
Inoltre quando su Wikisource latina avremo 2/3/4 edizioni dell'Eneide (cioè mai se andiamo avanti di questo passo! :-) ) quanti interwiki metteremo??? Io sarei per fare un pagina indice di disambigua in cui si elencano le varie edizioni, un po' come si sta facendo per la Bibbia, e mettere gli interwiki lì. Cmq sono problemi che ancora non ci poniamo in quanto i testi con edizioni multiple sono ancora rari.
Ciao! --Accurimbono (disc) 16:51, 10 ott 2008 (CEST)

Si è inceppato BimBot?[modifica]

https://it.wikisource.org/wiki/Speciale:Contributi/BimBot

--Accurimbono (disc) 12:08, 8 ott 2008 (CEST)

A cosa ti riferisci? --Pietrodn · blaterami 14:22, 9 ott 2008 (CEST)
Credo al fatto che negli ultimi giorni il bot faccia una o due modifiche, invece delle centinaia che ogni notte faceva. --Aubrey McFato 14:47, 9 ott 2008 (CEST)
Esattamente a questo. --Accurimbono (disc) 16:40, 10 ott 2008 (CEST)
Curioso... sembrerebbe che qualcosa lo blocchi a livello dell'Elenco alfabetico autori - A ... spero che non dipenda da qualche mia trovata; se fosse così, mi scuso anticipatamente. Sappiatemi dire che sto in pena... --Alex brollo (disc.) 13:45, 14 ott 2008 (CEST)
Era un crash nella fase di scrittura della cache su disco... ho cancellato la cartella della cache e ho aggiornato il software, e ora gli script vanno. Stanotte dovrebbe riprendere a lavorare a regime. Scusate il ritardo. --Pietrodn · blaterami 18:21, 26 ott 2008 (CET)

Alebot comincia a lavorare![modifica]

Come da formale promessa, Alebot lavora, ma in sola lettura. Tuttavia ho il piacere di annunciarvi la quadratura del cerchio: tutti i dati, contenuti in tutti i template Autore nelle pagine Autore:, sono disponibili e richiamabili singolarmente in una struttura dati che sta comodamente in memoria (solo 180 Kb circa) e che python maneggia in frazioni di secondo :-)

Adesso mi dedico alla costruzione di un analogo (un pochino arricchito) di Wikisource:Elenco alfabetico degli autori A. Appena ottengo un output decente, lo ficcherò (a mano) nella Sandbox principale. --Alex brollo (disc.) 17:03, 8 ott 2008 (CEST)

Manifesto e Fondazione Feltrinelli[modifica]

Uscito dalla mia lunga wikipausa (chissà per quanto! Speremm), fra le altre cose sto iniziando la rilettura de Il Manifesto del Partito Comunista di tale Marx ;-) Guardando la fonte di riferimento mi accorgo però che non si tratta della scansione del testo originario, ma di una sua trascrizione (o in qualunque modo vogliate chiamarla :-) ): tecnicamente, perciò, la versione riletta dovrebbe essere portata al 100% e non a Edizione Wikisource. Tre possibilità quindi:

  • Si mette il testo al 100% e va bene così.
  • Si cambia la fonte e si porta la SAL a Edizioni Wikisource.
  • Ho detto una cazzata megagalattica e il testo riletto va bene così in Edizioni Wikisource.

A, B o C? Torredibabele (disc.) 20:12, 10 ott 2008 (CEST)

Per intanto la A. Se poi magari riuscissi a mettere le manine su una versione alternativa (magari la traduzione di Turati) e la scansionassi, avremmo la A e la B. dato che è valida la A la C è totalmente errata: non hai detto alcuna cazzata in quanto chiedere è sempre lecito, e il testo riletto così arriva a SAL 100% a meno che tu non abbia in mano l'edizione cartacea del testo di Gori. - εΔω 22:38, 10 ott 2008 (CEST)
Temo che la fonte cartacea del Gori non sia disponibile a comuni mortali; sul sito della Fondazione Feltrinelli la mettevano un po' sul "Questo testo ce l'abbiamo solo noi che siamo dei fighi pazzeschi".
La traduzione di Turati non ce l'ho, nè conosco una fonte attendibile in giro per la rete: avevo avuto modo tempo fa di fare una ricerchina di testi di Marx e altri autori di testi di economia, e stendo un velo pietoso sui risultati ottenuti. È da tempo che penso, per ovviare al cronico problema, di fare una bella fotografata delle pagine di queste opere, ma la ricerca del testo originale e abbastanza vecchio da essere in PD non è sempre fruttuosa... Torredibabele (disc.) 01:21, 11 ott 2008 (CEST)

Buone notizie per l'economia![modifica]

A dispetto del casino che sta succedendo nei mercati finanziari di tutto il mondo, annuncio una grande notizia (almeno per gli appassionati di economia): ho trovato, quasi per caso, su questo sito la scansione della copia cartacea (e un pessimo tentativo di OCR) del "Manuale di economia politica con una introduzione alla scienza sociale" di Vilfredo Pareto, praticamente una delle pochissime opere di autori italiani che hanno avuto una influenza importante sulla teoria economica del Novecento.

Si aprono quindi due questioni:

  • Il testo: come potete vedere l'opera è un vero e proprio "mattone" di cinquecento e passa pagine (!), con formule e grafici (questi ultimi apparentemente non copiaincollabili, data la clausola "Non-Commercial" della licenza del sito). La dimensione dell'opera è tale che è bene stabilire alcune cosette a priori. Ad esempio: il libro è composto da nove capitoli più appendice, ma il capitolo più grosso, che ho schiaffato assieme al sommario nella mia sandbox appositamente preparata, si avvicina senza problemi ai 300kb, senza considerare le formule e le figure (tantissime); può essere un problema per il lettore? È meglio dividere ciascun capitolo in gruppi di paragrafi seguendo il sommario originale (anch'esso pubblicato nella mia sandbox), oppure stare dalla parte della comodità di lettura e pubblicare ogni capitolo in una sola pagina, confidando nella capacità delle connessioni internet moderne?
Inoltre, se io utilizzo l'orrendo ma non disprezzabile testo OCR come base, cioè correggendo errori basandomi sul testo scannerizzato, il testo finale è licenziabile come GFDL (nel sito originale non ammettono usi commerciali)?
  • Il progetto: la sezione di economia di Source inizia ad avere alcune cosette di un certo spessore. Credo quindi che, se la comunità si mostra d'accordo, si potrebbe dare il via a quel famoso "progetto economia" a cui tempo addietro dovetti rinunciare per mancanza (oltre che di tempo) di testi importanti per giustificare la creazione di un progetto separato. Ora sulla rete si trovano molte più scansioni ed è quindi possibile cominciare a creare un gruppo per organizzare la pubblicazione di queste opere, che spesso non si trovano da nessuna parte digitalizzate.
Un paio di considerazioni:
    • Questione tecnica: Della creazione di un progetto, men che meno dei relativi template, non so nulla, dove per nulla sta anche il fatto che non sono nemmeno consapevole di quali siano conoscenze tecniche necessarie. In parole povere, avrei bisogno di qualcuno che mi desse, almeno all'inizio, una infarinatura delle cose essenziali da sapere; ma magari la cosa non è così complessa e il problema si risolve da solo. Sto provando a dare un'occhiata alla struttura di progetti simili, come quello dedicato alla matematica, per farmi un'idea.
    • Dove inserire il progetto: credo che la collocazione naturale di un progetto di economia sia nell'ambito delle scienze sociali; sarebbe carino realizzare anche un progetto Scienze Sociali dove raggruppare discipline come economia, sociologia, psicologia, scienze politiche, sulla falsa riga del progetto testi scientifici, nella speranza magari di "acchiappare" qualche esperto o appassionato che sappia dove cercare e quali opere pubblicare. Ma forse sto mettendo troppa carne al fuoco...

Torredibabele (disc.) 11:52, 11 ott 2008 (CEST)

Rispondo brevemente: la situazione mi sembra analoga a Google Books, l'OCR noi lo prendiamo ma modifichiamo completamente, e poi l'OCR non dovrebbe essere comperto da diritto d'autore (lo fa la macchina, non c'è un apporto creativo).
Per il progetto Economia, i tempi sono più che maturi, credo tu abbia la benedizioni di tutti. Non so se bisogni prima fare un progetto Scienze sociali, con iPork decidemmo di fare un progetto Testi scientifici come cappello a quello di Matematica, ma non so se ne valga la pena.
Per la divisione i paragrafi, si può sempre fare: inizia con il capitolo intero, a libro finito si fa sempre in tempo a rifinire il testo. Per una mano nella creazione del progetto, per quel poco che ricordo, puoi chiedere a me (ma anche Curi ed Alex lo sanno fare). Ottima idea comunque! ;-) --Aubrey McFato 12:13, 11 ott 2008 (CEST)
Ok, ho iniziato a vedere un po' la struttura del progetto matematica, da cui presumibilmente mi ispirerò. Ho trovato anche qualche pagina di aiuto, quindi con un po' di impegno dovrei essere in grado di cavarmela sostanzialmente da solo. Sto impostando una bozza di pagina qui, vediamo cosa si riesce a combinare... Torredibabele (disc.) 14:51, 11 ott 2008 (CEST)
Congratulandomi per l'ottima iniziativa, colgo l'occasione per suggerire alcuni accorgimenti da seguire nell'infotesto. Poiché il sito in sé gode degli stessi diritti di una qualsiasi edizione cartacea e rilascia in NC il suo contenuto, non segnaliamolo nella fonte, ma inseriamo solo l'edizione (quindi autore, titolo, editore, anno) e la scansione cartacea dell'originale. L'OCR di aiuto non crea problemi se off-line eseguiamo una trascrizione corretta, costruita sulla pagina originale (quindi non un banale copia-incolla). Di questo aiuto alla trascrizione ha già parlato Edo, e sono sostanzialemente d'accordo con lui. Buon lavoro a tutti. :) Xavier121|Talk 16:19, 11 ott 2008 (CEST)
La bozza di pagina principale e' qui, la pagina di discussione e' qui e qui c'e' un esempio di come apparirebbero i vari template relativi ai testi. Consigli e suggerimenti sono ben accolti. Se la comunita' da parere positivo provvedo a varare definitivamente il progetto! Torredibabele (disc.) 09:52, 15 ott 2008 (CEST)

Consigli per un utilizzo didattico[modifica]

Sulle email di wikimedia c'è una ricerca di consigli per un utilizzo didattico. Il motivo occasionale è indirizzato, in particolare, per iniziative in Campania per attività delle scuole finanziate da fondi locali. Forse sarebbe l'occasione per Wikisource di valorizzare la sua immensa potenzialità. Per fare un esempio per tutti: già attualmente la raccolta di testi di letteratura italiana è veramente cosicua. Forse è opportuno ricordarlo e magari fare una paginetta di presentazione. Qualcuno dei wikisourciani ha già risposto, ma forse sarebbe utile anche qualche altro contributo.--Mizar (ζ Ursae Maioris) (disc.) 16:56, 12 ott 2008 (CEST)

Posso citare wikisource?[modifica]

Scusate la mia ingoranza ma... posso citare wikisource su wikipedia? --79.46.115.253 22:00, 14 ott 2008 (CEST)

Caro anonimo, Intanto un caloroso benvenuto, poi una rapida risposta: ! Anzi, dirò di più: Wikisource nacque proprio dall'idea di porre in un progetto apposito quelle fonti che non avevano posto su Wikipedia. Per la maniera migliore di citare Wikisource prova a dettagliare il tuo caso e vediamo di darti le indicazioni più adatte al tuo bisogno. In effetti dovremo scrivere una pagina Wikisource:Citare Wikisource sulla falsariga di Aiuto:Come_citare_Wikipedia. - εΔω 22:18, 14 ott 2008 (CEST)

Grazie mille --79.46.115.253 23:22, 14 ott 2008 (CEST)

Sottoscrivo quello che dice Edo. Se riesci a darci più dettagli potremmo provare a fare meglio: esistono cosine carine come il template {{§}} che permettono di ancorare una citazione su Source ed evidenziarla. Potrebbe fare al caso tuo. --Aubrey McFato 13:59, 15 ott 2008 (CEST)

Eccellente "OCR" per testi antichi[modifica]

Ho pescato un "tool" esterno a wiki che mi ha restituito, in tempi del tutto ragionevoli, un ottimo "OCR" di una pagina de "Il cavallarizzo", con una precisione di oltre il 95% nell'interpretazione dei malefici caratteri italici cinquecenteschi, e nonostante la risoluzione tutt'altro che ottimale.

Immagino che abbiate indovinato quale sia il tool che ho usato.--Alex brollo (disc.) 09:00, 15 ott 2008 (CEST)

Euuhhh... No. :-) Torredibabele (disc.) 09:41, 15 ott 2008 (CEST)
Ma è una cosa per soli iniziati o possiamo saperlo anche noi? :) Xavier121|Talk 10:47, 15 ott 2008 (CEST)
Un paio di virgolette avrebbero dovuto farvi immaginare un trucco... semplicemente ho pubblicato l'immagine di una pagina sul nostro forum equestre, invitando chi voleva a provare a trascriverla.... e ovviamente spiegando bene il progetto, il come e il cosa. La trascrizione mi è arrivata in poche ore (grazie ancora Valchiria!) .... e sono assolutamente certo di aver alimentato in modo "creativo" la curiosità su wikisource. Non temete per il copyright del trascrittore: in quel forum, fin dalla sua fondazione, è scritto in chiare lettere che tutti i contributi di chiunque si intendono rilasciati sotto GFDL. Sono stato previdente. --Alex brollo (disc.) 13:09, 15 ott 2008 (CEST)
Tu sei un genio del male... Ed io che speravo che ci fosse un bello script Python che facesse l'OCR (non sarebbe male avere un nostro bottolo che lo facesse, con un vocabolario italiano, magari editabile). Il buon vecchio fattore umano comunque è sempre la nostra migliore risorsa. Complimenti per la boldaggine, al solito ;-) --Aubrey McFato 13:57, 15 ott 2008 (CEST)
Io sto qui ad angustiarvi perchè un giorno ho messo in wikilist un quesito su dove trovare un buon OCR libero; e qualcuno mi ha menzionato il progetto recaptcha, il genialata su cui si fonda Internet Archive, e dalla scoperta di Internet archive al mio arrivo qui il passo è stato breve. Il progetto recaptcha e il suo successo indicano che l'OCR perfetto non esiste ancora. :-(
Certo, nelle mie fantasticherie ci penso... ma le competenze informatiche per avvicinarsi a questo argomento sono assolutamente irragiungibili. Tuttavia i sogni sono liberi, e il mio ultimo sogno al proposito sarebbe quello di trasformare un testo in un suono e di passarlo a un interprete vocale... lasciamo perdere. ;-) --Alex brollo (disc.) 14:44, 15 ott 2008 (CEST)
Uffa, immaginavo che ci fosse il trucco. In pratica hai "disseminato" il Wikisource:Aiuta Wikisource su un forum... ma ogni espediente è buono per spargere il verbo del proofreading. Pensa a me, che in attesa di ferventi rilettori di economia (Torredibabele... stai leggendo?) per i miei upload estivi di Messedaglia mi sono ridotto a inventare il "lettore sockpuppet". Comunque, giusto per volare alto come ci indica Alex, tengo in cuore due obiettivi ambiziosi:
  • le versioni stampabili dei nostri testi (vale a dire un automatismo che da molte pagine sparse ricostruisca un pdf paragonabile a un ebook accettabile, e
  • le versioni ad alta voce di nostri testi. In questo caso la tecnologia a disposizione c'è già (se ben ricordo Commons ha un limite di upload di 20 MB) e si tratterebbe solo di provare con brevi testi... - εΔω 19:43, 15 ott 2008 (CEST) 18:47, 15 ott 2008 (CEST)
Per il "sogno 1" direi che la strada potrebbe passare per la conversione LaTex ... non sarebbe male se qualcuno, partendo da un bel testo completo, facesse qualche esperimento aggiungendo al testo l'opportuno codice, per un paio di capitoli, prima pagina, risvolti.... Poi, chissà, Python potrebbe farlo automaticamente. In fondo è tutta questione di maneggiare stringhe di testo. Dal LaTex al PDF la strada è breve! --Alex brollo (disc.) 12:19, 17 ott 2008 (CEST)

Problemi Commons sui file djvu? :-([modifica]

Non riesco più a leggere correttamente parecchie pagine del file djvu Il cavallarizzo.djvu. Problemi su Commons? Siccome ho rilevato il problema su pagine che ancora non avevo mai visto, ho immaginato che il file djvu fosse fallato, ho prodotto una nuova copia e l'ho ricaricato, con il risultato di aumentare la confusione e di peggiorare il problema...le pagine che non si visualizzano sono aumentate, e non si vedono neppure da Commons. Tutto bene con i vostri files? --Alex brollo (disc.) 00:24, 16 ott 2008 (CEST)

Al Village pump di Commons mi dicono che sembra ci siano problemi con la generazione dei thumbnail. Approfitto per andare a dormire! --Alex brollo (disc.) 00:48, 16 ott 2008 (CEST)
Stamattina il problema risulta risolto: anzi, il caricamento delle immagini sembra più vispo. Forse hanno lavorato sui server. --Alex brollo (disc.) 07:09, 17 ott 2008 (CEST)

parere su "Pensare da informatico: Imparare con Python"[modifica]

Ho riguardato con occhi wikisourciani Pensare da informatico: Imparare con Python ma prima di caricarlo, a tempo perso, vorrei il vostro parere.

  1. è un libro rilevante:
Quill-Nuvola.svg
«È in assoluto il migliore libro scritto per principianti, libero, disponibile in tutti i formati. Si concentra sul linguaggio di programmazione Python ed affronta praticamente tutti gli aspetti della programmazione, è usato in alcuni istituti scolastici superiori americani. Imperdibile per coloro che si avvicinano adesso a questa disciplina. L'unica critica che si può rivolgere a questo testo è che non è aggiornato con le ultime versioni del linguaggio, però, vista l'utenza a cui si rivolge non è un problema. Chiunque acquisisca le conoscenze tratte da questo libro non avrà alcun problema ad "aggiornarsi"...»
  1. è rilasciato in GFDL
  2. Problema: è una traduzione che non credo sia pubblicata su carta, per quanto sia pubblicata su un sito da giudicare autorevole: https://www.python.it/

Disponibile in vari formati, compreso il formato txt, offrirebbe problemi "un po' minori" nel caricamento, rispetto al mattone su cui sto lavorando adesso. Il senso dell'importazione sarebbe duplice:

  1. sarebbe reso ulteriormente disponibile
  2. incoraggerebbe forse alcuni wikisourciani a approfondire l'argomento

Se la vostra risposta sarà "sì, caricalo" una domanda accessoria: meglio farlo comunque in proofread, o passare direttamente alla versione testuale?

PS: nel sito, sezione libri, troverete:

Quill-Nuvola.svg
«Il consiglio personale di Alex, per chi sia in dubbio relativamente all'acquisto di questi libri ...»

Be', non sono io, aimè... :-( --Alex brollo (disc.) 08:40, 16 ott 2008 (CEST)

A noi interessa, credo, che sia in versione stabile: per molti testi informatici o di cultura informatica l' edizione è un criterio un po' restrittivo (molti articoli di Stallmann non sono stati pubblicati, a quanto ne so io), quindi io sarei per il sì. Come dicevo prima, se il testo non viene ulteriormente modificato (nel senso che non è in continua espansione, hanno un wiki o qualcosa di simile?) credo che potrebbe andare. Inoltre, sognando, sarebbe forse un giorno esportabile in Wikibooks, dove potrebbe essere ulteriormente migliorato e modificato... Ma quelli sono voli Pindarici (è da tempo che penso alla doppia versione, stabile e modificabile, di un libro, ma le restrizioni di entrambi i progetti non l'hanno mai permesso). --Aubrey McFato 10:00, 16 ott 2008 (CEST)
Che dilemma! In effetti la mancanza di un'edizione cartacea è l'unico effettivo ostacolo. Fosse per me non opporrei resistenza. L'unico problema è che questa decisione creerebbe un precedente. O decidiamo che i testi del progetto OpenSource si sottraggono a questa regola (ma il perché deve essere ben chiaro e distinto) o non ne usciamo: la presenza di un testo sul solo web mi ricorda che il web è un ambiente dinamico, e che dunque noi sceglieremmo di riprodurre una fonte suscettibile di cambiamenti o migliorie che non è nostro compito riflettere e sincronizzare qui. Penso che un testo simile sarebbe ideale per Wikibooks, ma lo dico con un groppo in gola. - εΔω 12:19, 16 ott 2008 (CEST)
Non so se possa essere l'uovo di Colombo, ma io leggo anche questo:
Quill-Nuvola.svg
«La traduzione di questo libro è stata un passatempo ed un divertimento. Dato che sicuramente qualcosa non gira ancora come dovrebbe, vi chiedo di mandarmi i vostri commenti a riguardo all'indirizzo a.pocaterra@libero.it. In caso di refusi o imprecisioni ricordate di citare sempre la pagina e la versione di questo documento (versione 1.0b).»
Potrebbe bastarci: l'ottima consuetudine informatica di dare un numero alle versioteni di un testo potrebbe essere un valido e sufficiente riferimento editoriale. Noi pubblichiamo questa versione e se viene cambiata (non è modificabile, è lo stesso traduttore a farlo) pubblicheremo, magari, una seconda versione. Può andare? Mi piacerebbe molto avere un manuale del genere da noi, e la nostra biblioteca potrebbe aprire una nuova sezione: quella della documentazione libera. --Aubrey McFato 13:04, 16 ott 2008 (CEST)
Il valore aggiunto di una ripubblicazione qui c'è, ma è abbastanza limitato. Lasciamo perdere: lo citerò e raccomanderò nel "BarBot" per eventuali wikisourciani interessati. Il libro è veramente bello. --Alex brollo (disc.) 13:59, 16 ott 2008 (CEST)

Il libro rientra nelle policy di wikibooks, infatti il testo è in GFDL, non ci interessa tanto se è una traduzione da un altro libro (una volta pubblicato su Wikibooks potrà essere modificato come qualunque altro libro, a parte capitoli come la prefazione, che sono comunque accettabili – esistono anche per altri libri) ma lo consideriamo come un normale testo didattico con licenza libera (ed è quindi pubblicabile). --Ramac (disc.) 14:28, 21 ott 2008 (CEST)

Io credo che in effetti niente ci impedisca di averne due copie, una aperta e l'altra no. Dato che esiste il numero di versione siamo abbastanza sicuri di una canonicità della fonte. --Aubrey McFato 18:30, 26 ott 2008 (CET)

Aiuta Wikisource e altre robette tecniche[modifica]

Nella discussione sull'OCR "umano" sono saltate fuori un po' di cosette, che riunisco in un unico topic per praticita':

  • Sul fattore visibilita': ci sono alcune pagine a mio parere essenziali per il progetto che potrebbero essere posizionate in maniera piu' visibile. Sto parlando ad esempio, della Pagina delle prove e del preziosissimo Aiuta Wikisource, che come potete vedere, non e' collegata con nessuna pagina facilmente raggiungibile dal novizio (e nemmeno da me, per dirla tutta). Proposta: perche' non mettiamo un link ad entrambe nella riga in alto nella pagina principale, dove si trovano anche i link alle Domande Frequenti, al Bar, alle Avvertenze eccetera?
  • Il Namespace Indice e' chiaramente una figata pazzesca, pero' avrei bisogno di alcuni dettagli sul suo funzionamento, per risolvere alcuni problemi pratici del tipo: perche' qui le immagini scansionate non vengono visualizzate? Dove posso trovare una guida alla creazione degli indici?
  • Sono sicuro che c'era un'altra cosa... ma non me la ricordo piu'! Si vede che sto invecchiando! ;-P

Torredibabele (disc.) 11:14, 16 ott 2008 (CEST)

rispondo per punti
  • Visibilità: +1 su tutta la linea. È da oltre un anno che abbiamo in attesa una nuova pagina principale e non ci decidiamo a terminarla. Facciamolo.
  • le immagini scansionata a volte non si caricano per motivi metafisico-tecnologici di commons. A maggior ragione se (come adesso) i server wikimedia sono lenti come lumache e a volte perfino non caricano le pagine "normali". vale a dire che è un problema momentaneo. P.S. Io ho posto le pagine che ho riletto a SAL 50% perché pur avendole decentemente formattate desidero che qualcuno ricontrolli per bene sia il testo che la formattazione. Una volta verificati questi due requisiti lascio al rilettore la scelta se passare direttamente al 100% (formalmente nulla lo impedisce), o al 75% (costringendo così sé stesso o qualcun altro a dare una ulteriore rilettura).
  • Sarà l'effetto della permanenza all'estero? Aubrey, devo preoccuparmi? :D - εΔω 12:05, 16 ott 2008 (CEST)

Il "Dublin Core"[modifica]

Ho fatto un'incursione in #wikisource su invito di jayvdb e riporto come bottino un bel link: https://en.wikipedia.org/wiki/Dublin_Core . Approfondirò. L'idea di semantizzare dati wiki standard mediante trasformazione xml è piaciuta (adesso gli autori... poi i testi!). Vi tengo informati! nel frattempo ho aggiunto qualche riga a Aiuto:Gestione file djvu per spiegare il mio particolare trucco per il cropping (ritaglio dei margini bianchi) di massa di immagini, Edo l'ha trovato interessante. --Alex brollo (disc.) 10:51, 22 ott 2008 (CEST)

Grande Alex, stai realizzando tutti i miei desideri più segreti! La semantizzazione dei testi e autori tramite XML mi ronzava in testa da quando sono qui... Il mio problema è che non sapevo come fare (cioè, per fare un DTD xml ce la posso fare, ma non so poi come implementare il tutto in Wikisource). Se hai qualche idea o link pratico, mi farebbe piacere. Anche l'idea di #wikisource è buona. Tienici aggiornati! --Aubrey McFato 11:30, 22 ott 2008 (CEST)
Tieni conto, quello che voglio produrre è una buona struttura dati xml; le routine di gestione saranno invece dilettantesche e primitive. Funzioneranno, ma un vero programmatore si rotolerà dalle risate. Tuttavia, se la struttura dati xml è prodotta automaticamente, ed è formalmente corretta (anche se estremamente semplice) , poi qualcuno ci sarà che sa metterci mano in modo un pochino più professionale. Cos'è un DTD :-( ? Parente del DDT? --Alex brollo (disc.) 12:44, 22 ott 2008 (CEST)
Il DTD è la descrizione formale della struttura XML. Cioè, tu metti le tag nell'autore o nel testo, ma il DTD è quel foglio che specifica che una tag è figlia di una'latra che figlia di un'altra ancora: la struttura gerarchica, insomma. Mi sono sempre chiesto perchè non ci siano ancora strutture XML nei progetti wiki, e se effettivamente queste possono essere inserite nel semplicemente nel wikitesto... Ad ogni modo è un aspetto da approfondire. --Aubrey McFato 13:54, 22 ott 2008 (CEST)
Ci ho provato, il parser ignora completamente i tag xml che non conosce: <autore>Alessandro Manzoni</autore>. Niente impedisce di mettere in qualche angolo, "sotto il tappeto", le strutture xml dei dati contenuti nelle pagine, pronte ad essere caricate da un bot ficcanaso. Penso che potrebbero anche essere mimetizzate all'interno di un commento! E infatti... se guardi il codice di questo messaggio ne hai la prova. La struttura dati su cui sto lavorando è:
<autori>
  <autore>nome cognome
     <dati>
         <nome>nome</nome>
         <cognome>cognome</cognome>
         .....
     </dati>
  <autore>
  ......
</autori>

--Alex brollo (disc.) 15:40, 22 ott 2008 (CEST)

La lettura di tutte le pagine Autore, l'estrazione di tutti i dati dei template autore, la loro conversione di massa in xml e salvataggio su file locale funziona, dopo un ultimo litigio con l'Unicode. Ho aggiornato gli script in Utente:Alebot/Scripts. Al momento la gestione di questo blocco di dati sarà eseguita in modo elementare, con ricerca di sottostringhe; ho verificato che python esegue 10.000 ricerche di sottostringa, all'interno della "stringona" xml di 300Kb circa, in circa 5 secondi. La strada è grossolana, ma percorribile! --Alex brollo (disc.) 10:01, 23 ott 2008 (CEST)

Ho ricevuto una mail....[modifica]

... una signora che non conosco mi ha mandato una mail citando le mie traduzioni equestri. E' brasiliana. PORTOGHESE! Ho preparato in pt.source l'indice (la "Galeria") di due libri di Dom Duarte, del 1400, senza alcuna speranza di portare avanti il lavoro... ho lanciato l'audace proposta, senza troppe speranze... sì! Ho trovato una wikisourciana potenziale: nelle chiacchiere di presentazione mi ha chiesto se i testi di wiki possono essere corretti, perchè ogni tanto leggendo trova errori e le dispiace... !!!

L'ho invitata qui per farsi un po' le ossa, e vedere come procedono in pratica i lavori su Il cavallarizzo: ho trovato un po' di difficoltà a spiegare che non si tratta di tradurre, ma di trascrivere paro paro. Sono certo che vedere, e magari partecpare, ai lavori in corso le chiarirà ogni cosa. Scusatemi le chiacchiere ma sono molto entusiasta della cosa! Speriamo bene... --Alex brollo (disc.) 09:54, 23 ott 2008 (CEST)

LOL, sei un pr nato tu. Perfetto, se si trovasse bene avremo un buon ponte fra noi e pt.sorce ;-) Aubrey sloggato 10:53, 23 ott 2008 (CEST)

Wikisource year[modifica]

Quill-Nuvola.svg
«Hello,

A couple of weeks ago, I went to an event organized in Paris by the French Government about "economics of culture". During that event, I mentionned that the French chapter has several ongoing discussions with various museums to set up content partnerships.

Here are two examples of such potential partnerships:

  • a small museum with very old and precious documents. The museum has limited room for access and documents are fragile, so only a few visitors are allowed to look at them. The museum wants to digitize these docs, but has limited technical infrastructure. Opportunity: we host their documents on wikisource and provide them additional visibility through an article on Wikipedia, featuring their

best manuscripts.

  • a large museum already has a digitization procedure for the documents, as well as a hosting service. However, the digitized version contains mistakes (errors generated in the process) and the museum simply does not have the human power to provide the corrections of the numerous documents digitized by their services. Our members can take care of this task.

Wikisources members know all that very well and much better than I. I just summarize that very quickly for reference.

In Europe, at least in some countries, we meet several problems

  • many scholars have a rather bad image of Wikipedia (because written by amateurs, anonymous members, plagued by vandals etc...)
  • the other wikimedia projects have rather poor popularity and would benefit from more "light"
  • journalists are bored and need new information (otherwise, they focus on all the bad stories)
  • some projects are more difficult to advertise than others, because they are full competitors with other commercial projects of very good quality (eg, wiktionary, wikinews...)


Besides, my feeling is that contributors and in particular members from chapters need a project on which they can team.

I would like to propose that next year be Wikisource year.

And since the planet is very large, if this is done in large part through chapters, that it be an opportunity for some european chapters to work together.

I am not necessarily thinking of anything very complicated. Examples of efforts we could make together:

  • leaflets about wikisource updated and available in a large number of languages;
  • webbuttons to advertise the project on the web;
  • each time someone gives a conference about Wikipedia, take the opportunity to spend a couple of minutes of Wikisource as well; distribute leaflets;
  • summarize our best cases on Wikisource;
  • develop stories about these best cases. Illustrate. Feature these stories on chapter websites;
  • develop initiatives on projects for cross project challenges (eg, best article with content improved in at least 3 projects);
  • chapters may write and distribute a couple of press releases about wikisource;
  • chapters may propose conferences about wikisource (and speakers available to talk about it);
  • develop arguments for museums etc...

Measures of success are numerous, from improvements of Wikisource (number of docs), number of mentions in the press, partnerships established with museums etc...

What do you think ?

Ant»

Non male, eh? :-D Speriamo che la proposta si concretizzi. In lista su Wikimedia se ne parla (da cui vi copio-incollo questa), abbiamo proposte noi? Aubrey McFato 09:49, 24 ott 2008 (CEST)

Vi ricordo la proposta di notificare le fonti.... ne abbiamo parlato qui qualche tempo fa, ma non mi sembra che abbiamo raggiunto una risoluzione definitiva. --Alex brollo (disc.) 02:22, 26 ott 2008 (CEST)
Cosa intendi per notificare le fonti? Dire alle persone a cui prendiamo i testi che li prendiamo ;-)? Se intendi ad ogni modo lavorare più a stretto contatto con altre realtà (quali musei, biblioteche, ecc.) credo e spero ci arriveremo presto. Inoltre l'idea di standardizzare e magari semplificare le autorizzazioni per Wikisource è fra le priorità, vedremo di concludere qualcosa. --Aubrey McFato 03:43, 26 ott 2008 (CET)
Si, avvisare chi mette online un testo come immagini che la trascrizione è pronta e ovviamente disponibile. Nel mio piccolo, sono anch'io una "fonte free" e nessuno che utilizzi il mio lavoro (che è stato effettivamente ripreso qua e là e recentemente perfino stampato) ha il minimo dovere di avvisarmi, ma quando mi avvisano, mi fa un gran piacere! --Alex brollo (disc.) 06:38, 26 ott 2008 (CET)

Testi in ladino dolomitico[modifica]

Avrei intenzione di mettere in linea testi in ladino dolomitico, come primo passo per favorire la nascita di wikipedia in lingua ladina. Come wikisource cosa facciamo: Li possiamo collocare qui? Se sì, si può trovare un sistema per raggrupparli e valorizzarli nel loro insieme?

Seconda domanda. I testi di leggi &c in ladino sono disponibili in formato .pdf. Quale è il sistema più semplice per trasformarli per uno come me che non va molto più in là del copia/incolla?--Mizar (ζ Ursae Maioris) (disc.) 06:17, 24 ott 2008 (CEST)

Per la seconda domanda, se vuoi/puoi (copyright permettendo) trasformarli in file djvu per caricarli in Commons e usare la procedura proofread, vedi Aiuto:Gestione_file_djvu#Conversione_da_pdf_a_djvu--Alex brollo (disc.) 10:25, 27 ott 2008 (CET)
Di solito prima nasce la wikipedia e poi la wikisource. A dirla tutta non credo che la presenza di documenti in ladino dolomitico qui favorisca realmente la nascita di una nuova wikipedia. Il vero incubatore di nuove wikisource sarebbe https://wikisource.org. Io resto dell'ìidea che la Wikipedia in ladino dolomitico vada aiutata dove c'è già un suo abbozzo, cioè qui. Ma siccome potrei apparire ostruzionista sentiamo altri pareri. - εΔω 11:37, 24 ott 2008 (CEST)
Nella ml di Wikimedia si stava osservando che in realtà, spesso potrebbe essere utile il processo inverso, ed io mi trovo d'accordo. Dato un Wikizionario o una Wikisource in lingua è più semplice analizzare le differenze fra le varie lingue nelle diverse aree (in questo caso, valli ;-)) e si ha un punto da cui partire. Per me non ci sono problemi ad ospitare qui i testi, se questo significa che inizialmente i contributori possono concentrarsi solo sui testi, e prendere confidenza con il sistema wiki e soprattutto MediaWiki. Per me +1, se ci sonon abbastanza testi poi si provvederà a trasferirli. (in generale, io sono per ospitare tutti i testi di tutte le lingue minori, anche duplicandoli, almeno finchè non costituiscono un problema). --Aubrey McFato 12:20, 24 ott 2008 (CEST)
Non ho mai capito bene il significato di una wikipedia in una lingua minore (la mia: il friulano, per prima), ma vedo con il massimo favore, invece, i progetti wiktionary, wikisource, e wikiquote. Mi sembrano un ottimo punto da cui cominciare, e con contenuti di notevole valore. E' anche più facile, visto che si è liberi dall'ingombrante NPOV. Lascio ai veterani il giudizio sull'opportunità di ospitarla qui, personalmente non vedo problemi. --Alex brollo (disc.) 13:00, 24 ott 2008 (CEST)
Immaginavo di essere ostruzionista e di fronte alla reazione della comunità capitolo quasi con piacere. Però metto avanti una questione su cui desidero chiarezza:
  • Se ci arrivano lunghi testi di leggi o altri argomenti tecnici occorrerà qualcuno che non l'abbandoni a sé stessi ma li formatti e li allinei alle convenzioni dei progetti tematici. Data la pluriennale latitanza di utenti interessati al progetto diritto la domanda appare tutt'altro che scontata. Accettiamo l'eventualità che essi rimangano in un vergognoso stato di abbandono come accade a tutt'oggi per testi come il Codice Civile o il Codice Penale (che ricordo essere tra i testi più consultati di questo progetto)? Al solito, potrebbe essere un falso problema, ma mi piace riceverne da altri conferme motivate. Grazie. - εΔω 18:44, 24 ott 2008 (CEST)

domanda banale[modifica]

in questioni tecniche sono sempre alle prime armi: Alla voce w:Lingua ladina di Wikipedia l'interprogetto a wikisource non funzionava. Ho provato a rimetterlo, ma il risultato non è quello voluto. Qualcuno può usare la sintassi giusta?--Mizar (ζ Ursae Maioris) (disc.) 15:45, 26 ott 2008 (CET)

Fatto. --Aubrey McFato 18:27, 26 ott 2008 (CET)

Finita la trascrizione de Il cavallarizzo, SAL 50%[modifica]

Un brindisi virtuale!!

Io e Wella (e Valchiria che non è un'utente source, ma ha dato un contributo esterno lavorando da dentro un forum esterno a wiki) abbiamo il piacere di annunciarvi che la faticosa trascrizione di Indice:Il cavallarizzo è finita! Alle pagine è stato dato un SAL del 50%, intendendo che a questo punto, contemporaneamente alla rilettura a caccia di erroti di trascrizione, occorre risolvere una serie di dettagli in modo coerente e in accordo con le politiche di it.source. Alcune delle soluzioni adottate - sia nelle pagine Pagina:, sia nella versione testuale - sono abbastanza innovative, e forse, come sottolineava IPork, troppo complesse o esoteriche; questo deriva dal fatto che per noi è stato il primo impatto sia con i problemi di resa di un testo conquecentesco, sia con il dettagliato e raffinato sistema di convenzioni specifico di it.wiki, e abbiamo sperimentato parecchio in base al principio "Siate audaci" (e lo siamo stati, altrochè ;-) ). Adesso è il momento di sistemare le cose; di documentare i dettagli innovativi, di discuterli e di scegliere quali conservare, e quali invece abbandonare adottando lo standard generale.

Vi chiedo: pensate che questa discussione possa avvenire qui, o altrove? E se altrove, dove: in un bar tematico, o semplicemente in Discussioni indice:Il cavallarizzo? --Alex brollo (disc.) 07:57, 27 ott 2008 (CET)

Al Progetto scan (Non ritieni che sia il caso una buona volta di chiamarlo Progetto:Trascrizioni?). εΔω da scuola. 10:54, 27 ott 2008 (CET)
Ma wiki non è quel particolare ambiente... in cui chi vede una sciocchezza la corregge senza tante storie? ;-)
OK... se nessuno lo fa lo farò io! --Alex brollo (disc.) 14:01, 27 ott 2008 (CET)
Grazie a chi ha collaborato; è stata una furiosa e faticosa rincorsa di link e di risoluzione di conflitti di edizione... Visto che è possibile, anche se faticoso, propongo l'ulteriore cambio di nome: dall'attuale Progetto:Scansioni a Progetto:Trascrizioni (come piacerebeb a Edo). Vi va di votare? --Alex brollo (disc.) 09:24, 28 ott 2008 (CET)
Adesso lo dici :-(? Volendo si puó fare, ma progetto Scansioni sottolinea meglio anche il fatto che bisogna avere le immagini, e quindi spesso bisogna produrle. --Aubrey McFato 13:09, 28 ott 2008 (CET)
Ehm... io invece pensavo con tale nome di porre l'enfasi sul lavoro di conversione da immagine a testo d'altronde a meno che non diventiamo una repository di immagini come commons questo è il nostro obiettivo, coinvolgendo nell'ambito del progetto anche quelle problematiche che riguardano immagini in siti esterni (Bibliotecaitaliana come Gallica o GoogleBooks) in cui abbiamo sia scansioni che, soprattutto nel caso di siti esterni, trascrizione. Si tratta di intendersi sull'ampiezza di respiro del progetto. Discutiamone. Se si decidesse di cambiare nome, dopo la sgonbbata di Aubrey, mi occuperò io dell'ulteriore migrazione. :-) εΔω 14:46, 28 ott 2008 (CET)
 :-) :-) Ci stavo pensando, quando ho visto che ormai qualcuno stava furiosamente già lavorando sul rename di massa... mi ci sono buttato anch'io, continuando a spostare e riominare da Scan a Scansioni... nemmeno il tempo di vedere chi era l'ignoto contributore che faticava...
Certo è che se aprissi un altro progetto (e mi guarderò dal farlo) metterei tutte le innumerevoli sottopagine e templates in un'unica pagina, donde le ripescherei con la transclusione selettiva... ;-) --Alex brollo (disc.) 15:16, 28 ott 2008 (CET)
Ho cominciato l'ulteriore spostamento. La parte "esteriore" dovrebbe essere ststa trasferita bene, stasera mi occuperò delle categorie... - εΔω 07:31, 29 ott 2008 (CET)
Di nuovo (stavolta pubblicamente) grazie! Dimmi come posso sdebitarmi, Edo! --Alex brollo (disc.) 13:12, 29 ott 2008 (CET)

Infotesti e discussioni[modifica]

Nell'attuale struttura la pagina discussione dei singoli testi è dedicata all'infotesto, a qualcosa che è estremamente importante e fondante di wikisource, con un carattere di w:ad perpetuam rei memoriam. Negli altri progetti, invece discussioni è il posto, molto informale, dove anche ci si accapiglia, ma soprattutto dove si ha l'opportunità di spiegare il proprio comportamento. Di solito sono tematiche contingenti che a mio avviso distutberebbero la seriosità degli infotesti. Faccio qualche esempio, forse banale. Tra sabato e domenica io ho frequentato due Linux Day (Villa Ghirlanda a Cinisello e Casa del Sole a milano9. In entrambi (e credo in molti altri sparsi in Italia) una parte delle relazioni erano dedicate anche all'open content. In entrambi con relatori diversi, il punto di partenza è stato lo stesso: un intervento della magistratura che ha sostenuto l'applicabilità del reato di stampa clandestina nei confronti dei siti web di contenuto informativo, con la connessa necessità per gli stessi di avere un direttore responsabile iscritto all'ordine dei giornalisti. Probabilmente nei successivi gradi di giudizio la cosa rientrerà, così come è rientrata l'analoga previsione in via legislativa in sede di riforma dell'editoria con il rapido ripensamento del sottosegretario Levi.

Tornando a noi: Nell'infotesto nulla muta del rigore di indicare la fonte cartacea o web ad esempio delle sentenze o dei testi legislativi, ma nel dibattito ci vorrebbe il posto dove spiegare il clima di estrema urgenza di fornire al mondo dell'open content con rapidità e rigore il materiale necessario alla prosecuzione del dibattito.

In sostanza la mia proposta è di nettamente separare l'infotesto, dal dibattito che con tutti i suoi se, i suoi ma, le sue rissosità, può essere l'occasione, per rimanere nell'esempio sopra fatto, di catturare l'attenzione dei sostenitori dell'open content.--Mizar (ζ Ursae Maioris) (disc.) 08:38, 27 ott 2008 (CET)

A fagiolo con il messaggio precedente...
Nel libro che ho trascritto, Il cavallarizzo, la pagina discussione delle pagine Pagina: ha tre diverse aree:
  1. l'infotesto (che fra l'altro devo ancora inserire in moltissime pagine, e che inserirò come template in modo che rispecchi le eventuali modifiche nell'infotesto principale, quello della pagina Indice:;
  2. tutte le annotazioni di trascrizione relative alla pagina, comprese quelle che in altri testi sono inserite col i tag <ref>; facendo così il testo della Pagina: è completamente ripulito da ogni traccia di contributo originale del trascrittore; questa sezione è destinata a essere transclusa nella pagina discussione corripsondente della versione testuale; sto ancora pensando al miglior metodo per automatizzare via bot la transclusione;
  3. le discussioni vere e proprie fra utenti, relative a specifici problemi di resa della pagina, che non saranno transcluse altrove.
Cosa ve ne sembra? --Alex brollo (disc.) 10:10, 27 ott 2008 (CET)
Sono sotanzialmente d'accordo con Alex. Fin dall'inizio le nostre scelte non sono state casuali. Mi riprometto di descrivere meglio tramite un confronto con le altre source. OrbiliusMagister 10:59, 27 ott 2008 (CET)
In effetti, dopo alcune trascrizioni su en.source di testi che comprendevano annotazioni originali (e dove ho fatto largo uso dei ref), affrontando qui un testo senza annotazioni avevo cominciato a usare i ref per annotare qualcosa; poi mi sono reso conto del possibile equivoco e del fatto che stavo introducendo "testi originali"... e ho sistematicamente spostato tali annotazioni "personali" in pagina discussione, dove ho messo anche le note relative a singoli problemi di trascrizione di parole singole, prima estensivamente, poi con minor zelo, incoraggiato da Wikisource:Convenzioni di trascrizione. Recentemente ho utilizzato le pagine discussione anche per i wikilink relativi ad autori citati, ma senza opere pubblicate qui. In ogni caso: la pagina discussione delle pagine Pagina va secondo me valorizzata moltissimo, ben oltre il ruolo di contenitore dell'infotesto. --Alex brollo (disc.) 11:46, 27 ott 2008 (CET)
Per quanto riguarda il ruolo delle pagine Discussione e altri dettagli, proponfo di continuare la discussione qui: Discussioni_progetto:Scansioni#Le_pagine_Discussione_nel_namespace_Pagina: --Alex brollo (disc.) 21:17, 27 ott 2008 (CET)

Codice civile[modifica]

Qualcuno mi sa spiegare questa modifica? E´da tenere? Lúnica cosa che ho trovato in merito é questo: https://www.camera.it/_bicamerali/leg14/infanzia/leggi/art342bis%20cc.htm Ho cmq chiesto informazioni per risalire alla fonte del Codice Civile. --Aubrey McFato 18:40, 27 ott 2008 (CET)

Normalmente chi consulta il codice non vuole sapere quale è il testo che scrisse il legislatore del 1942, ma il diritto concretamente vigente al momento attuale. Il sistema in atto nella maggioranza dei paesi è quello della novellazione, cioè una nuova legge (alla latina novella) modifica qualche parola, qualche articolo ecc. oppure con l'aggiunta di articoli bis, ter quarter, quinquies ecc.é quello che è successo all'articolo 342 che vede aggiunto un articolo 342 bis e uno ter. Il sistema normale usato dagli editori è appunto quello di publicare nel testo la nuova dizione dell'articolo, con in nota gli estremi della legge di modifica--Mizar (ζ Ursae Maioris) (disc.) 19:43, 28 ott 2008 (CET)

Google docs come "tool operativo" per wiki[modifica]

https://spreadsheets.google.com/pub?key=pXFwvJ34HVdPuRBvyufpcBw

Trovate nel link un foglio elettronico con la lista completa delle parole presenti in Il cavallarizzo, ordinate per frequenza decrescente di ricorrenza. Notate le parole evidenziate: sono le più frequenti parole significative (escluse le parole generiche) e sono cavallo, cavalli, pagina (un intruso... da trascurare), tempo, mano, stalla... non sembra difficile indovinare di cosa tratta il libro. Potrebbe essere una tecnica per l'estrazione di vere keywords.

Ritengo Google Docs uno strumento straordinario, e utile anche come "punto d'appoggio" per dati wiki condivisi e loro elaborazione collaborativa. Vi invito, se non lo conoscete, a esplorarne le possibilità. --Alex brollo (disc.) 08:55, 28 ott 2008 (CET)

Licenza e PD[modifica]

Scusate la domanda probabilmente trita e ritrita. Ho appena creato la voce su La farfalletta. L'autore è morto da più di 70 anni, quindi l'opera dovrebbe essere PD. Relativamente alla licenza, in fondo alla pagina capeggia l'avviso "Contenuto disponibile sotto GNU Free Documentation License". Non mi torna. Non si dovrebbe dirlo da qualche parte che è PD? Un po' come su Commons? Non esiste una categorizzazione per licenza? Un template, un bollino, un qualcosa? Grazie e scusate la niubbiaggine. --Amarvudol (disc.) 13:07, 29 ott 2008 (CET)

Odio la questione delle licenze... comunque la mia spiegazione (da mezzo niubbo) è: i contenuti d qualsiasi progetto wiki sono rilasciati con GFDL, limitatamente al contributo che il progetto e i suoi utenti forniscono; nel caso di un'opera PD, ripresa da wikisource, l'opera in sè resta PD, ma viene rilasciato sotto GFDL il contributo originale che, nell'atto di elaborarla, a quella versione dell'opera comunque è stato dato dalla comunità degli utenti wiki. --Alex brollo (disc.) 13:20, 29 ott 2008 (CET)
Alex ha spiegato benissimo. Il testo è sempre PD, è il nostro "lavoro" che è in GFDL. Complimenti per l'ottimo inserimento comunque (ti ho messo anche i versetti giusti come dicevi tu). --Aubrey McFato 13:22, 29 ott 2008 (CET)
Ok, mi è chiaro, grazie. Riflettevo in realtà sulla differenza dell'approccio rispetto a Commons e (in parte) a 'pedia. Per le immagini si deve obbligatoriamente indicare la licenza dell'immagine, anche se non c'è (cioè se è PD). Serve più a noi 'mediani per dire al mondo che il testo/l'immagine/quellochevolete l'abbiamo pubblicato/a perché lo possiamo fare e chi lo "scopiazza" da noi può farlo. Insomma, io una riflessione, sull'opportunità di mettere un template (nella pagina di discussione) simile a questo (con il testo ovviamente diverso) o una mera indicazione PD nel template fonte, la farei. --Amarvudol (disc.) 14:15, 29 ott 2008 (CET)
... ma siccome in source vige la regola : "Niente testi originali" (l'esatto opposto di quella che vige in altri progetti wiki... Commons è "meticcio"), quel template non potremo applicarlo mai... ;-) ... almeno fintanto che l'autore di un testo stampato senza cedere alcun diritto a nessuno vegna e ce lo regali inserendolo personalmente. --Alex brollo (disc.) 14:53, 29 ott 2008 (CET)
Colgo l'occasione per ricordare un particolare fondamentale: l'edizione da cui è preso il testo PD non è, apparentemente, PD. Se non viene dimostrato che si tratta di una ristampa di un'edizione apparsa prima del 1923, ci è interdetta, sia su source che su biblioteca (per la quale non sono ancora scaduti i 20 anni!). :) Xavier121|Talk 15:23, 29 ott 2008 (CET)
Cioè, se la poesia La farfalletta, testo di autore morto più di 70 anni fa, l'ho presa da un libro pubblicato nel 1994 non possiamo ripubblicarla su 'source? Corretto? Dovremmo quindi disporre (o basta citarlo?) una pubblicazione la cui prima edizione risale a prima del '23? Tenendo comunque conto di quello che si dice in Aiuto:Cosa_mettere_su_Wikisource sulla accessibilità della fonte (e sull'opportunita di una scansione)? --Amarvudol (disc.) 19:13, 29 ott 2008 (CET)
Amarvuodol, non è detto. Quello che dice Xavier è molto probabile, ma non ne abbiano nè una conferma nè una smentita ufficiale (cioè da un avvocato ;-)). Ti consiglio di non fare domande sul copyright, perchè siamo un po' nella confusione da qualche mese a questa parte, stiamo cercando di uscirne :-P. L'unica strada per adesso assolutamente sicura è la trascrizione manuale da scansioni di libri (più vecchi del '23), che possiedi o che trovi su internet. Le altre strade sembrano (ma non è ancora detto) avere dei problemi. --Aubrey McFato 19:21, 29 ott 2008 (CET)
Ok, allora taccio per non aumentare la confusione :-) Relativamente al testo che ho inserito chiedo però se è ok (non ha i requisiti di assoluta sicurezza che dici) o se è meglio cancellarlo. Il testo l'ho preso, correggendo una stampa della voce di Sailer di Wikipedia, in biblioteca, segnandomi gli estremi del libro. Non sono masochista, ero lì per altri motivi e mi è venuto in mente di controllare se il testo della poesia che c'era su 'pedia fosse corretto. Ho trovato il libro e ho fatto la verifica. Poi mi son detto: meglio metterlo su 'source che su 'pedia. In rete non ho trovato scansioni di pubblicazioni "sicure". --Amarvudol (disc.) 19:33, 29 ott 2008 (CET)

Quello che hai fatto rappresenta lo stereotipo del perfetto contributo: se tutti facessero come te saremmo davvero a posto. Quindi il mio consiglio è di continuare assolutamente così: soprattutto per testi brevi come il tuo le restrizioni sono minime (praticamente prenderlo dal libro equivale quasi ad una citazione, quindi mi risulta difficile credere che tu non possa prenderla da un'edizione posteriore al '23). A Wikisource interessano moltissimo testi del genere che si possono trovare soltanto in libri, ancor di più in Biblioteca: quindi scatena la fantasia e scova altre perle (sempre in PD, è ovvio), chè ci fa sempre piacere. Anzi, portati una macchina digitale che così inseriamo anche l'immagine :-D --Aubrey McFato 21:46, 29 ott 2008 (CET)

Pur rispettando la posizione di Aubrey, inviterei gli amministratori a mostrare più risolutezza in materia di copyright, dal momento che le regole esistono e sono rispettate da altre source. Questo non vuol dire che si restringerà il nostro campo d'azione; più verosimilmente andrà rivisto in chiave paritaria il rapporto tra fonti e contenuti. :) Xavier121|Talk 21:49, 29 ott 2008 (CET)
Ringrazio per l'invito, ma in presenza di casi non chiari (come l'esistenza o meno di un fantomatico diritto di trascrizione) il rapporto paritario tra fonte e contenuto è una posizione arbitraria che non mi sento di abbracciare senza conferma acclarata giuridicamente. Nel contempo, in attesa di risposte, prima di cancellare testi o di respingere contributori sulla base della copyright paranoia intendo ottenere conferma da parte di chi si occupa di questo. Calma e gesso. - εΔω 08:33, 30 ott 2008 (CET)

Questo sembra interessante Aubrey McFato 10:34, 30 ott 2008 (CET)

Paranoia delirante[modifica]

Se leggo la voce paranoia su wikipedia trovo: psicosi caratterizzata da un delirio cronico basato su un sistema di convinzioni ossessive a tema persecutorio. Ad essere sincero solo il termine de-lira-re descrive meglio la nostra situazione nei confronti delle altre source. Non capisco perché questo barraricarsi dietro il legale di turno quando si tratta di prendere decisioni importanti. Mi pare che non abbiamo aspettato il parere di nessuno per inserire i testi (a parte una democratica discussione preliminare ecc.), in quel momento eravamo in grado di intedere e di volere, ma ora che succede? Il libero arbitrio è morto! Sto analizzando e confrontando tutte le edizioni che possediamo alla luce dei vigenti regolamenti in materia di copyright a disposizione dell'intera comunità. Anche se non esiste un esplicito riferimento al diritto di trascrizione, la difesa di un'operazione intellettuale-meccanica minima è contenuta nel concetto di opera derivata e se anche fosse una forzatura si possono sempre avanzare diritti quando si prende il lavoro di qualcun altro e ci si fa dei soldi ecc. (ti dicono: va bene il testo e l'edizione sono PD ma il lavoro di trascrizione se ci vuoi fare dei soldi fattelo tu da solo senza pescare dal nostro sito... mi sembra più che legittimo...). Ma questo fatto dell'ipotetico diritto di trascrizione è il classico dito dietro cui si nasconde una lacuna clamorosa della nostra biblioteca: il rispetto dell'edizione. Sulle altre source è sistematico (vedi per esempio tutti gli autori alla lettera A della source tedesca!). Poi dal momento che non si perde nulla, e tutto si può archiviare, salvare, spostare ecc. perché questa paranoia conservatrice? Quello che mi preme di più è la coerenza con le altre source, un filo conduttore che le attraversi e le unisca. La nostra situazione ambigua complica il lavoro dei nuovi arrivati che non sanno letteralmente che pesci pigliare. Remiamo dalla stessa parte ma con tecniche diverse. Se pensate che stia facendo un lavoro inutile (ho preso lo spunto da una richiesta di Frieda fatta qualche tempo fa) perché gli ammministratori da quell'orecchio non vogliono sentirci e non sono in grado di andare avanti da soli, ditemelo subito che ritorno al teatro e all'OPAL... :) Un affettuoso saluto, Xavier121|Talk 14:34, 30 ott 2008 (CET)

Ma a dir il vero una domanda mi sorge... con l'immensa massa di opere PD che preme, PD "abbastanza certo", come quelle da Gallica... con il Vocabolario della Crusca in piedi, che da solo richiederebbe uno sforzo straordinario di un plotone di trascrittori... proprio sulle opere con PD dubbio dobbiamo cascare? --Alex brollo (disc.) 15:47, 30 ott 2008 (CET)
Alex, il discorso delle opere con PD dubbio é fondamentale per un principio di ecologia: proprio perché la digitalizzazione dell'universo mondo é cosí vasta, pensare di iniziare a trascrivere soltanto from the scratch é impensabile. Altrimenti si fa come in Fahreneit 451 e ognuno si sceglie un libro e se lo tiene per la vita (io prenoto Borges e la Campo).
Se invece possiamo attingere dal lavoro di altri (come LiberLiber o ClassiciItaliani) si riesce a fare massa critica, ad avere un progetto funzionante ed utile che nel frattempo si occupa anche di trascrivere... Se non sei grosso non ti conoscono, se non ti conoscono non vengono a collaborare. :Credo sa anche un discorso di sopravvivenza (pensa ad un organismo che per sopravvivere deve raggiungere una data dimensione e complessitá..) Aubrey McFato 16:26, 30 ott 2008 (CET)
Hai ragione... ho impiegato qualche settimana a introdurre tre diversi libri in en.source (tutti da Internet Archive, con grossolano ma decente testo già interpretato), e alcuni mesi a introdurne qui uno, e non è ancora SAL 100%. Ne terrò conto nella scelta delle prossime opere. Se vi capita qualsiasi cosa riguardante il cavallo, fatemelo sapere, e intanto reinstallo il mio scanner e vedo cosa combina il mio OCR che non era affatto male.
Sogno per sogno, sono assolutamente convinto che manca l'OCR che fa per noi, un OCR aperto, interattivo, che "impara man mano che lavora" qualsiasi carattere e qualsiasi lingua... ma per quanto sia audace so che è totalmente fuori della mia portata solo pensare a tradurre le idee in pratica, e non ho ancora trovano nessuno con cui parlarne. --Alex brollo (disc.) 19:06, 30 ott 2008 (CET)

Interprogetto[modifica]

Al bar di 'pedia c'è questa discussione. Qual'è il vostro pensiero? Ripropongo qui anche la domanda: E' tecnicamente possibile fare si che Pagine che portano qui possa rilevare anche le pagine degli altri progetti? --Mizar (ζ Ursae Maioris) (disc.) 18:05, 29 ott 2008 (CET)

Lista risorse primarie[modifica]

Regalo: https://www.uiweb.uidaho.edu/special-collections/euro1.html#it. Salvatevi questo link da qualche parte, è una lista di primary resources niente male. --Aubrey McFato 18:59, 29 ott 2008 (CET)

✔ Fatto, Xavier121|Talk 22:01, 29 ott 2008 (CET)

Prince xml - I nostri testi in pdf[modifica]

Molte volte si è discusso sulla necessità/possibilità/auspicabilità di avere accanto alla versione html dei nostri testi anche una versione "scaricabile" in comodi file, ad esempio con formato pdf.

Questo è un servizio offerto anche da altre biblioteche web com liberliber, che a fianco dell'inossidabile txt (che garantisce lunga vita alle trascrizioni), affianca anche altri formati scaricabili, per permettere ai lettori di leggere offline i testi oppure stamparli su carta, che rimane sempre IMO il supporto migliore per la lettura.

Il problema tecnico più volte è stato discusso tra di noi e riemerge periodicamente senza trovare soluzione: come trasformare una pagina wiki in un pdf in maniera automatica?

Alcune soluzioni proposte (come wiki2pdf, o simili) purtroppo non funzionano oppure se funzionano danno risultati pessimi.

Vi comunico che ho trovato questo sito che si occupa proprio di questa nostra problematica: rendere in formato pdf stampabile i contenuti web/html/css.

Tra gli esempi proposti c'è anche Wikipedia, guardate il secondo esempio in questa pagina: https://www.princexml.com/samples/

Potete vedere gli esempi sui pdf di alcune voci (United States, Norway and Soviet Union) tratte da en.wiki e opportunamente processate.

Mi sembra che il pdf prodotto sia di ottima qualità, sarebbe da vedere se funziona anche con i nostri testi di it.source.

Saluti a tutti, --Accurimbono (disc) 10:16, 4 nov 2008 (CET)

Non è un software free, non potrà essere usato automaticamente dal server, ma.... io lo scarico e lo provo! Immagino che non funzionerà con i testi divisi in capitoli, ma potrebbe funzionare con i testi di un'opera transclusi tutti in una singola pagina. Grazie Curi! :-) --Alex brollo (disc.) 10:28, 4 nov 2008 (CET)
Qui c'è un esempio, e qui la pagina. Devo dire che la resa è molto carina, anche se la cosa ideale sarebbe poter "customizzare" il codice sulle esigenze sourciane (eliminare le categorie, o mantenere i template intestazione, per esempio). Sicuramente potremmo inserirlo negli strumenti utili, ma non so cosa si potrebbe fare di più... Una petizione a WMF per installarlo sui server? Peccato, è un bel programma. --Aubrey McFato 10:43, 4 nov 2008 (CET)
Bello! Ma c'è da battere anche la via difficilior, quella del LaTex... nessuno ne sa qualcosa? --Alex brollo (disc.) 12:31, 4 nov 2008 (CET)
Io in teoria ho l'estensione installata nel mio wiki locale, solo che non sono riuscito ad installare Latex... Vedo se riesco a fare qualcosa... Aubrey
Esatto, è free ma solo per uso personale, quindi non si può utilizzare sul server (a meno che non facciamo un accordo o meglio la WMF non voglia rilevare la società! :-) ).
Per personalizzare l'impaginazione credo che si debba agiure sul file css, lo script di esempio riportato sul loro sito è:
prince --no-author-style -s https://www.princexml.com/howcome/2008/wikipedia/wiki2.css \
    https://en.wikipedia.org/wiki/Finland -o finland.pdf
Credo sia sufficiente prendere il file wiki2.css qui, modificarlo a uso e consumo di wikisource, e provarlo con qualche testo a pagina singola al 100%.
Purtroppo non ho il tempo di approfondire, ma ricordiamoci che è un buon punto di partenza.
Ciao a tutti, --Accurimbono (disc) 15:18, 5 nov 2008 (CET)
Mm, interessante quello che dii. Io di css non so niente di niente, ma da profano mi sferruzza la mente l'idea di poter applicare questo principio ad una qualche estensione mediawiki, come wiki2latex... A proposito (alex, parlo con te ;-)) sono riuscito con dolore ad installare latex sul mio mediawiki, e ha provare il pdf. Il risultato non é male, per il testo, ma non sono riuscito a fargli leggere i template (quindi viene uno sgorbio di caratteri all'inizio del testo, non é il massimo). Per ora le mie scoperte si fermano qui.
Quindi, un possibile roadmap (anche e soprattutto a futura memoria) per questa faccenda:
1. Modifichiamo il css per wiki e vediamo come viene.
2. Se viene bene mettiamo il link negli Wikisource:Strumenti utili
3. Se vogliamo essere piú bold, proviamo ad hackerare, con le conoscenze del css, l'estensione Pdf/Latex oppure questa. Aubrey McFato 15:29, 5 nov 2008 (CET)

Una mostra sulle Biblioteche digitali[modifica]

Ho accennato da più parti (credo anche qui al bar) che in occasione dell'inaugurazione della biblioteca di zona 3 a Milano - Città studi, (alle spalle del Politecnico, in via Valvassori Peroni) c'è una proposta di una mostra sulle biblioteche digitali. Si conta di avere il permesso dalla Biblioteca Ambrosiana di riprodurre su pannelli alcune pagine del Codice Atlantico di Leonardo. Come wikisource potremmo fare una scelta di pagine, anche esse da montare su pannelli. Ovviamente bisogna incrociare le dita perchè questa inaugurazione è stata più volte rinviata.--Mizar (ζ Ursae Maioris) (disc.) 16:12, 4 nov 2008 (CET)

Tabella degli autori: nuova versione[modifica]

Mi rivolgo a quelli che fanno "lavoro sporco" e che conoscono bene la Tabella di riscontro degli autori. E' pronta una nuova versione della tabella, per ora in una sandbox: Utente:Alex brollo/Tabella autori. L'idea è quella di ottenere un duplice risultato:

  1. rendere più facile l'aggiornamento "umano" della tabella
  2. automatizzarla, fin dove possibile.

Per quanto riguarda il punto 1, è stato aggiunto, ad ogni autore, il link a una sottopagina che contiene lo schema di un template, che dovrebbe essere più facile da compilare di quanto fosse nella versione vecchia. Il risultato dell'elaborazione del template costruisce una riga della tabella autori, che poi viene transclusa. Domanda: vi sembra opportuno che in tutte le pagine siano ripetute le istruzioni di compilazione, all'interno di un commento? Le istruzioni compaiono nei primi autori della tabella.

Il passo successivo prevede che la tabella sia autoaggiornante, ossia che vengano aggiunti gli autori mancanti e quelli nuovi e che la compilazione dei campi, ove possibile, sia fatta via bot. Per distinguere i campi riempiti automaticamente da quelli riempiti a mano, ci vuole un trucco; io propongo semplicemente l'uso delle lettere x minuscole. Domanda: vi pare sufficiente?

Visto che il lavoro l'ha fatto, in parte, Alebot, gli lascio firmare questo messaggio ;-) --Alebot (disc.) 07:35, 5 nov 2008 (CET)

Mi tocca firmare anche a me, altrmenti il messaggio è mascherato in modifiche recenti... non avevo capito che un bot flaggato non lascia tracce nemmeno quando è usato da un umano. --Alex brollo (disc.) 08:43, 5 nov 2008 (CET)
Parto col trapianto della tabella. Ci metterò un WIP, vi sarei MOLTO grato se mi lasciate qualsiasi commento in pagina discussione. Sposterò in una posizione definitiva anche il template collegato, Template:RiscontroAutore. "Se sbaglio mi corriggerete". --Alex brollo (disc.) 18:56, 5 nov 2008 (CET)
Ti seguiamo ;-) --Aubrey McFato 20:05, 5 nov 2008 (CET)
Trapianto effettuato. In Progetto:Qualità/Tabella degli autori c'è la nuova versione della tabella. --Alex brollo (disc.) 12:24, 6 nov 2008 (CET)

Imbarazzo da vecchia trascrizione[modifica]

Sono molto imbarazzato da una vecchia trascrizione letterale di un manoscritto quattrocentesco, autore w:Dom duarte, re del Portogallo. La trascrizione è stampata in un libro datato 1843. Si tratta di Image:Bem cavalgar.djvu . La fonte è Google books; nè Commons nè pt.source al momento protestano per questioni di copyright, quindi trascuriamo questo aspetto.

Se ho ben capito, devo ragionare analogamente a una traduzione: l'opera su cui si lavora è un libro del 1843. Primo problema: non trovo traccia di un autore, di tale libro. E allora? Come riempio i campi "autore" e "data"? :-( --Alex brollo (disc.) 09:00, 7 nov 2008 (CET)