Discussioni utente:Alex brollo/2011.1: differenze tra le versioni

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.
Ultimo commento: 15 anni fa, lasciato da Pietrodn in merito all'argomento Re: BimBot e Alebot
Contenuto cancellato Contenuto aggiunto
Riga 463: Riga 463:


::Grazie e buonanotte :) --'''[[Utente:Xavier121|<span style="color:orange;">X</span><span style="color:black;">avier121</span>]]'''|'''[[Discussioni_utente:Xavier121|<span style="color:orange;">T</span><span style="color:black;">alk</span>]]''' 00:11, 17 nov 2008 (CET)
::Grazie e buonanotte :) --'''[[Utente:Xavier121|<span style="color:orange;">X</span><span style="color:black;">avier121</span>]]'''|'''[[Discussioni_utente:Xavier121|<span style="color:orange;">T</span><span style="color:black;">alk</span>]]''' 00:11, 17 nov 2008 (CET)

== Re: BimBot e Alebot ==

Ciao e scusa con il ritardo, ma ho avuto molto da fare. Gli script che eseguo con BimBot su Wikisopurce si trovano tutti sull'[[Progetto:Bot/Programmi_in_Python_per_i_bot|apposita pagina]] del progetto Bot. Il mio bot usa la libreria pywikipedia. Ho una copia di tutto il software sul mio computer, per le esecuzioni occasionali, e una sul [http://toolserver.org Wikimedia Toolserver], un server di Wikimedia DE sul quale io ho un account. Lì vengono eseguiti gli script periodici, visto che quel server è sempre online e il mio computer no. Ciao! --[[Utente:Pietrodn|Pietrodn]] · [[Discussioni utente:Pietrodn|blaterami]] 19:00, 17 nov 2008 (CET)

Versione delle 20:00, 17 nov 2008


Aiuto:Roadmap per gli autori

Quando crei una pagina autore segui questa: Aiuto:Roadmap per gli autori. Ciao, --Accurimbono (disc) 10:51, 20 set 2008 (CEST)Rispondi

Tutti gli autori che sto citando sono già presenti in source per avere delle opere, o non ne hanno nessuna. In questo secondo caso non vedo indispensabile una tale complicazione! La cosa essenziale è trovare al punto giusto un wikilink, mi pare. Proverò con un paio di autori tanto per sperimentare la procedura, ma non per tutti. --Alex brollo (disc.) 14:25, 20 set 2008 (CEST)Rispondi
La "roadmap per gli autori" non mi pare tutta questa complicazione, si tratta di mettere due tre info qua e là per facilitare il progetto qualità. Ma se vuoi fare di testa tua, come preferisci, il progetto è fatto di volontari e nessuno è obbligato a fare nulla, ci mancherebbe, il mio era solo un consiglio e una segnalazione visto che la roadmap non è molto nota e purtroppo seguita. Vorrà dire che ci sarà un poì più di lavoro sporco per gli altri. Ciao, --Accurimbono (disc) 10:20, 21 set 2008 (CEST)Rispondi
Ti sento un po' irritato; e me ne dispiace. Mi secca moltissimo lasciare "lavoro sporco" per altri; tuttavia avevo già segnalato l'opportunità di prevedere due procedure diverse per gli autori dei quali ci sono opere in it.s, e di quelli in cui invece non ci sono. La tabella cronologica, e la tabella delle ricorrenze, sono proprio due elementi che penso sarebbe legittimo e logico trascurare, per un uso più capillare di AutoreCitato, nel secondo caso. Mi sono anche imbattuto in un'altra piccola difficoltà: il fatto che nel template Autore il wikilink automatico punti a it.wikipedia soltanto; nel caso di Nemesiano, esisteva una voce su en.wikisource ma non ancora su it.wikisource, e ho risolto il problema inserendo uno stub su it.wiki, rimediando un'altra discreta arrabbiatura facilmente desumibile dalla cronologia della pagina.
Non posso quindi che ribadire la mia idea sull'opportunità di sdoppiare la procedura Autore e prevedere due casi distinti, la procedura semplificata per l'autore SENZA opere su wikisource, che termina con l'inserimento di una voce e del template Autore (effettivamente semplice e molto utile), e una seconda procedura completa, quella descritta nella roadmap, per gli autori di cui esistono opere in source. --Alex brollo (disc.) 12:07, 21 set 2008 (CEST)Rispondi
La proposta di introdurre due procedure distinte per gli autori personalmente non mi trova d'accordo. In ogni caso è una scelta che dev'essere discussa e presa dalla comunità, per cui sarebbe bene che la discussione si svolgesse in un'altra pagina. La mia intenzione era solo quella di segnalarti questa procedura, sentirsi rispondere che è una complicazione che non si intende seguire, non può che provocare irritazione. Per come la vedo io è una complicazione avere 2 procedure distinte per cui vanno fatte 2 pagine di spiegazione agli utenti. --Accurimbono (disc) 17:49, 21 set 2008 (CEST)Rispondi
Non posso che rammaricarmi ancora una volta. Adesso vorrei finire la trascrizione prima possibile: a questo punto non so se è meglio non usare affatto il tl AutoreCitato, usarlo ma in modo incompleto, o completare la roadmap per ognuno degli autori che aggancio. In più, c'è Wikisource:Convenzioni di trascrizione in corso di lavoro, e ancora non discusso e accettato dal gruppo, per quanto ritengo che l'autorevolezza di Edo sia tale che gran parte delle sue proposte saranno accettate senza troppe discussioni. E se qualcosa venissi cambiato, mi sentirei obbligato a ripassare da cima a fondo tutta la trascrizione... :-( --Alex brollo (disc.) 18:00, 21 set 2008 (CEST)Rispondi
Mi permetto di inserirmi.
Le due procedure diversificate non credo aiuterebbero, mi sembra anche a me un'inutile complicazione.
Sul fatto di utilizzare il {{AutoreCitato}}, tu usalo e basta: vale molto più la pena avere un link utile piuttosto che del lavoro sporco. (sottolineo però l'utile ;-))
Riguardo alla complicazione della procedura, è vero e finchè non la cambiamo lo sarà sempre. Io stesso sono stato il primo ad introdurre la tabella degli autori (poi iPork l'ha resa quello che è), ma poi me ne sono quasi subito pentito: è utile ma lontanissima da essere user-friendly, è lunga e complicata, è noiosa.
Io sono il primo a non usarlo, con la coscienza pesante, però. Non faccio una buona cosa, ma tant'è, ognuno ha le sue priorità. Che poi Curi si indisponga un pochino, secondo me ha ragione: se sei nel "torto" almeno non cambiare le procedure :-P
Scherzi a parte, se riesci a trovare una modalità più automatica di farlo, tanto meglio. Per ora siamo messi così, gli autori di Source avrebbero bisogno di una rivoluzione. --Aubrey McFato 22:45, 21 set 2008 (CEST)Rispondi
Ho oltrepassato la soglia del 50% della trascrizione, la velocità con cui procedo lentamente aumenta, appena finito mi prendo una bella pausa e riconsidero tutta la questione. Al lavoro! --Alex brollo (disc.) 23:17, 21 set 2008 (CEST)Rispondi

Complessitá nascosta?

Ti chiedo una caxxata. Ma tutte queste sezioni si possono incorporare nel template, oppure andrebbero scritte per ogni pagina autore? Perché io vedo questa cosa con molto interesse, e l'unica cosa che mi preoccupa é quanto si vedano quei codici.
Perché le pagine autore sono ridondanti e complicate (come struttura), ma se ci pensi, per l'utente che si vede un template del genere davanti sono abbastanza intuitivi (almeno i parametri sono in linguaggio naturale).
Pensare di inserire tag o similari (magari con dei <noinclude>) nei template nasconde la complessitá dove puó stare, in posti nascosti all'utente. Questo dovrebbe essere la nostra direzione maestra. Tutto ció che va verso questo é benvenuto. proviamo a pensare ad un modo per nascondere i codici all'utente: é possibile? Aubrey

D'accordissimo. Tutti i codici devono essere ben nascosti all'interno di templates: sia in scrittura dei codici sezione, che in richiamo delle "variabili". Ma prima mi serviva avere un codice manuale funzionante. Adesso ci provo. --Alex brollo (disc.) 20:01, 22 set 2008 (CEST)Rispondi
Peccato per le sezioni all'interno del template, ma immaginavo fosse così. Con iPork a suo tempo ne avevamo accennato: purtroppo MediaWiki non è semantico, non permette di stabilire relazioni direttamente fra i parametri di un template.
L'unica soluzione apparente era far passare un bot periodicamente che leggesse con espressioni regolari i template infotesto, e fargli compilare direttamente una tabella.
Ora, con gli autori si può fare: se clicchi [ qui] puoi vedere che ogni notte passa un bot ad aggiornare un centinaio di pagine.
Questo tipo di soluzione mi piace fino ad un certo punto: funziona, ma è stupida e spreca moltissime risorse. Per gli infotesti dei libri credo sarebbe imporponibile.
Quello su cui ti ho chiesto di sperimentare è un nodo cruciale del sistema wiki, con limitazioni intrinseche nel sistema.
La possibilità di semantizzare i contenuti, per esempio con tag XML, all'interno dei template, sarebbe qualcosa di rivoluzionario. So dell'esistenza di un SemanticmediaWiki, ma non so altro, le mie competenze sono minime.
Solo che più capisco cosa dovrebbero fare le Biblioteche digitali più mi rendo conto che le bisogna spostarci di paradigma. Per ora stiamo cercando di farlo all'interno di MediaWiki, bisognerebbe iniziare a seguire più in generale le discussioni che si fanno su Wikisource.org e in en.source e fr.source, per capire dove ci stiamo dirigendo.
E' un problema che va oltre la nostra portata, ma noi possiamo continuare a testare il sistema. Spero di non aver detto troppe fregnacce, capisco cosa voglio dire ma non ho competenze tecniche sufficienti per sapere se tutto quello che dico è corretto ;-)
Continuare il dialogo con Vanderberg mi sembra un'ottima cosa, cercherò di seguire gli sviluppi. --Aubrey McFato 11:34, 23 set 2008 (CEST)Rispondi

risp

Ti ho risposto qui e qui. Ciao, --Accurimbono (disc) 14:26, 22 set 2008 (CEST)Rispondi

HISTORIÆ NATURALIS DE QUADRUPEDIBUS libri VI cum æneis figuris

[1]

OK, non è la versione tascabile economica, :) ma visto che sei appassionato di quadrupedi ti può essere utile essere a conoscenza della sua esistenza.

Te la segnalo nel caso non la conoscessi già. Ciao, --Accurimbono (disc) 14:05, 23 set 2008 (CEST)Rispondi

Bellissimo il sito dell'Unibo! Peccato che sia tutto (c)... :( --Accurimbono (disc) 16:20, 23 set 2008 (CEST)Rispondi
Senofonte, ok, se mi capita te lo segnalo! --Accurimbono (disc) 16:55, 23 set 2008 (CEST)Rispondi

Risposta al tuo messaggio

Ti ho risposto qui. Aubrey McFato 11:43, 26 set 2008 (CEST)Rispondi

Sto seguendo i tuoi lavori, solo che non capisco tutto subito ;-) Dato che la tua mente mi sembra sufficentemente sull'orlo del caos' per generare quel tipo di idee che ci piacciono tanto, mi potresti dare qualche feedback sul modo in cui usare tutto questo popò di roba? La prima cosa che mi vengono in mente sono automazioni che possono servire all'utente per navigare, tabella degli autori, indici di opere con riferimenti alla fonte e all'edizione del testo, ricorrenze... Non so neanche come potremmo farli, però credo sia possibile --Aubrey McFato 11:30, 28 set 2008 (CEST)Rispondi
Difficile immaginare tutte le possibili utilizzazioni, certamente qualcosa di più che la semplice "riduzione della ridondanza con aumento della coerenza" che era stato il primum movens (in realtà: la molla era la pigrizia che caratterizza i programmatori, siano professionisti o dilettanti). Se c'è qualche prospettiva veramente interessante, la troverà Vandenberg; aspetto un "parere di fattibilità" da Pietrodn per quello che riguarda l'automazione della cosa via bot. Se la cosa andrà avanti, io farò qualche esperimento sugli autori prima di fare il "salto" sui testi. Una banalità potrebbe essere quella di mettere un po' d'ordine nella marea di template di servizio per progetti e bar (una sola pagina potrebbe contenere, ad esempio, tutti belli allineati, tutti i parametri dello stesso tipo di tutti i progetti, o tutti i parametri di diverso tipo dei singoli progetti). --Alex brollo (disc.) 22:22, 28 set 2008 (CEST)Rispondi

Re: BimBot

Se noti, il template è nella Categoria:Autori-C, penso per colpa dell'esempio nella documentazione. Se fai fuori quella categoria non dovrebbe più toccartelo. Oppure metti {{Nobots}} da qualche parte nel codice del template (non nella documentazione se no non funge!). Ciao. --Pietrodn · blaterami 13:10, 29 set 2008 (CEST)Rispondi

Grazie! Penso che l'autore abbia preso di peso il codice di Template:Autore, mi fiondo a controllare!--Alex brollo (disc.) 16:43, 29 set 2008 (CEST)Rispondi
Verificato; quel template semplicemente chiama Template:Autore il quale genera la categoria. Essendo un template "per gioco", privo di utilità pratica (è puramente "ricorsivo", non fa che ripresentare i dati tratti dallo stesso template originario!), lo lascio al suo destino .... fra l'altro, il template Nobots non è ancora implementato di source, si vede che non se n'è mai sentito il bisogno. Grazie! Piuttosto, sono estremamente interessato alla fattibilità dell'automazione via bot della creazione della sottopagina dati di cui ti ho chiesto in pedia. Stasera genererò a mano qualche pagina Dati, tanto per avere qualcosa su cui sperimentare delle viste tabellari dei dati. --Alex brollo (disc.) 21:14, 29 set 2008 (CEST)Rispondi

Re: Ho finito il Libro Secondo!

Ti ho risposto qui --Wella (disc.) 00:13, 1 ott 2008 (CEST)Rispondi

Ciao Alex, so che non vedrai la differenza, ma parto per una settimana e torno Lunedì prossimo. Riprendo a scrivere appena torno. --Wella (disc.) 02:13, 7 ott 2008 (CEST)Rispondi

Bottoli

Se vuoi un cosnsiglio, ti consiglio di sperimentare per primo il bot infotesto.py. Basta dargli il titolo dell'opera e fa tutto da solo, difficile fare danni. Potresti sperimentarlo sul cavallerizzo, magari, dato che necessita di pagine infotesto. Continuo a darti qualche tip banale ma forse non inutile: i bot quasi sempre ti chiedono cosa vuoi fare, prima di partire. Buona norma dunque è spingere y la prima volta, andare a controllare nelle Ultime modifiche (clicca su mostra i bot) e vedere quello che il tuo bot ha effettivamente fatto. Se la cosa va bene per le prime tre/quattro pagine, puoi tranquillamente passare aad a, cioè all, cioè continua lui da solo senza bisogno del tuo aiuto. La maggior parte dei bot ha un funzionamente di questo tipo. --Aubrey McFato 00:52, 3 ott 2008 (CEST)Rispondi

No, non voglio un consiglio: ne voglio moltissimi! Grazie! Approfitto per chiederne alcuni.
  1. ho chiesto a Edo (burocrate) l'attivazione/approvazione. Immagino che un bot possa girare anche senza, ma che venga immediatamente bloccato. Giusto?
  2. quando dici "bot infotesto" intendi "script infotesto fatto correre sul mio bot", giusto?

--Alex brollo (disc.) 07:09, 3 ott 2008 (CEST)Rispondi

Esatto a tutte e due le risposte. Il flag serve soltanto per non far visualizzare il bot nelle Ultime Modifiche normali (altrimenti si flooda e non si capisce più niente).
Si, con abuso di linguaggio dico bot infotesto. In realtà tu lavori sempre e solo con gli script, e il bot è un'utenza come un'altra. L'infotesto.py è uno script semplice, difficile che faccia danni, è ottimo per iniziare. Altro tip: come ti ho già accennato tutto gli script hanno caratteristiche comuni. Hanno spesso comandi (tipo -regex, -file, -namespace ...) che servono a fare loro il lavoro. Con -file:PATH/FILE.txt tu dici al tuo script di svolgere le sue attività in quelle pagine che tu hai copiaincollato in FILE.txt. E' molto più sicuro che fargli prendere le pagine in altro modo, perchè le puoi vedere e controllare.
Io uso sempre quello: se devo far girare il bot sulle poesie del Porta, vado nella testo del porta, clicco modifica, e copioincollo l'indice delle sottopagine nel mio FILE.txt. Se ci sono i {{Testo}} cerco-sostiuisco con le normali parentesi quadre "[[]]". Fine, ora il tuo file è leggebile dal bot e lo stesso bot prenderà le pagine una ad una. Nel terminale vedrai ogni mdofica che il bot fa, ricordati le sacre parole "CTRL+C" che fermano lo script ed il gioco è fatto.
Per la lettura, puoi in realtà fare quello che vuoi, noi non possiamo controllare niente, dato che non agisci in scrittura. Aubrey McFato 14:25, 3 ott 2008 (CEST)Rispondi
Quello che tu dici è giusto, soprattutto il fatto che non si è compiuta del tutto l' analogia che citi. Il fatto è anche che però così si sarebbero generate un numero incredibile di sottopagine (4,5 per autore) e tutto ciò sarebbe stato insostenibile. Una soluzione del genere io la escluderei a priori, mi sembra quella meno elegante e più a forza bruta, fra l'altro meno sostenibile. Se si aggiungesse un parametro bisognerebbe rigenerare tutte le sottopagine... IPOrk ha utilizzato la semantizzazione da bot, senza che però comprendesse appieno che semantizzazione era la parola cruciale... In quel momento si pensava soltanto agl i indici di navigazione, e stava lavorando su quello. Credo si tutto una questione di comeptenze: tu conosci il python e subito ti è venuto in mente tutto lo strascico di possibilità che queesto comportava (oltretutto conosci i database da tempo, ne sai limiti e potenzialità). Per noi (almeno, per me) è stata un po' una scoperta passo passo, in cui quasi sempre capivo i concetti ma non sapevo come porre le giuste domande per avere giuste risposte. Solo ora capisco cosa intendi con semantizzazione da bot, anche se in un certo senso ci eravamo arrivati un anno fa. I databox e i bot mi sembrano la soluzione ideale. Se si riuscisse a concepèire uno script globale, da far correre periodicamente, sarebbe una cosa magnifica. Per questo però dobbiamo essere in stretto contatto con Pietrdn, è lui che ha accesso al toolserver (cioè da quel che ho capito ha un'utenza in un server particolare che programma le corse dei bot nei progetti Wikimedia a livello mondiale). --Aubrey McFato 00:49, 4 ott 2008 (CEST)Rispondi
Usa un editor che non sia blocco note e codifica i file in utf-8, dovrebbe andare bene.
Per il resto, oggi la tua risposta mi sembra più sensata, sono meno propenso a buttare via la proposta delle sottopagina multiple. Sarà che non mi piace molto perchè non mi sembra elegante, anzi piuttosto ridondante. Ad ogni modo i databox mi paiono a metà strada fra le due, sono un'unica sottopagina e utilizzano sia il bot sia le potenzialità transclusionatorie di MediaWiki... Come avrai forse capito a me piace la sisntesi per cui per questo determinato problema potrebbe essere la nostra soluzione ottimale. Mi piace cmq rivedere i bot con questa nuova potenzialità. Credo che ora potremmo fare delle prove con la tabella autori per renderla più automatica, con i databox. Se funziona facciamo un sondaggio nella comunità e passiamo alla SemanticWikisource ;-) --Aubrey McFato 12:38, 4 ott 2008 (CEST)Rispondi

Maneggio

Gentile Alex brollo, la discussione bar-maneggio manda alla discussione bar-tasso bar. Ci deve essere qualche problema. Volevo inoltre far parte degli utenti del Progetto Cavallo, basta solo che metto la mia firma sotto l'elenco? Grazie :-)--Witchblue (disc.) 18:44, 7 ott 2008 (CEST)Rispondi

Aspirante pythonista

Ti confesso che ci avevo provato; a casa ho il piccolo manuale dell'Apogeo sul Python. Purtroppo io ho un problema fondamentale: non so programmare. Nei miei due esami di programmazione non siamo andati oltre che creare array di numeri e ordinarli in strani modi, e scrivevamo in C. Nel secondo, Algoritmi, la programmazione era in pseudocodice, e l'ho dato esattamente un anno dopo il primo. Questo significa che io possiedo l'alfabeto, qualche cenno di sintassi ed un'ombra di grammatica: non saprei scrivere forse neanche la formula del fattoriale in Python... Ho provato a dare un'occhiata ai tuoi script, ma ne capisco il 5, forse 10%. desiderei molto (ri)fare un corso pratico di programmazione, in cui mi si chiede ed insegna di fare qualcosa di serio ed utile. Per ora sono solo un aspirante geek, ma chi sa che il caso non mi porti a studiare davvero il Python (mi piacerebbe molto, davvero). Comunque adesso sono alle prese con delle materie molto interessanti, come Information architecture, e forse anche Source potrà giovare di queste nuove competenze che mi sto costruendo. --Aubrey McFato 12:07, 8 ott 2008 (CEST)Rispondi

Bot flaggato

Caro Alex,

domani non so se riuscirò a collegarmi, e visto che non ci sono particolari impedimenti, in un empito di spregio delle regole, ho accordato il flag di bot con un giorno di anticipo. Buon lavoro al tuo bot. - εΔω 19:23, 9 ott 2008 (CEST)Rispondi

Grazie! Almeno quando mi collego in lettura non comparirà più quella scritta minacciosa, che mi dice che sto collegandomi con un bot non flaggato! Spero tu abbia apprezzato che sono stato strettamente di parola! --Alex brollo (disc.) 19:28, 9 ott 2008 (CEST)Rispondi

Da scuola

Caro Alex,

probabilmente ci stai già pensando, io ti metto solo il contesto di premessa e conseguenza a quanto sto per scrivere: la pagina Progetto:Qualità/Tabella degli autori è sempre stata compilata a mano, e serviva principalmente per ricordare a chi fa lavoro sporco di dare una controllatina dove c'erano "buchi" e per dare un aggiornamento periodico anche ai dati già acquisiti (di qui la datazione dei vari controlli). Solo che, con la crescita del progetto a parità di mani che digitano, la pagina non è rimasta aggiornata e dunque per quanto utile non è "sincronizzata con la realtà". Nel frattempo però sono arrivati i bot e le routine periodiche, e quello a cui in diversi stiamo aspirando è una riproposizione di tale pagina aggiornata a suon di bot e transclusioni di dati. Ecco dunque che tu ci arrivi a fagiolo. Un grande favore che potresti fare al progetto è proprio una reimpostazione di quella pagina fino a renderla di nuovo utile per il lavoro sporco (in cui cioè rimangano in evidenza i "buchi", ma confidando nell'aggiornamento automatico e non manuale). Probaiblmente ci stai già pensando, sappi solo che in diversi ci stavamo pensando senza riuscire a risolvere il problema. εΔω da scuola 10:58, 10 ott 2008 (CEST)Rispondi

Sì! Il primo problema che voglio risolvere è proprio automatizzare (fin dove è possibile) quelle tediose, e generatrici d'incoerenza, parti della roadmap autori che silenziosamente gli utenti saltano. Ovvio che Progetto:Qualità/Tabella degli autori è la più ostica, in quanto per definizione richiede interventi umani; la difficoltà sta nel preservare tali interventi dalla devastazione automatica, ma è solo un problema di pensarci bene. Il grande vantaggio di operare via "bot semantico" è che produce un testo piano (non ha bisogno di richiamare templates intermedi). Penso che un buon trucco sia quello di evidenziare in qualche modo, trasparente o visibile, le parti della pagina generate via bot, permettendo così di identificare, e preservare, il contributo umano. Paradossalmente, le tabelle cronologiche e le tabelle ricorrenze sembrano meno irte di trabocchetti, e più facilmente automatizzabili completamente, perlomeno per quanto riguarda "nasce" e "muore".
Per ora Alebot andava a mezza forza, perchè non riuscivo a memorizzare dati in file locali: dovevo tenere tutto in variabili di memoria. Finalmente e lentamente ho risolto il busillo e questa limitazione non esiste più! Si aprono belle prospettive. Mi scuso se ho dimenticato parte della promessa (chiedere PRIMA di scrivere qualsiasi cosa con Alebot), ma mi serviva assolutamente la verifica di aver capito questo punto. Penso comunque che per un bel po' tutto l'output di Alebot andrà in sottopagine di Alebot, e poi verrà ricopiato a mano nelle pagine giuste. Comunque l'avventura è estremamente ricca di soddisfazioni perchè posso unire tre passioni: programmazione python, wiki e cavalli... tripla motivazione ;-) --Alex brollo (disc.) 11:17, 10 ott 2008 (CEST)Rispondi
Ottimo. La tua prudenza sia per noi fonte di tranquillità. Per le questioni tecniche ti lascio nelle mani di Aubrey. Buon debugging. - εΔω 22:28, 10 ott 2008 (CEST)Rispondi


Frascherie! sì

Caro Alex,

Mi esaudisci un gran desiderio che non avrei saputo mettere in atto: via col croppo e galoppo :D - εΔω 13:20, 21 ott 2008 (CEST)Rispondi

Di certo non sarà l'ultimo caso. Se hai modo di annotare in una pagina d'aiuto il procedimento consegnerai il segreto akla posterità. - εΔω 17:14, 21 ott 2008 (CEST)Rispondi

Sperimentazione... adelante con juício

Caro Alex,

come per i precedenti casi (Giulio Cesare), dato che quello che stai allestendo è un cambiamento di grande portata, secondo una prassi già sperimentata, preferirei che effettuassi un paio di operazioni di prova (con o senza bot non è essenziale) giusto per far capire "in pratica" con alcuni esempi anche ai non addetti ai lavori cosa stai muovendo. Dato che poi parte delle operazioni non è "online" è molto molto importante che i passi operativi siano documentati. Finora in questo ti stai muovendo egregiamente. Dunque battezza pure il bot con un autore, magari usando se serve Template:Autore/Sandbox.

Infine occorrerà riflettere sull'usabilità di questa procedura. Purtroppo rispetto ad Aubrey afferro una parte inferiore di tutto quello che stai preparando, ma da una parte mi fido di lui quasi ciecamente e dunque sono ottimista, in secondo luogo, se l'operazione è vincente e utile, troveremo pur la modalità con cui renderla user friendly, che so, a suon di template o di automatismi. Insomma, probabilmente mi sto scaldando inutilmente, ma mi piace impersonare la voce dei niubbi impauriti. - εΔω 21:19, 22 ott 2008 (CEST)Rispondi

Ok, massima prudenza. Questa che segue da qui : : a qui (compresa nello spazio fra la coppia di due punti) è la modifica che apporterei alla pagina Dati, immaginando di scrivere la struttura xml completa dei dati relativi a Alessandro Manzoni.--Alex brollo (disc.) 21:41, 22 ott 2008 (CEST)Rispondi

Ti spiego: sarebbe importante che queste cose le facesse Bimbot per il semplice motivo che lui può essere automatizzato, cioè fare le cose ogni notte alle 3 sfruttando i server nel loro momento di minor domanda (credo). AleBot sei tu (o sono io, se implemento lo script che hai scritto), e tu dovresti farlo partire "a manina" ogni volta. Non credo che ne valga la pena. Ad ogni modo, Bimbot non dovrebbe avere problema ad innestare la tua procedura, credo: basta aggiungere il tuo script. Quello che un giorno sarà interessante fare sarà cambiare lo script attuale di Bimbot, che prende gli autori dalle categorie e li incolla negli elenchi aggiornati, e utilizzare in quella procedura gli strumenti che tu ci hai fornito, rendendo quella procedura più semantica. Stai facendo un gran lavoro, secondo me, anche se non ci capisco come vorrei. Il mio manualetto Python me lo sono portato ad Oslo, ed ogni tanto leggo qualche pagina, ma ci sarebbe da studiare ;-)

Qui ti incollo quello che facemmo i primi giorni, in un workshop su XML (la prima volta che ne ho sentito parlare, in realtà) Dovevamo produrre un documento XML che prendesse i dati di una book review, osservando varie book reviews su Internet ed estrapolando una possibile struttura.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!DOCTYPE article SYSTEM "http://bibin.hio.no/~s153420/Book_review.dtd">
<!--COPY THIS! -->

<!-- <tag></tag> -->


<article>
	<article_title>In the name of God</article_title>
	<article_subtitle></article_subtitle>
	<reviewer>
		<first_name>Andrea</first_name>
		<family_name>Zanni</family_name>
	</reviewer>
	<newspaper>La Repubblica</newspaper>
	<url>http://www.larepubblica.it</url>
	<date>
		<day>Wendnesday</day>
		<month>August</month>
		<day_number>20</day_number>
		<year>2008</year>
	</date>

	<book number="b1">
		<title>Singularity: Post-modernism, Democracy and the Far West</title>
	<!-- <authors> -->
	        <author>
	        	<first_name>Ahazir</first_name>
	        	<family_name>Bernardini</family_name>
	        </author>
        <!-- <author>
         	<first_name></first_name>
         	<family_name></family_name>
             </author>     	     
	     </authors> -->
      		<year>1653</year>
      		<publisher>Pocket Books</publisher>
      		<edition>2</edition>
		<genre>Sci fi</genre>      		
		<price>1008.99 NOK</price>
		<pages>3</pages>	
      		<isbn>1-55860-790-0</isbn>
                <tags>
			<tag>sci fi</tag>		
			<tag>post modernism</tag>			
			<tag>review</tag>
		</tags>
      		<image href="http://static.guim.co.uk/sys-images/Books/Pix/covers/2008/08/14/reconciliation1.jpg"></image>
      		<online_shop href="http://www.guardianbookshop.co.uk/BerteShopWeb/viewProduct.do?ISBN=9781847393197%22">Buy here!</online_shop>
    	</book>
	
	<text> 
		<paragraph>“Culture is intrinsically unattainable,” says Sartre; however, according to 
		Dietrich<ref href="r1">[1]</ref> , it is not so much culture that is 
		intrinsically unattainable, but rather the rubicon of culture. But neodialectic 
		materialist theory holds that the goal of the writer is deconstruction. Many 
		narratives concerning libertarianism exist.</paragraph> 

		<paragraph>Therefore, Baudrillard’s model of neodialectic materialist theory suggests 
		that sexual identity has intrinsic meaning, but only if the premise of 
		Debordist image is invalid. Hamburger<ref href="r2">[2]</ref> states that we have 
		to choose between the postmodern paradigm of expression and cultural 
		capitalism. </paragraph> 
		<paragraph>In a sense, an abundance of discourses concerning the paradigm, and some 
		would say the fatal flaw, of subconstructive society may be discovered. If 
		libertarianism holds, we have to choose between neodialectic materialist theory 
		and capitalist desituationism. </paragraph> 
	<!-- <p> is HTML -->
	</text>
		<references>
			<reference number="r1">
				<title>Predialectic Discourses: Libertarianism in the works of Madonna.</title>
					<subtitle>How could wash your teeth before brushes?</subtitle>
				<author>
					<first_name>Orlend</first_name>
					<family_name>Dietrich</family_name>
				</author>
				<publisher>University of Illinois Press</publisher>
				<year>2018</year>
			</reference>

			<reference number="r2">
				<title>Libertarianism, capitalist theory and feminism.</title>
					<subtitle>A weird path into Norvegian madness</subtitle>
				<author>
					<first_name>Hamburger</first_name>
					<family_name>McDonalds</family_name>
				</author>
				<publisher>Panic Button Press</publisher>
				<year>1918</year>
			</reference>
		</references> 
</article>


<!-- he has written a tag <reviews> with 4 reviews inside. <paragraph>, <translator>, <quote>, <url>
When you have a text with some tags inside, that's a mixed content. (i.e. text with <quote> or <author>).
-->

Questo invece è il famoso DTD,

<!ELEMENT article (article_title, article_subtitle, reviewer, newspaper, url, date, book, text, references)>

<!ELEMENT article_title (#PCDATA)>

<!ELEMENT article_subtitle (#PCDATA)>

<!ELEMENT reviewer (first_name, family_name)>

<!ELEMENT first_name (#PCDATA)>

<!ELEMENT family_name (#PCDATA)>

<!ELEMENT newspaper (#PCDATA)>

<!ELEMENT url (#PCDATA)>

<!ELEMENT date (day, month, day_number, year)>

<!ELEMENT day (#PCDATA)>

<!ELEMENT month (#PCDATA)>

<!ELEMENT day_number (#PCDATA)>

<!ELEMENT year (#PCDATA)>

<!ELEMENT book (title, subtitle?, author, year, publisher, edition?, genre?, price, pages?, isbn?, tags, image, online_shop)>

<!ELEMENT title (#PCDATA)>

<!ELEMENT subtitle (#PCDATA)>

<!ELEMENT author (first_name, family_name)>

<!ELEMENT publisher (#PCDATA)>

<!ELEMENT edition (#PCDATA)>

<!ELEMENT genre (#PCDATA)>

<!ELEMENT price (#PCDATA)>

<!ELEMENT pages (#PCDATA)>

<!ELEMENT isbn (#PCDATA)>

<!ELEMENT tags (tag)+>

<!ELEMENT tag (#PCDATA)>

<!ELEMENT image (#PCDATA)>

<!ELEMENT online_shop (#PCDATA)>

<!ELEMENT text (paragraph)+>

<!ELEMENT paragraph (#PCDATA| ref |term | quote)*>

<!ELEMENT references (reference+)>

<!ELEMENT reference (title, subtitle?, author, publisher, year)>

<!ELEMENT ref (#PCDATA)>

<!ELEMENT term (#PCDATA)>

<!ELEMENT quote (#PCDATA)>



<!ATTLIST book number ID #REQUIRED>

<!ATTLIST reference number ID #REQUIRED>

<!ATTLIST ref href IDREF #REQUIRED>

La scritta #PCDATA semplicemente significa il tipo di dati (in questo caso, caratteri normali). Come vedi è una "semplice" struttura gerarchica. --Aubrey McFato 09:50, 24 ott 2008 (CEST)Rispondi

XML e Python

Vedo che la struttura dati che ho scritto è corretta, anche se mancano definizioni e testate. Per il resto non ci capisco molto, ma non importa. ;-)

Alebot ha cominciato a scrivere databox e strutture xml in alcuni autori (ho scelto quelli che iniziano per "Z"); il XML è ben nascosto dentro un commento HTML, così non allarma i niubbi. Vedi: Template:Bernardino Zendrini/Dati. Se vuoi copiare i dati e giocarci per esercizio, sarebbe una bella cosa. Nulla in contrario all'incorporamento degli script in BimBot... ma è meglio che l'innesto lo faccia qualcun altro.

Per Python un suggerimento: si impara provando, non studiando! E' un linguaggio interpretato, a riga di comando: tu chiedi, lui esegue .... tu sbagli, lui brontola chiaramente e subito. :-) --Alex brollo (disc.) 10:13, 24 ott 2008 (CEST)Rispondi

aggiungo... e se aprissimo da qualche parte. magari in un bar poco utilizzato, una piccola "scuola di python"? Io avrei qualcosa da insegnare, ma tantissimo da imparare! --Alex brollo (disc.) 11:08, 24 ott 2008 (CEST)Rispondi

Immagini e reticenza su Capolettera e simili

caro Alex,

intanto grazie per l'attenzione ad Abati (e al mio lavoretto). Però accetta con la dovuta ironia una gentile bacchettata: le immagini di sicura licenza libera caricale su commons... ma come si fa a sapere se sono libere se tu che le crei non apponi loro alcuna licenza? Questo è uno dei pochi pochissimi compiti che nessuno se non il creatore dell'immagine può compiere. Io non mi permetterei di apporre una licenza {{GFDL}} a un'immagne che tu ritenga {{PD-Old}} o {{PD-Utente}}. E se magari, provenendo da un'opera PD che te lo concede, la volessi rilicenziare con una delle varie licenze Creative Commons? Insomma, per le immagini nulla è sottinteso, e in caso di immagini create dall'utente nessuno si può sostituire a lui. Da' una licenza a quei bellissimi fregi e donali a tutto il wikimondo caricandoli su commons.

In seconda battuta eccomi arrivato alla questione dei capolettera. sono realmente combattuto in quanto più volte mi sono detto: "che carine le pagine con le loro immagini ecc. ecc.", in secondo luogo non ho intenzione di imporre ostacoli a browser testuali o a utenti che non siano interessati a croppare/produrre/manipolare immagini. Una soluzione inclusiva di entrambe le esigenze non la vedo ancora (il trucco della lettera invisibile non mi esalta particolarmente). Proverò a vedere cosa accade nelle altre source. - εΔω 11:29, 24 ott 2008 (CEST) Goliardiamo un po'...Rispondi

Cosa aspettarmi, se non burocrazia, da un burocrate?
Scherzo ovvio; certo che le avrei messe su Commons (e tutte raccolte in un djvu) se le avessi incorporate nel libro. Metto nei progetti locali solo immagini di prova o di modesto interesse. Pensavo che il riferimento alla sorgente (e implicitamente alla sua licenza) potesse bastare, ma rimedierò. Quanto al contenuto testuale dei capilettera: prova un po' a fare un copia e incolla su Blocco Note del capolettera e delle parole immediatamente seguenti... la soluzone non era difficile, ma la scopro solo grazie alla tua vis a tergo in questo momento! Purtroppo la la lettera inserita come testo alternativo all'immagine si attacca alle altre solo se non vengono utilizzati i parametri di giusto allineamento (left). :-(
E le altre immagini? I fregi, le figure? Mi rendo conto che la letteratura (chiamata anche le lettere) si occupa delle combinazioni di lettere... ma si affacciano testi in cui le immagini, come dicevo altrove, sono altrettanto importanti. --Alex brollo (disc.) 11:47, 24 ott 2008 (CEST)Rispondi
evidentemente alle figure ci avevamo già pensato e ritengo che i fregi e gli altri ornamenti siano assolutamente benvenuti e raccomandabili. Ma se uno come me non ha particolare inclinazione per il fotoritocco o per le minuzie dell'arte grafica non ritengo uno scandalo che le sue trascrizioni non contengano tali fregi. Si potrebbe pensare a un "laboratorio grafico" sullo stile di quello di Pedia dove tu o altri tagliuzzatori vi occupaste di fornire tali abbellimenti. La presenza delle immagini importanti temo sia legata al possesso o meno della fonte: se noi ad esempio trascriviamo un testo da digitalizzazioni presenti altrove... come facciamo? Io lascerei ampia libertà secondo il seguente climax
  • Ideale: se su commons accettasserol'estrazione da una scansione altrui di una porzione limitata (la famosa immagine) saremmo a cavallo. Io così su due piedi direi di no, ma su commons hanno maggior esperienza e competenza su questi cavilli.
  • megagalattica. Un novello emulo di Michelangelo riproduce in maniera credibile l'immagine di sua mano, se questa è riproducibile, con i già discussi rischi di soggettività estetica.
  • stile Ponzio Pilato: si crea un template che avverte della presenza di un'immagine non libera a corredo del testo con un link che rimandi alla pagina web che la contiene
  • stylus vetus: come per moltissime opere tratte da Liberliber, ignoriamo la presenza delle immagini sperando che la comprensione del testo non sia inficiata da esse, nel qual caso si torna a uno dei casi precedenti. - εΔω 12:41, 24 ott 2008 (CEST)Rispondi
P.S.Non è che senza dire niente a nessuno vieni ad asssistere a Fieracavalli a Verona? Se ti fosse venuto il pensierino potremmo trovare la maniera di incontrarci.
Fieracavalli: Ma va? Io cercherò di esserci sabato, per assistere a due seminari: quello di Francesco de Giorgio e quello di Gabriella Incisa. Sto corteggiando entrambi per trascinarli in in qualche progetto wiki: Gabriella ha una fantastica biblioteca equestre...

Silenzio assenso

Caro Alex,

stai interpretando correttamente il mio atteggiamento. IN effetti colgo solo in parte la portata del tuo disegno, e siccome ne intravedo dei grandi vantaggi per Wikisource, non metto bocca dove non sono competente e lascio la palla ad Aubrey che ti sta seguendo dal punto di vista tecnico.

Io di mio ho solo un piccolo appunto riguardante Google Documenti: non sono convinto del fatto di legarci a filo doppio con siti esterni a WMF. A titolo personale raccolgo volentieri il tuo invito e se volessi darmi ulteriori indicazioni usa pure la posta elettronica. ma se il discorso è generalizzato il mio giudizio è quello appena scritto.

Infine rammenta che il progetto Wikisource durerà sicuramente più del nostro impegno su di esso, dunque ad ogni script, ogni procedura di ampia copertura che progetti, discuti, e poi esegui... lasciaci traccia scritta, in modo che posa essere portata avanti anche in tua assenza. - εΔω 16:23, 26 ott 2008 (CET)Rispondi

Ho aperto Google Maps e ho trovato una sorpresa.... il linkaggio automatico di un'iconcina Wikipedia nelle immagini... Comunque. Google Docs è assolutamente eccezionale come tool, e occupare qualche Mby di spazio su Google mi dà meno pensieri che occuparne qualcuno su wiki, soprattutto se si tratta di dati "instabili" di prova. Si tratta in ogni caso di una soluzione temporanea e occasionale. Per quanto riguarda la documentazione dei miei esperimenti: non sono sicurissimo che per ora vadano immortalati... e comunque trovando la persona giusta "trasformare i dati dei template autore in strutture xml", queste 8 parole potrebbero bastare... il come è abbastanza indifferente, potrebbero esserci strade estremamente più brillanti di quella che ho preso io. In ogni caso cercherò di sforzarmi di documentare.. --Alex brollo (disc.) 22:09, 26 ott 2008 (CET)Rispondi

FINE

Complimenti!!! Come ti ho già detto, sono disponibile a darti una mano se lo riterrai opportuno. Fammelo sapere. Ciao --Wella (disc.) 00:28, 28 ott 2008 (CET)Rispondi

Non lo ritengo opportuno: lo ritengo indispensabile.... ;-)
Adesso sto facendo dei "lavori di massa" sul testo, la costruzione delle liste di tutte le parole per la cattura di ogni singola parola probabilmente errata nella grafia; fra qualche giorno, si potrà cominciare a ripassare le pagine per attribuire il SAL 100%... e qui toccherà a te, per gran parte delle pagine, perchè può farlo solo un utente diverso da chi la pagina l'ha creata!
Inoltre: accetto proposte per la prossima opera... --Alex brollo (disc.) 07:04, 28 ott 2008 (CET)Rispondi
Alex, aspetto le tue direttive. Per quanto riguarda il libro, credo che il manoscritto di cui ti ho parlato tempo fa sia molto interessante, ma purtroppo non ho modo di farne una copia, quindi dovrei fartelo vedere: "Trattato sopra il modo di ammaestrare il Cavallo" di Lelio Cinquini (Paolo Merenda, credo, lo abbia trascritto a mano).

Poi ho un altro trattato molto più breve intitolato "Il piede del cavallo. Con Nomenclatura del Dott. Eduardo Chiari - Capitano Veterinario. Stampato a Torino "Unione Tipografico-Editrice - 1901": è un elenco della nomenclatura delle varie parti del piede del cavallo che si riferiscono a delle tavole del piede che si sovrappongono una sull'altra, con vista laterale e da sotto. E' composto di poche pagine, ma sicuramente la parte più interessante sono questi disegni del piede che si sovrappongono. Se vai a Verona potrei portarteli per farteli vedere. Fammi sapere quando vai e se posso vengo lo stesso giorno (basta che non sia di Sabato o Domenica). Ciao --Wella (disc.) 15:43, 28 ott 2008 (CET)Rispondi

Alex, portati una macchina digitale!! ;-) Aubrey McFato 17:03, 28 ott 2008 (CET)Rispondi
Proprio sabato, se vado, penso di andarci... che peccato. Se vado a Verona, non posso perdermi i seminari di Gabriella Incisa e di Francesco de Giorgio... ci andrei apposta... Fai uno sforzo straordinario, Wella, trova il modo di fotografarli, scannerizzarli o almeno fotocopiarli... :-( --Alex brollo (disc.) 19:16, 28 ott 2008 (CET)Rispondi
Ti ho mandato delle foto di alcune pagine del manoscritto e quelle del "Piede del cavallo". Sono foto orrende, ma è solo per capire se sono libri interessanti oppure no. --Wella (disc.) 15:15, 29 ott 2008 (CET)Rispondi
Il libretto sul piede è straordinariamente interessante... il manoscritto è curioso e porrà problemi specifici qui in wikisource; una regola direbbe "niente testi che non siano stampati"; ma... vale la pena di discuterne direi! Intanto li carico in un album web in modo che se ne possa discutere!--Alex brollo (disc.) 15:29, 29 ott 2008 (CET)Rispondi

Finezza (opprie burocrazia vs entropia)

Caro Alex,

fatto trenta facciamo trentuno. Se possibile i nuovi template è meglio siano categorizzati: vedi qui. Potrebbe andare bene Categoria:Template di sistema per le pagine autore, ma non capendo pienamente quello che stai facendo temo che dovrai trovare la categorizzazione corretta autonomamente, esplorando i meandri delle categorie dei template. - εΔω 19:16, 30 ott 2008 (CET)Rispondi

Di frettissima

Da quel che vedo la tabella va bene. Addirittura potremmo togliere la casella del SAL, perché prima significava un'altra cosa. Per il resto agire sulle sottopagine delle pagine autore mi sembra che possa essere una buona idea, anche con gli altri dati fai cosí e mi sembra coerente. Il link alla modifica mi sembra buono, magari riusciamo a rendere la struttura ancora piú user-friendly. ottimo lavoro, secondo me, ma dobbiamo vederla finita per poterla ottimizzare. Aubrey McFato 11:31, 3 nov 2008 (CET)Rispondi

Tabella autori

Caro Alex,

mi sembra che il risultato che si intravede dalla tua sandbox sia ottimo, e per me è pubblicabile tranquillamente, erò ti butto lì un paio di provocazioni: è possibile ordinare gli autori per cognome invece che per nome (come improvvidamente fu iniziato a suo tempo)?

In secondo luogo visto che la pagina di riscontro corrisponde all'applicazione di un template, sarebbe molto interessante, manipolando tale template, creare delle categorie di controllo sulla falsariga di Categoria:Autori senza voce su Wikipedia che entrano in azione quando un dato manca. Oggi questa funzione è svolta dal Template autore solo per alcuni casi, ma il discorso si potrebbe tranquillamente allargare. - εΔω 17:24, 4 nov 2008 (CET)Rispondi

Sì, avevo notato lo strano ordine per nome ... strano ma comodo. Quella tabella è un osso duro. Prima di migliorarla, vorrei essere in grado di farla almeno così com'è. L'ordinamento per cognome - più propriamente per iniziale... ;-) è un obiettivo ragionevole.
Certo, un effetto collaterale di far fare a un bot questo tipo di elaborazioni "semantizzate" è proprio il fatto che una volta che le informazioni ci sono, ci si può fare qualsiasi cosa. Nel mio "sogno", il bot rovista in tutta la pagina autore, la legge e "ci pensa"... a quel punto, l'unica fatica che occorrerà fare è uno sforzo di fantasia. Certo, aggiungere categorie di "dati mancanti" sarà facile. E' questo il motivo dell'entusiasmo di Aubrey - entusiasmo che spero di non deludere. E siamo solo all'inizio, perchè il namespace Autori: è il "caso facile", il bello verrà con i testi.
In questo momento Alebot, con un lavoro più difficile di quello che pensavo, dovrebbe essere riuscito a leggere tutti i dati della tabella di riscontro, e a trascriverli nella sottopagina/template Riscontro di ogni pagina Autore:. Adesso provo a "montare" il tutto in Utente:Alex brollo/Tabella autori... poi vediamo. --Alex brollo (disc.) 22:35, 4 nov 2008 (CET)Rispondi
Fatto; la copia aggiornata completa di Utente:Alex brollo/Tabella autori c'è. Adesso mi prendo una pypausa che c'ho i neuroni surriscaldati ;-) --Alex brollo (disc.) 00:12, 5 nov 2008 (CET)Rispondi

Risposta al tuo messaggio

Ti ho risposto qui. Aubrey McFato 16:10, 11 nov 2008 (CET)Rispondi

Svista mia... Google books

Caro Alex, ti segnalo questa correzione dovuta ad una mia svista, al bar, Xavier121|Talk 10:10, 12 nov 2008 (CET)Rispondi


Da Alebot

Ciao Alex brollo, grazie del messaggio! Al momento non posso far altro che verificare se qualcuno mi scrive e ringraziare chi mi ha scritto. Riprova fra qualche giorno! --Alebot (disc.) 22:45, 12 nov 2008 (CET)Rispondi

risposta

Ti ho risposto da me --Accurimbono (disc) 12:54, 16 nov 2008 (CET)Rispondi

Di frettissima

Specifica che è per Wikisource, secondo me non l'hai scritto e la gente potrebbe non capire. In questi giorni sono fuori uso e non collaboro, ma però ti leggo ;-) --Aubrey McFato 14:22, 16 nov 2008 (CET)Rispondi

Messaggio veramente in fretta... parli del post su meta? :-)
hai senz'altro ragione; preciserò; tuttavia ho seguito un suggerimento di Jayvdb secondo cui l'argomento è di interesse inter-progetto. Una guardata alle pazzesche categorie di en.source mi suggerisce che è proprio una buona idea! Vediamo se la concretizzo. Quell'altra. il "bot parlante", comincia a girare (vedi messaggio successivo a questo ;-) --Alex brollo (disc.) 16:02, 16 nov 2008 (CET)Rispondi

Da Alebot

Ciao Alex brollo, grazie del messaggio!Nel tuo messaggio ho trovato la parola chiave leggi e il link a Alessandro Manzoni; ho letto la pagina. Al momento posso dirti che non vedo nessun aggiornamento recente della pagina: è identica a quella che conosco.

La struttura xml dei dati contenuti è la seguente:

<autore>Alessandro Manzoni<dati><nome> Alessandro</nome><cognome> Manzoni</cognome><iniziali> M</iniziali><altronome> </altronome><pseudonimo> </pseudonimo><reale> </reale><gm_nascita> 7 marzo</gm_nascita><a_nascita> 1785</a_nascita><gm_morte> 22 maggio</gm_morte><a_morte> 1873</a_morte><secolo1> XVIII secolo</secolo1><secolo2> XIX secolo</secolo2><descrizione> scrittore e poeta italiano</descrizione><wikipedia> Alessandro Manzoni</wikipedia><wikiquote> Alessandro Manzoni</wikiquote><wikinotizie> </wikinotizie><commons> Alessandro Manzoni</commons><immagine> Francesco Hayez 040.jpg</immagine><indice> si</indice><testi> si</testi><traduzioni> si</traduzioni><citazioni> si</citazioni></dati></autore> --Alebot (disc.) 16:04, 16 nov 2008 (CET)Rispondi

Domanda

Caro Alex,

ma se avessi bisogno di sapere quante volte ricorra in un qualsiasi testo la parola X o l'espressione Y, cosa dovrei fare? --Xavier121|Talk 23:26, 16 nov 2008 (CET)Rispondi

Al momento, devi contartele. ;-)
Prima o poi invece collegherò il "python word parser" a Alebot, e allora potrai chiedere a Alebot il vocabolario completo di un testo, con le ricorrenze di tutte le parole presenti nel testo. Uno dei problemi è chiarire cosa sia un "testo": al momento, il parser legge il codice wiki delle pagine, non le pagine come appaiono, e quindi non risolve i templates (ossia: non legge i testi transclusi). E non è nemmeno pronta la routine che (dato il nome di un testo) ne risolve la struttura e ne ricostruisce il testo completo. Al momento, ho due distinte routine: una scorre tutte le pagine di un Indice: e ne acchiappa il testo, una seconda, il parser, accetta un blocco unico di testo e lo digerisce. Ho fatto questo su Il cavallarizzo e il vocabolario risultante, riletto e depurato degli errori, gira adesso come vocabolario ortografico del mio Firefox, ma mi sono dovuto ricostruire il testo completo da me (ho fatto una transclusione di massa di tutte le pagine in una sandbox).
Il risultato è questo: http://spreadsheets.google.com/pub?key=pXFwvJ34HVdPuRBvyufpcBw
Insomma: devi avere un po' di pazienza.... ma la strada è aperta. --Alex brollo (disc.) 23:47, 16 nov 2008 (CET)Rispondi
Grazie e buonanotte :) --Xavier121|Talk 00:11, 17 nov 2008 (CET)Rispondi

Re: BimBot e Alebot

Ciao e scusa con il ritardo, ma ho avuto molto da fare. Gli script che eseguo con BimBot su Wikisopurce si trovano tutti sull'apposita pagina del progetto Bot. Il mio bot usa la libreria pywikipedia. Ho una copia di tutto il software sul mio computer, per le esecuzioni occasionali, e una sul Wikimedia Toolserver, un server di Wikimedia DE sul quale io ho un account. Lì vengono eseguiti gli script periodici, visto che quel server è sempre online e il mio computer no. Ciao! --Pietrodn · blaterami 19:00, 17 nov 2008 (CET)Rispondi