Discussioni utente:Alex brollo/2011.1: differenze tra le versioni

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.
Contenuto cancellato Contenuto aggiunto
Qualc1 (discussione | contributi)
m →‎Risposte per script: nuova sezione
Riga 93: Riga 93:


Hi Alex, I'm trying to change my user name from Epousesquecido to Josette (my real name). Can you point me in the right direction to do this here (on it:ws). I will come back to this page to see if you have answered. Thank you. - [[User:Epousesquecido|Epousesquecido]] ([[User talk:Epousesquecido|disc.]]) 18:06, 16 gen 2009 (CET)
Hi Alex, I'm trying to change my user name from Epousesquecido to Josette (my real name). Can you point me in the right direction to do this here (on it:ws). I will come back to this page to see if you have answered. Thank you. - [[User:Epousesquecido|Epousesquecido]] ([[User talk:Epousesquecido|disc.]]) 18:06, 16 gen 2009 (CET)

== Risposte per script ==

Ti ho risposto nella mia pagina ai tuoi messaggi relativi agli script: [[Discussioni_utente:Qualc1#Tre_scriptini_python]] e [[Discussioni_utente:Qualc1#Indicizzazione_python_dei_dump_xml_di_wiki]].
Ciao. --[[User:Qualc1|qualc1]] ([[User talk:Qualc1|disc.]]) 13:56, 18 gen 2009 (CET)

Versione delle 14:56, 18 gen 2009




Ancora di frettissima

caro Alex,

WARNING. tag missing in Pagina:Olanda.djvu/308, cioè tra pag. 296 e 297... ctrl-D subito! - εΔω 21:16, 6 gen 2009 (CET)[rispondi]

È l'ora di Abati

Caro Alex,

Vedremo ben se ho capito qualcosa. Ormai con le Frascherie di Antonio Abati sono a un terzo di opera... quasi quasi faccio il grande passo e, cancellata la versione testuale attualmente esistente, proverei a sincronizzare quanto ho finora inserito in formato proofread con una nuova versione testuale, solo che non mi sono ancora ingegnato a capire tutto il meccanismo dei template accessori che automatizzano la versione testuale... e purtroppo non ho molto tempo per starci sopra dato dall'altroieri è ricomparsa un'infiammazione all'occhio sinistro che mi impedisce di lavorare più di tanto a video.

Grazie per il gran lavoro su De Amicis, che a inserimento finito potrai notificare anche a John per l'aggiunta degli interwikilink. - εΔω 16:19, 7 gen 2009 (CET)[rispondi]

Roba varia

Dovrei avere il tempo di rifletterci con calma. Tu stai andando troppo veloce, ti vedo già in berserk da innovazione ;-) . L'idea del ns Dati mi sconfinfera parecchio. Sarebbe probabilmente la soluzione migliore, lasciando stare il ns template ed avendo un luogo nascosto ma perfetto per l'inserimento dei dati semantici. Potremmo avere un :

  • Dati:TITOLOOPERA
  • Dati:NOMEAUTORE

Per i casi dubbi (es. Galileo Galilei, che è autore ma ha anche un'opera omonima scritta da Favaro) potremmo semplicemente scrivere "Dati:Galileo Galilei (opera)", invece di creare un Dati:Autore:NOMEAUTORE....

Io preferirei Dati:Opera/Galileo Galilei e Dati:Autore/Galileo Galilei. --Alex brollo (disc.) 15:38, 8 gen 2009 (CET)[rispondi]

E' una quisquilia ma mi piacerebbe essere coerenti. L'idea mi piace, davvero.

Per i testi, i dati potrebbero essere quelli della Dublin Core, con lo stesso principio:

  • tutti sono opzionali
  • tutti possono essere ripetuti n volte.

Questa cosa del DC però va studiata bene, non è una cosina così. Provo a spiegarmi. per ora la naostra categorizzazione è stata umana e piuttosto casareccia. Nei casi semplici è ovvio che una persona di buonsenso sa distinguere un titolo, un autore, una città di edizione, ecc. Ma per gli anni è diverso, spesso ci sono incongruenze. Abbiamo solo un parametro "anno", ma dovremmo distinguere fra Anno di pubblicazione, Anno di creazione, anno dell'edizione utilizzata, ecc. Spesso abbiamo informazioni che non riusciamo ad immettere direttamente fra i metadati (e le mettiamo nelle note, o sempre nel parametro edizione).

Qui aiutano le strutture simil-xml: pubblicazione.anno, creazione.anno... pubblicazione.editore, pubblicazione.luogo, ecc. ecc. --Alex brollo (disc.) 15:38, 8 gen 2009 (CET)[rispondi]

Ora, usare il DublicCore come schema di classificazione non è forse difficile, ma non riesco a comprendere bene se possiamo farlo così, in maniera casareccia, e non invece CERCARE I DATI DEI NOSTRI LIBRI DIRETTAMENTE NEGLI OPAC E NELLE BIBLIOTECHE. Questo ovviamente sarebbe uno sforzo enorme, ma mi chiedo se sarà prima o poi necessario. I nostri libri sono quasi tutti preISBN, per cui non possiamo fare affidamento su questo.

A parte questo dubbio metodologico, forse un po' troppo pedante (ma, attenzione, è esattamente questo che ci distingue e ci allontana anni luce dalle "VERE" biblioteche, assieme alla categorizzazione), l'idea della biblioteca semantica mi sembra fattibile. Forse possiamo semplicemente provare con i dati che abbiamo, vedere come va, e poi trasferirici al DublinCore. Riflettiamoci. (Utente:Aubrey)

Penso che lascerò sedimentare le cose per un po', rifinendo e documentando quello che ho fatto finora. A dire il vero, ho appena testato nelle mie sandbox un template Tbuilder (Template Builder) che funziona. Ma c'è il povero Fiaschi abbandonato che piange. Hai dato un'occhiatina a Indice:Olanda.djvu, lo stato dell'arte nella post-elaborazione OCR a due mani con Edo, e a Fiore di virtù di Snark o a Delle Frascherie di Edo che sono lo stato dell'arte del Progetto Auto?
Operativamente, appena riemergo dalla pausa, potrei travasare sui Template:Opera i dati tratti dall'Intestazione e dall'Infotesto. Molto, molto promettente anche la tua vecchia idea di assegnare un ID agli autori, e alle opere, ma per farlo occorrono alcune pagine del nuovo namespace Dati:, mi pare: un luogo fisico dove ci sia un elenco di tutti gli autori accoppiati con i loro ID, e un altro dove ci siano (magari in più pagine) tutte le opere, per facilitare a un povero BOT l'assegnazione di un ID. progressivo. --Alex brollo (disc.) 15:33, 8 gen 2009 (CET)[rispondi]

Pronti

Alex, ho caricato le lettere autografe di colombo su Commons. Per l'Imitazione aspetto un tuo cenno. Io sarei anche pronto alla prova con IDLE, se vuoi. Dato che sei online potremmo seguirci con la chat di fb. --Aubrey McFato 11:33, 10 gen 2009 (CET)[rispondi]

Sarò online per poco. :-( Vado là a vadere cosa possiamo combinare in qualche minuto. --Alex brollo (disc.) 11:38, 10 gen 2009 (CET)[rispondi]

Cerca

In frettissima... Nelle tendne c'è il cerca e sstituisci, e se guardi il mio monobook.js c'è anche un tasto apposta. Provali ;-) --Aubrey McFato 12:53, 13 gen 2009 (CET)[rispondi]

Sono lontano dal mio pc, ma cerco di seguirti nei tuoi esperimenti. Il progetto Auto mi lascia ancora qualche dubbio, perchè non l'ho capito, mentre confido moltissimo nel progetto OCR. Sarebbe splendido riscire ad avere un bot autonomo, da mettere nel toolserver e far girare dopo il bot di OCR normale. Speriamo che il buon Qualc1 ti possa rispondere. A presto --Aubrey McFato 17:42, 13 gen 2009 (CET)[rispondi]
Ovviamente avevo capito il senso del progetto, e sono perfettamente d'accordo, è solo che mi sembra un po' tecnico e faccio fatica a capire come funziona operativamente. Cerco di seguirti, non ti preoccupare, solo che vado molto più lento di te ;-) (e non sto molto al pc, a Tallinn andrà meglio). Stavo pensando, oggi, ad un utilizzo dei dati autore. Si potrebbe prendere la data di nascita e di morte e scrivere automaticamente delle frasi con "DATA: nasce Autore:PincoPallino", da mettere nelle rispettive pagine delle Wikisource:Ricorrenze... Prova a pensare a questo, così mi dai un po' di tempo per il resto ;-)
Avrai intuito che disporre sul mio pc di TUTTI i dati di TUTTE le pagine di source mi fa mettere questo progetto al top delle priorità. Adesso mi frulla in testa l'indicizzazione di quei dati, poi verrà la loro analisi (ma è una cosa talmente "banale" che non mi appassiona). Tieni conto che il codice python che fa tutto è veramente elementare (non semplice: elementare sì) e che comincio a smaniare per il fatto che non sono cose che si possono fare da soli; occorre uno sguardo critico... due altre lezioni di python e capirai tutto. --Alex brollo (disc.) 12:01, 14 gen 2009 (CET)[rispondi]

Grazie per la sistematina al codice. Avrai capito che dal punto di vista tecnico non vado oltre il copia e incolla o poco più. Devo ancora sistemare i capitoli del volume secondo, che spero di corredare delle relative illustrazioni, Sicuramente gli incroci con Il cavallarizzo possono essere molto interessanti. avevo anche in animo di completare la raccolta della poesia georgico-didascalica del settecento. Siccome so che sei un mago nell'OCR chiederò il tuo aiuto--Ilcolono (disc.) 13:24, 13 gen 2009 (CET)[rispondi]

Incredibile!

Caro Alex,

la tua ultima idea sembra realizzare quello che è il sogno segreto di più di un utente, cioè la creazione di Indici di Wikisource. I recenti sviluppi che stai imprimendo al progetto sono sconvolgenti: nella mia incompetenza faccio fatica a contenere l'entusiasmo, e siccome non è la prima volta che ci si pensa e si arriva a un nulla di fatto, seguo il tuo operato visionario e audace con trepidazione e gongolamento segreto. Per tuo promemoria riprendo una delle questioni che da anni si sognano ma non si realizzano, come la conversione non problematica e continuativa degli apostrofi dritti in apostrofi tipografici (cioè uncinati).

Passando a più "immediati" piaceri, sto pensando di aggiungere un po' di Carducci o Pascoli su en.source: secondo te è il caso che carichi l'intero libriccino (nel qual caso dovrei chiederti una manina) o che mi arrangi e carichi solo i testi delle poesie rimandando ad archive per la rilettura? Prova poi a notare come il full txt di Pascoli sia tutt'altro che full... - εΔω 12:09, 15 gen 2009 (CET)[rispondi]

Darò una seconda occhiata ai due testi. In quello di Pascoli manca il file che amo, il djvu.xml. Io caricherei come djvu e vedrei cosa combina l'OCR, magari dandogli poi una ripassatina. Tieni conto che c'è già una procedura Auto montata su en.source. :-)
Mi correggo! Adesso c'è il djvu.xml. Da dove esce? boh. Su IA vai sempre nella pagina HTTP a rovistare: per Pascoli, http://ia360903.us.archive.org/0/items/pauloucello00pascuoft/ . Il djvu.txt non è male.
Sono anch'io entusiasta delle possibilità e incredulo che alcune delle mie idee possano essere "nuove". Ma forse è il mix di pigrizia, furlana testardaggine, e esperienza di vecchissimi stili di programmazione (vantaggi dell'età) che fa un mix positivo. Purtroppo c'è un limite: i progetti si stanno accavallando, e questo è un bene per le reciproche relazioni in un "quadro olistico", e un grande male per questioni di tempo. Se non trovo dei seguaci la vedo dura. --Alex brollo (disc.) 12:44, 15 gen 2009 (CET)[rispondi]
Per l'algoritmo bot della conversione degli apostrofi io farei così (fammi una verifica logica della correttezza della procedura):
  1. preservare tutti gli apostrofi che sono marckup wiki (doppi + tripli);
  2. preservare tutti gli apostrofi che sono all'interno di un template o di un link (parentesi quadre singole o doppie, doppie graffe);
  3. convertire di brutto tutti gli altri. --Alex brollo (disc.) 13:28, 15 gen 2009 (CET)[rispondi]
Nota che nella procedura post-elaborazione OCR non c'era bisogno dei punti 1 e 2 lavorando su testo non ancora wikificato. Ma non avrei mai fatto girare lo script su una pagina già formattata. --Alex brollo (disc.) 13:28, 15 gen 2009 (CET)[rispondi]
sulla possibilità di trovare seguaci l'unica possibilità, a parte sfondare su en.source, è tentare di presentare qualche scampolo di risultato su meta, dove però l'ottica è pur sempre sbilanciata in senso "Pediocentrico". Sarò un uccello del malaugurio, ma temo che il pensiero dell'allontanamento degli utenti dal progetto, della direzione contraria a quella della semplicità d'uso per i non addetti ai lavori sia l'ostacolo più grosso da superare e far superare. Se hai avuto a che fare con il mondo Apple noterai che la sua proverbiale immediatezza d'uso copre e rende secondaria la notevole complessità del meccanismo con cui tale facilità d'uso: vale a dire che se tu riuscissi a scafare tutti i tuoi passaggi di nidificazione template in un involucro che permetta all'utente inesperto di ottenere il risultato con pochi passaggi senza che si curi di quanto accade sotto la scocca di tale involucro avresti centrato l'obiettivo: è quello che facciamo quotidianamente ora usando Mediawiki, ora guidando un'auto, ora accendendo la luce conun interruttore elettrico. A me quello che disturba di tanta logica del mondo informatico è che l'utente sia costretto a farsi una cultura sul funzionamento di uno strumento invece che concentrarsi sull'obiettivo da raggiungere con tale strumento. Se ho scritto frasi scontate chiedo scusa in anticipo, ma ho ritenuto non inutile comunicartele.
Sugli apostrofi: proviamo a ripartire con una discussione a tutto progetto in qualche bar (ad esempio il Bar del coordinamento), dato che forse questo giro ce possiamo fare...
Io e i bot... Guarda, è un caso che ne abbia uno qui, ed è decisamente inattivo. Mi guarderò bene dall'esportarlo. Su en.source poi sono sempre molto di passaggio. - εΔω 18:26, 15 gen 2009 (CET)[rispondi]
Giusto, perfetta l'analisi: da vecchio informatico, mi verrebbe da dire "bei tempi, quelli del DOS"... poi penso alle cose incredibili che si possono fare adesso con un paio di click... però qualcosa nella strada si è perso. :-(
Bando alle nostalgie da vecchietto. ;-) Operativamente per Carducci e Pascoli: io mi salvo i miei amati djvu.xml e cominci a lavorarci: ti metto su un Google Doc privato (con accesso riservato a te) i successivi output, tu me li commenti e mi chiedi qualche rifinitura, quando ti vanno bene mi avvisi e ne fai quello che vuoi (ipotizzo una rifinitura sul file testo globale, un bel copia e incolla indifferentemente su una versione testuale o proofread, fine). Se ti va l'idea del proofread (a me piace molto) pubblica i djvu su commons con un titolo che ti piaccia: lo stesso che poi sarà quello su en.source sia dell'Index, che del testuale, e anche degli eventuali template (solo due o tre su en.source). Il mio contributo, se vuoi usare Auto, sarà preparare i templates e fornirti il testo ripulito. OK? OK? Caricati entrambi. Ma prima devo pensare un po' a una nuova idea, di tale boldaggine che le altre diventano come una sfumatura di rossore sulle guance di una timida adolescente. :-)--Alex brollo (disc.) 21:49, 15 gen 2009 (CET)[rispondi]

changing my user id

Hi Alex, I'm trying to change my user name from Epousesquecido to Josette (my real name). Can you point me in the right direction to do this here (on it:ws). I will come back to this page to see if you have answered. Thank you. - Epousesquecido (disc.) 18:06, 16 gen 2009 (CET)[rispondi]

Risposte per script

Ti ho risposto nella mia pagina ai tuoi messaggi relativi agli script: Discussioni_utente:Qualc1#Tre_scriptini_python e Discussioni_utente:Qualc1#Indicizzazione_python_dei_dump_xml_di_wiki. Ciao. --qualc1 (disc.) 13:56, 18 gen 2009 (CET)[rispondi]