Discussioni progetto:Trascrizioni/Greco

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

Definire la questione[modifica]

@OrbiliusMagister, Demart81 Per prima cosa, vi invito a completare il PING a tutti gli utenti che masticano il greco antico. Poi definiamo tutte le questioni aperte. Grazie! --Alex brollo (disc.) 14:02, 4 set 2015 (CEST)[rispondi]

@Candalua, Shinistas --Demart81 (Comunicazioni, insulti ecc.) 21:31, 4 set 2015 (CEST)[rispondi]
Oppppppsssssss... @Shinitas, Erasmo Barresi, Ricordisamoa --Demart81 (Comunicazioni, insulti ecc.) 21:33, 4 set 2015 (CEST)[rispondi]
EccomiShinitas (disc.) 01:07, 5 set 2015 (CEST)[rispondi]

I problemi[modifica]

1
Avendo a che fare con greco antico in edizioni originali, stabiliamo una stretta "politica diplomatica" eventualmente associata all'uso di Template:Ec nei casi in cui i grecisti siano assolutamente certi che si tratta di errore di stampa, e non di espressione delle opinioni o degli usi del periodo dell'edizione?
2
Il nostro [[Template:Greco]] è una specie di ping ai grecisti, perchè verifichino la trascrizione, e quando l'hanno verificata il template viene rimosso, e la pagina non è più categorizzata per il suo contenuto greco. Il nome del template però è ambiguo: sarebbe più chiaro Template:Greco da controllare. Che ne dite di rinominare il template e dare una passatina di bot per allineare le chiamate al nuovo nome?
3
Vari progetti (en, fr, la) hanno un template Greco che semplicemente fissa un buon font per il greco polifonico; un po' in basso nelle priorità ci sono anche due font particolarmente adatti all'Unicode in generale. Il progetto la.source include il testo greco in uno span con questo codice:
  • <span lang="grc" xml:lang="grc" style="font-family: DejaVu Sans, Athena, Gentium, Palatino Linotype, Arial Unicode MS, Lucida Sans Unicode, Lucida Grande, Code2000, sans-serif;">{{{1}}}</span>
Esempi di vari font su un testo greco polifonico:
  • default: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • DejaVu Sans: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • Athena: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • Gentium: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • Palatino linotype: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • Arial Unicode MS: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • Lucida Sans Unicode: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτο
  • Code2000: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτό
  • Candara: Ἐν ῇ τὸ τοῦ Διονὺσου ἀιδοῖον ἀπέκειτό (prima scelta sul solo fr.source)
Alex, certo non lo hai fatto apposta ad aver scritto varie volte della cesta "in cui era conservato il fallo di Dioniso", ma il risultato mi fa molto ridere - εΔω 23:52, 17 set 2015 (CEST)[rispondi]
4
c'è anche da decidere se un eventuale template, che imposti un una serie di font come la.source, debba anche generare una categoria automatica che permetta di rintracciare le pagine con testo greco. Alex brollo (disc.) 14:59, 5 set 2015 (CEST)[rispondi]

Le mie risposte:

  1. sarebbe rischioso perché "sulla fiducia". Tuttavia se vogliamo uniformare le parti in greco al resto, si dovrebbero poter affiancare edizione diplomatica e interpretativa. Quindi per me andrebbe fatto.
  2. ok
  3. fate vobis, sceglierei il più completo e visibile in unicode. Mi piace Code 2000, invece Lucida Sans mi rimpicciolisce le lettere con diacritici (da Windows con FF 40, da Mac ancora non ho visto. Da iPhone tutti uguali. Da Windows inoltre Athena e Gentium sono uguali a Code 2000. Mi piace comunque un carattere serif, ma possibilmente non Palatino.
  4. sono d'accordo a farlo ieri :P --Demart81 (Comunicazioni, insulti ecc.) 16:09, 5 set 2015 (CEST)[rispondi]
  1. Penso che la trascrizione di passi greci debba essere diplomatica tanto quanto lo è la trascrizione del testo italiano. Se nel testo italiano trascriviamo tutti gli accenti e gli altri segni diacritici così come sono, perché chi trascrive il greco dovrebbe avere la libertà di cambiarli di posizione o aggiungerli se non presenti?
  2. D'accordo a rinominare {{greco}} in {{greco da controllare}}. Per coerenza lo stesso andrebbe fatto con {{ebraico}}.
  3. Abbiamo già {{polytonic}}. Eventualmente {{tl|greco}} può diventare un redirect a {{polytonic}} o viceversa.
  4. Weak oppose per la categoria.--Erasmo Barresi (disc.) 19:13, 7 set 2015 (CEST) @Alex brollo, OrbiliusMagister, Demart81, Candalua, Shinitas, Ricordisamoa[rispondi]
Ma guarda, chi se ne ricordava! Le "famiglie" del notro polytonic sono:
  • font-family: Athena, Gentium, Palatino Linotype, Arial Unicode MS, Lucida Sans Unicode, Lucida Grande, Code2000;
bisognerà discutere la sequenza di font; Athena per primo, proprio non va. --Alex brollo (disc.) 20:37, 7 set 2015 (CEST)[rispondi]
1) Greco diplomatico; del resto, quel che noi chiamiamo errore è una scelta(sbagliata) editoriale. Quel che c'è sul libro è quel che copiamo
2) Va bene anche lasciare "Greco", ma non mi son mai fatto questi problemi
3 e 4) Fate vobis: come sembra più giusto ai capoccia sarà il mio cammino Shinitas (disc.) 23:25, 7 set 2015 (CEST)[rispondi]

Io quando lavoro su testi greci in Word uso Palatino Linotype.--Erasmo Barresi (disc.) 16:13, 8 set 2015 (CEST)[rispondi]

Ri-uppo @Candalua, Ricordisamoa, OrbiliusMagister --Demart81 (Comunicazioni, insulti ecc.) 11:50, 13 set 2015 (CEST)[rispondi]

Ehm, ragazzi, siccome mi avete pingato più volte e sarebbe davvero scortesia non rispondere, vorrei chiarire una cosa: io non mastico un bel nulla di greco! :D Sì e no che riconosca le lettere, figuratevi accenti, diacritici, spiriti o fantasmi che siano :) Quindi mi affido al vostro giudizio. Ricordate solo che i cambiamenti che deciderete di fare per il greco, probabilmente andrebbero fatti anche per gli altri alfabeti, come l'{{Ebraico}}, l'{{Arabo}} e forse altri ancora, che adesso non gestiamo ma che magari dovremmo gestire (cirillico, sanscrito...?). Can da Lua (disc.) 11:21, 14 set 2015 (CEST)[rispondi]
1) medesime convenzioni dell'italiano 2) indifferente 3) nel template metterei solo una classe, poi dei gadget possono personalizzare il carattere 4) non necessaria, basta cercare le inclusioni del template. --Ricordisamoa 13:08, 17 set 2015 (CEST)[rispondi]
1) bene 2) bene 3) ok per la classe, la personalizzazione del carattere può poi essere fatta via css (non gadget js, che darebbe un risultato non esportato in ePub) 4) giusto.
Direi che il primo lavoro fattibile sarebbe quindi la conversione dei vecchi {{Greco}} in {{Greco da controllare}} e POI la creazione di un nuovo {{Greco}} (con fusione con il Politonic) che semplicemente imposti una classe; chi controllerà i testi marcati con {{Greco da controllare}} semplicemente, a controllo terminato, cancellerà "da controllare" e tutto si sistemerà. Fatto questo, basterà scrivere un css che imposti il font-family e dovremmo essere a posto. --Alex brollo (disc.) 15:35, 17 set 2015 (CEST)[rispondi]

Eccomi, scusate se sono sempre incasinato... rispondo in serie:

  1. Purtroppo le convenzioni di tipografia sono viziate da un presupposto alquanto importante: raramente gli stampatori avevano una competenza della tipografia greca pari a quello della tipografia italiana, per cui la distinzione tra convenzione tipografica ed errore di battitura è molto sfumata. Nei casi di trascrizione del greco ho dovuto cercare un compromesso come quello delle convenzioni italiane: dove era normale la mancanza di accenti, spiriti e diacritici vari sono stato diplomatico, dove invece il testo mi ha permesso di riconoscere gli errori tipografici come tali li ho sempre normalizzati. Dove il testo è specialistico e curato da specialisti mi sono attenuto scrupolosamente al dettato della pagina, dove singole parole o brevi lacerti in greco erano infilati in nota o in testo con incertezze tipografiche o svarioni molto molto evidenti ho preferito normalizzare. Purtroppo non ho abbastanza competenza per la tipografia greca in Italia nei secoli scorsi per dare indicazioni prescrittive su tutto. Chiaramente nel dubbio è meglio essere diplomatici e lasciare il testimone ad altri mediante un template di controllo. Ho recentemente conosciuto una collega che si sta occupando di paleografia greca... proverò a girarle la domanda. In ogni caso se si vuole rimanere "diplomatici al 100%" l'uso di {{Ec}} diventerebbe esteso.
  2. Rinominare {{greco}} in {{greco da controllare}}. Per coerenza lo stesso andrebbe fatto con {{ebraico}}.
  3. Io con i font serif uso Palatino Linotype in quanto comune al mondo M$ e App£e, i font sans serif col greco politonico sono l'Arial Unicode MS o il Tahoma.
  4. Mah.. a me il template per impostare dei font specifici per il greco politonico non ha mai convinto, ma solo perché di norma mi fisso i font per il greco direttamente dalle preferenze del browser, il che non è abitudine comune. Dunque ben vengano dei sistemi come questo.
    Se invece di costringere ad usare un ennesimo template ad offuscare il wikitesto ci fossero soluzioni più a monte (nel common.css) sarebbe meglio. - εΔω 19:34, 17 set 2015 (CEST)[rispondi]

@Alex brollo quindi possiamo comunque verificare le inclusioni del template {{tl|greco}}, {{polytonic}} e {{greco da controllare}}? Se così, ovvio che la categoria non occorre. Però mi chiedo se esistano pagine con testo greco non templatizzato, che così resteranno non individuabili e di conseguenza non controllabili... --Demart81 (Comunicazioni, insulti ecc.) 21:00, 17 set 2015 (CEST)[rispondi]

Il problema della ricerca dei testi in greco, una tantum, per "templatizzare" i mancanti, non è grave: una passata al "dump" di wikisource, ricercando i caratteri greci, e li si pesca tutti. Direi che a questo punto la prima cosa da fare è estrarre un bell'elenco delle pagine Pagina che usano {{tl|Greco}} e {{Ebraico}}. Sono molto arrugginito con python, una buona opportunità per fare un po' di esercizio; altri lo saprebbero fare in un battibaleno, ma.... non è una buona scusa per non provarci :-) --Alex brollo (disc.) 21:42, 17 set 2015 (CEST)[rispondi]

Proposta operativa[modifica]

Chiarito che gli obiettivi sono:

  1. usare un font con una buona resa dei caratteri greci (e non solo);
  2. poter rintracciare le pagine con testo greco, ebraico ecc;
  3. avere un template per segnalare la necessità di "lavoro sporco"

vi invito a valutare questa proposta:

  1. font: scegliere un font di default, sia per ns0 che per nsPagina, che visualizzi bene l'intero set unicode, greco compreso; cadrebbe la necessità di un [[Template:Greco]] o di altri trucchi per assegnare ai testi particolari un font adatto;
  2. categorizzare le pagine Pagina in modo esplicito, con una Categoria in footer (soluzione che suggerisco) oppure con un template che generi la categoria per il solo nsPagina in una posizione qualsiasi del testo; può essere fatto via bot per le pagine esistenti, e dovrebbe poter essere fatto "in automatico" via javascript al momento del salvataggio della pagina (non semplicissimo, ma fattibile per tutte le lingue che usano caratteri particolari) per le pagine nuove;
  3. mantenere il template Template:Greco da controllare e fratelli per l'ebraico ecc., come puntatore temporaneo per facilitare il lavoro sporco. Alex brollo (disc.) 10:06, 18 set 2015 (CEST)[rispondi]

D'accordo con "ambetre" (come ha scritto un mio alunno di quarta in un tema) le proposte. --Demart81 (Comunicazioni, insulti ecc.) 14:15, 18 set 2015 (CEST)[rispondi]

Come algoritmo per "pescare" le pagine con testo greco al momento del salvataggio userei questa regex che significa: "identifica le pagine in cui ci sono almeno tre caratteri consecutivi, appartenenti al range unicode Gree-Coptic oppure al range Greek extended, case insensitive": /[\u0370-\u03FF\u1F00-\u1FFF][\u0370-\u03FF\u1F00-\u1FFF][\u0370-\u03FF\u1F00-\u1FFF]/i. Stessa cosa farebbe il bot (per quanto in python ci vuole qualche attenzione in più). Potrebbe andar bene? --Alex brollo (disc.) 15:59, 18 set 2015 (CEST)[rispondi]
Perché 3? --Demart81 (Comunicazioni, insulti ecc.) 19:35, 18 set 2015 (CEST)[rispondi]
@Demart81 Mi sembrava un discreto compromesso fra la necessità di ignorare le pagine con caratteri greci sparsi e non ignorare pagine con singole parole; tu che numero di caratteri greci consecutivi proponi, come "segnale di vero testo greco"? --Alex brollo (disc.) 16:52, 21 set 2015 (CEST)[rispondi]
@Alex brollo secondo me 2. --Demart81 (Comunicazioni, insulti ecc.) 23:20, 21 set 2015 (CEST)[rispondi]
@Demart81 Hai ragione. Facendo correre python sul dump trovo, su 157870 pagine pagina, 1837 pagine con il criterio tre caratteri, e 1873 con il criterio di due; e nelle pagine con sequense di soli due caratteri, mi pare che la maggior parte siano buone. Salvo quindi l'elenco delle 1873, in attesa di decidere come "marcarle". Alex brollo (disc.) 00:13, 22 set 2015 (CEST)[rispondi]
Nota a margine. Ieri ho incontrato la collega che studia alla Scuola Vaticana di paleografia: di fronte alla mia domanda mi ha candidamente risposto che finora si è occupata solo e rigorosamente di manoscritti e che per le questioni di tipografia dovrà chiedere a qualcuno dei suoi docenti lumi bibliografici... vediamo dove andiamo a finire. - εΔω 20:21, 19 set 2015 (CEST)[rispondi]

Vediamo....[modifica]

Ci sono 359 pagine Pagina che contengono il template Greco, ma c'è un problema: non ricordavo il suo uso corretto! Anzi... l'ho usato sempre in modo sbagliato, passando il testo come parametro del template :-( Poco male, la conversione da sarà ancora più semplice, ma l'inclusione del testo greco nel nuovo template sarà molto delicata via bot. Approfitto per cercare le poche pagine in cui il template è stato usato in modo errato e innanzitutto correggo quelle a mano. Alex brollo (disc.) 22:11, 17 set 2015 (CEST)[rispondi]

Lanciata la conversione greco->greco da controllare, sul finire il bot si è bloccato per entrata in coma del disco rigido esterno dal quale stava lavorando. Mi spiace dell'inconveniente, devo valutare le conseguenze, speriamo bene; le pagine residue che usano [[Template:Greco]] sono poche (14), sistemabili comodamente a mano, appena saranno esaurite procedo con la ri-rinominazione del template e vediamo. --Alex brollo (disc.) 09:51, 18 set 2015 (CEST)[rispondi]
✔ Fatto In tutte le pagine dove veniva richiamato tl|Greco adesso viene richiamato il più chiaro {{Greco da controllare}} che alimenta la Categoria:Testo greco da controllare. Creo una Categoria:Pagine con testo greco dal significato completamente diverso: semplicemente consente (sia che sia esplicita, sia che sia collegata a un futuro template, di cui forse non c'è bisogno) di rintracciare tutte le pagine che contengono testo greco, inteso come "almeno tre caratteri greci consecutivi" il che evita di categorizzare troppo finemente, ad es. pagine con formule matematiche o, altri casi in cui caratteri greci sparsi vengono usati in modo convenzionale. --Alex brollo (disc.) 17:19, 18 set 2015 (CEST)[rispondi]
Mi chiedevo se ci fosse un meccanismo per fare in modo che venissero categorizzate solo le pagine in nsPagina non le loro transclusioni in ns0: in tal modo il numero di pagine nella categoria sarebbe più definito. A me non è venuta in mente alcuna soluzione ma comunque finora siamo andati bene senza bisogno di tali precisazioni bizantine. - εΔω 20:17, 19 set 2015 (CEST)[rispondi]
@OrbiliusMagister La soluzione più "automatica" è quella di mettere la categoria nel footer (come fanno gli amici su mul.source per categorizzare le pagine di un'opera specifica). La soluzione via template è un {{Greco}} che crei la categoria solo in nsPagina, mentre fa qualcos'altro, tipo fissare un font tipo i template usati su fr.source, en.source ecc. Vero che finora siamo andati bene, ma con una carenza: non possiamo in alcun modo, se non ricercando pagina per pagina nel dump, ricavare un elenco delle pagine che contengono greco (e ebraico, ecc) dopo la correzione e l'eliminazione di {{Greco da controllare}}, ex tl|Greco; almeno @Demart81 ne sente la necessità, e sono certo che non è il solo. Alex brollo (disc.) 07:10, 21 set 2015 (CEST)[rispondi]
NON creo subito un {{Greco}} perchè la confusione con il vecchio tl|Greco, e con il nuovo {{Greco da controllare}}, diventerebbe subito ingestibile... ;-) --Alex brollo (disc.) 12:11, 21 set 2015 (CEST)[rispondi]

Passo categorizzazione[modifica]

@OrbiliusMagister, Demart81, Shinitas, Erasmo Barresi, Ricordisamoa, Candalua Ho l'elenco delle 1800 pagine abbondanti in cui esistono tre, oppure due, caratteri greci consecutivi. Un campionamento delle pagine con max due caratteri consecutivi intercetta pagine "buone" (es. alcune dello Zibaldone, dove si parla di dittonghi o comunque coppie di caratteri) e alcuno "non buone" (tipo testi scientifici dove viene usato il simbolo μμ).

Io, se siete d'accordo, partirei con la categorizzazione esplicita in Categoria:Pagine con testo greco aggiungendo la categoria al footer, il che evita la categorizzazione delle pagine in ns0 ma permette comunque il recupero di tutti i nostri testi proofread contenenti testo greco. Comincerei dalle pagine che contengono max 2 caratteri consecutivi (sono poche decine) per rodare la cosa e permettere i primi controlli e verifiche. Ok? Aspetto un paio di assensi. --Alex brollo (disc.) 09:33, 22 set 2015 (CEST)[rispondi]

Prova con 2 e 3. Forse nel pomeriggio mi ci metto. --Demart81 (Comunicazioni, insulti ecc.) 10:58, 22 set 2015 (CEST)[rispondi]
Aimè... prima di stasera/stanotte niente da fare. Ok, isolerò le pagine con due e quelle con tre (lasciando per dopo quelle con >3) PS: il HD esterno mi si è impallato irreversibilmente.... meno male che qualcosa avevo salvato... se avessi perso i miei parser personali per il dump, mi sarei molto demoralizzato. I miei scriptini python sono belli veloci... i parser xml "ben fatti" al confronto sono delle lumache. Potenza della banale ricerca di stringhe. --Alex brollo (disc.) 12:13, 22 set 2015 (CEST)[rispondi]

Altri alfabeti e font[modifica]

@Alex brollo, OrbiliusMagister, Demart81, Shinitas, Ricordisamoa

  1. Bisognerebbe rinominare anche {{ebraico}} in {{ebraico da controllare}} e {{arabo}} in {{arabo da controllare}}.
  2. Più sopra Alex proponeva di "scegliere un font di default, sia per ns0 che per nsPagina, che visualizzi bene l'intero set unicode". Esiste un tale font?

--Erasmo Barresi (disc.) 14:48, 26 set 2015 (CEST)[rispondi]

Forse, più che il font, bisognerebbe beccare il browser che legga quel code, diciamo così: è successo che altri utenti leggessero caratteri da me letti come "quadratone a caso" e che io leggessi caratteri da altri percepiti come "quadratoni a caso". [Davvero abbiamo anche ebraicisti e arabisti?] Shinitas (disc.) 19:21, 26 set 2015 (CEST)[rispondi]
@Shinitas Certo che va fatto.
Arabisti non so, ebraisti sì. Per casi isolati, un fischio a una wikipedia di solito risolve. Dissodato il campo del greco, ebraico e arabo (nemmeno sapevo ci fosse....) dovrebbero essere cose facili. Font: i font ci sono (Arial Unicode MS per dirne uno), ma non sono "bellissimi". Dovendo scegliere. però, sarebbe opportuno considerare anche l'aspetto della dislessia, per la quale i font sans serif sono preferibili; è un compromesso difficile anche perchè i gusti estetici sono personali. --Alex brollo (disc.) 13:20, 28 set 2015 (CEST)[rispondi]