Discussioni indice:Turco - Canzone senza parole.djvu

Contenuti della pagina non supportati in altre lingue.
Aggiungi argomento
Da Wikisource.
Ultimo commento: 1 anno fa, lasciato da Candalua in merito all'argomento Trascrizione completata

Nota su scansione/OCR[modifica]

@Isabelawliet Nel caricamento su IA hai già visto perchè ti suggerivo di caricare un pdf multipagina piuttosto che una raccolta di jpg.... funziona bene anche la raccolta, ma ci sono trabocchetti. Se organizzate altri caricamenti, raccomando la conversione in pdf multipagina delle immagini prima del caricamento su IA.

Un secondo piccolo problema per l'OCR sono i margini delle pagine. Sarebbe meglio escludere, dalle immagini, sia il fondo che il margine fisico della pagina, ossia eseguire un buon cropping. per fortuna esiste un fantastico programma, briss, in java, che consente di fare un buon cropping virtuale di tutte le pagine di un pdf, in modo veramente geniale. Può essere usato anche per separare in pagine singole un pdf in cui le immagini sono a due facciate. Il bello è che non interviene affatto sulle immagini, e quindi le conserva perfettamente.... perfino se sotto c'è uno strato testo. suggerisco caldamente di provarlo: questo djvu è stato ottenuto dal pdf originale ripassato con briss. il cropping dei margini evita che l'ocr cerchi di interpretare, facendo pasticci, il margine della pagina. Alex brollo (disc.). 16:56, 3 ago 2022 (CEST)Rispondi

Sfilacciamento[modifica]

@Alex brollo, @Isabelawliet, chiedo scusa per l'intrusione, ma nella mia ignoranza non mi spiego al primo colpo la scelta di dare alle novelle della raccolta uno status autonomo invece di mantenerle come sottopagine della raccolta.

Un conto sono le raccolte di novelle (o poesie) di molti autori in una antologia curata da uno studioso, un altro conto è una raccolta sia stata curata dall'autrice e le novelle sono state raccolte in volume dall'autrice, giusto? Anche fossero state pubblicate prima singolarmente noi abbiamo davanti la raccolta: a meno di casi inequivocabili di singole novelle che abbiano assunto fama e valore come componimento autonomo (caso moooolto più raro che per le poesie) noi trattiamo questa raccolta non diversamente dalle raccolte di Verga o di altri.

Non è che mi manca qualche informazione? Illuminami. - εΔω 00:31, 4 ago 2022 (CEST)Rispondi

@OrbiliusMagister Ho gli stessi dubbi, ma ho preferito, al momento, valorizzare al massimo il lavoro di scansione e caricamento su IA senza pormi troppe domande. tuttavia incontro parecchi problemi.... uno, per esempio, è quello di come gestire i caricamenti di interi fascicoli di una rivista, presentati sotto il nome di un unico articolo che contengono. Ho ondeggiato nella risoluzione del problema adottando soluzioni diverse, ma occorre ripensarci. Il secondo problema è quello dei "doppioni", es. Salvatrice. Comunque, tengo aggiornata la pagina Autore, e sarei ben lieto di una discussione su come sistemare le cose.

La mia proposta per il primo dei due problemi: "ripulirei" i djvu dei fascicoli, lasciandoci solo il frontespizio del fascicolo e le pagine relative all'articolo/alla novella di interesse. al momento, il fatto che un file rappresenti un fascicolo di una rivista, più o meno completo, e sia il titolo che i metadati invece siano relativi a uno solo dei vari contenuti non va; me ne rendo conto, ma ho preferito procrastinare la soluzione del problema, e sono disponibilissimo a operare per sistemare le cose.

Comunque, questo caso dimostra, ancora una volta, come wikisource sia un ambiente tutt'altro che semplice :-( Alex brollo (disc.). 08:36, 4 ago 2022 (CEST)Rispondi

Ehm, non per rompere, ma se scrivo è perché sto moooolto faticosamente ponendo mano a una soluzione procrastinata per cinque anni in cui mi sto facendo un mazzo non indifferente solo perché non ero attivo quando la trascrizione dei Lirici marinisti è partita.
Noto dalla voce di Pedia sull'autrice che la stessa Salvatrice appare sia da sola (uscita nel 1897) che nella raccolta del 1901 che stiamo elaborando, e la mole dei brani rende difficile distinguere tra romanzo e novella.
In pratica, meglio ragionare e chiarirsi per tempo piuttosto che trovarsi ad attendere e rischiare che una situazione sbagliata venga scambiata per uno standard. εΔω 09:23, 4 ago 2022 (CEST)Rispondi
@OrbiliusMagister Verissimo, ma tieni conto che su wikisource, al contrario di wikipedia, abbiamo l'illusione di poter raggiungere una pagina finita in due o tre edit... hai voglia.... :-( Alex brollo (disc.). 09:52, 4 ago 2022 (CEST)Rispondi


@OrbiliusMagister @Alex brollo Mi intrometto cautamente nella discussione solo per dare qualche chiarimento come wikipediana che sta collaborando con la biblioteca comunale di Trento. Per quanto riguarda le novelle che si "ripetono", credo che il caso in questione sia diverso dall'altro portato ad esempio (componimenti che hanno raggiunto tale fama da essere pubblicati da soli), perché qui la scrittrice ha pubblicato delle novelle (4 per la precisione) da sole in singole riviste, tra gli anni 1896 e 1899, per poi unirle (con altre 2) in un'unica raccolta che ha pubblicato nel 1901. Non abbiamo nemmeno la certezza assoluta che i componimenti siano rimasti inalterate, capirete che è un lavoro di controllo non indifferente in termini di tempo. In ogni caso, ci dispiace che questi "doppioni" abbiano creato dei problemi, non era nostra intenzione, né abbiamo pensato di scartarli in favore della singola raccolta anche perché sono "solo" 4 novelle su un totale di 15 materiali, di cui uno la raccolta, i restanti 10 documenti sono tutti unici e a sé stanti. Spero di aver chiarito alcuni dubbi, ma la mia conoscenza di WikiSource è limitata e iniziata da poco, sugli altri punti di discussione sollevati non sento di poter intervenire. Per quel poco che posso fare, rimango a disposizione e, in ogni caso, ringrazio tutt* per il tempo messo a disposizione per collaborare al progetto. Grazie davvero :)

Contributori[modifica]

memoRegex[modifica]

{"x\\ x\\ x":["","🞻 🞻 🞻","g"], "\\-\\ ":["","","g"], "á":["","à","g"]}

Trascrizione completata[modifica]

@Alex brollo è stato un bel panettone di lavoro ma ora Canzone senza parole è tutta trascritta :) rimangono solo 3 pagine non trascluse, posso chiedere il tuo aiuto per queste ultime? Sono le djvu 6,7 e 9 Isabelawliet (disc.) 14:22, 11 ago 2022 (CEST)Rispondi

@Isabelawliet Volentieri ma.... non vedo il problema :-( Alex brollo (disc.). 20:04, 11 ago 2022 (CEST)Rispondi
@Alex brolloah, accidenti! Io quando apro le pagine 6, 7 e 9 vedo l'avviso "Questa pagina è stata trascritta e formattata, ma deve essere riletta. Non è stata trasclusa nel namespace principale (guida). Tu puoi farlo.", ho provato a guardare nella guida ma non riesco davvero a capire come procedere per sistemarle :( Isabelawliet (disc.) 08:54, 12 ago 2022 (CEST)Rispondi
@Isabelawliet Non vedevo il problema.... perchè non c'è. "Non è stata trasclusa nel namespace principale": è normale che la transclusione di alcune pagine particolari (occhiello, copyright, indice...) sian o rilette ma non transcluse. E' un semplice avviso, che può essere ignorato. "Questa pagina è stata trascritta e formattata, ma deve essere riletta.... Tu puoi farlo". "Rileggere" significa leggere una seconda volta un testo già corretto da un altro utente che ha attribuito per primo alla pagina il SAL 75%, e attribuire poi alla pagina il SAL 100%. Il "Tu puoi farlo" ti avvisa che per te, utente diverso da chi ha portato la pagina a SAL 75%, in modifica si aprirà il radiobutton SAL 100%. Vedi, sul SAL, Aiuto:Stato di Avanzamento del Lavoro. --Alex brollo (disc.). 11:22, 12 ago 2022 (CEST)Rispondi
@Alex brollo sì scusami mi sono spiegata male, intendevo dire che avevo inteso il "Tu puoi farlo" in riferimento a "Non è stata trasclusa nel namespace principale" come se fosse un passaggio obbligatorio richiesto dal lavoro. Ma se non è indispensabile allora sorvolo. Per il resto non potrò portare io il SAL al 100% perché ho svolto la trascrizione fino al 75%. Grazie ancora :) Isabelawliet (disc.) 11:33, 12 ago 2022 (CEST)Rispondi
@Isabelawliet@Candalua Infatti, quel "Tu puoi farlo" dovrebbe stare vicino al "Questa pagina è stata trascritta e formattata, ma deve essere riletta": vediamo se Candalua ha tempo e voglia di sistemare. Alex brollo (disc.). 11:57, 12 ago 2022 (CEST)Rispondi
Alex brollo, Isabelawliet: il problema è che ognuno di quei messaggi si carica un po' quando pare a lui, quindi il primo che arriva si vede per primo... Siccome fa caldo e sono più pigro del solito, la risolvo così: ci scrivo "tu puoi rileggerla", così anche se compare dopo si capisce lo stesso. Can da Lua (disc.) 14:37, 12 ago 2022 (CEST)Rispondi