Aiuto:Match and Split: differenze tra le versioni

Naviga nella cronologia in modo interattivo

← Differenza precedente Differenza successiva →

Contenuto cancellato Contenuto aggiunto

In linea

Versione delle 09:58, 10 dic 2010

Questa pagina è una piccola guida al Match and Split. Si può consultare la guida originale di ThomasV qui (in inglese).

Cos'è il Match and Split

Mettiamo di avere un testo non-proofread, cioè non accompagnato dalle scansioni del testo originale. Vogliamo farlo diventare proofread. Per ottenere ciò, è necessario che il nostro testo venga spezzettato in vari frammenti, ognuno dei quali corrisponderà ad una singola pagina del testo originale, in modo da associare l'immagine di ogni pagina al frammento di testo corrispondente.

Cosa serve

un testo del namespace principale (esempio: Storia della letteratura italiana/VI)
un file .djvu contenente le immagini scansionate, caricato in una pagina Indice (esempio: Indice:Storia della letteratura italiana I.djvu).
Questo file deve avere un text layer (ad esempio, i file .djvu di Internet Archive ce l'hanno)

La prima volta controllate che nelle preferenze sia spuntato "Usa interattivamente il bot ThomasBot".

Come si fa

aprite il vostro testo in modifica, posizionatevi all'inizio del testo e premete il bottone "Match" sulla barra degli strumenti. Verrà inserito il seguente codice: ==__MATCH__:[[]]== su una nuova riga (come fosse un titolo di sezione).
Attenzione: tutto ciò che è sotto il MATCH verrà spostato nelle pagine proofread! Quindi spostate sopra il match eventuali categorie, collegamenti interwiki o template come tl:Conteggio pagine.
andate sull'Indice, e cercate la pagina da cui inizia il vostro testo (esempio: Pagina:Storia della letteratura italiana I.djvu/121).
nel MATCH, inserite tra le parentesi quadre il titolo completo di questa pagina.
salvate.
Ora nel vostro testo la parola MATCH è diventata un link. Cliccatelo e attendete pazientemente.
Quando la pagina si sarà ricaricata, vedrete la suddivisione che vi viene proposta. Controllate, aprendo le varie pagine, che la suddivisione sia giusta, ed eventualmente correggetela. Attenzione a non lasciare dei template "spezzati a metà" tra una pagina e l'altra. Salvate.
cliccate "split" in alto, ed attendete pazientemente.

IMPORTANTISSIMO: prima di cliccare "split" CONTROLLATE BENE LA PAGINA,

per evitare casi come questo in cui il sistema vi propone di creare centinaia di pagine in realtà non necessarie.

Alla fine di questo processo, avrete:

una pagina del namespace principale contenente un tag <pages/> (esempio: <pages index="Storia della letteratura italiana I.djvu" from=121 to=161 />)
una serie di pagine (esempio: Pagina:Storia della letteratura italiana I.djvu/121 e seguenti) contenenti il vostro testo di partenza. Queste pagine si trovano al SAL 25%, quindi sarà necessario ripassarle a mano (o chiedere l'intervento di un bot) per portarle al 75%.

Osservazioni

Il sistema splitta una singola pagina alla volta. Quindi se il testo è diviso in capitoli, l'intera operazione va ripetuta per ognuno.
Se nella stessa pagina finisce un capitolo ed inizia il successivo, facendo Match and Split dei due capitoli in questa pagina:
- prima viene inserito il testo del primo capitolo
- poi quando si fa il match del secondo, viene aggiunto il testo e i due testi vengono separati mediante section e da una riga orizzontale (?)
- il primo capitolo viene aggiornato col section giusto (insomma fa tutto da solo!)

Con testi in prosa, il sistema non riconosce quando una parola è spezzata su due pagine
Potrebbe essere preferibile non fare il controllo di cui al punto 7, cioè accettare la suddivisione che viene proposta e poi correggere nella ripassata finale?
Il sistema cerca di gestire il tag poem, evitando che vengano interrotti nel salto di pagina. Però a volte questo non funziona e compaiono dei poem dove non dovrebbero...
A volte il match aggiunge degli spazi bianchi all'inizio delle righe!
se una pagina esiste già, viene semplicemente saltata.

Si può tener d'occhio quello che il sistema sta facendo da questa pagina: http://toolserver.org/~thomasv/robot.php

[Alcune osservazioni di Xavier121 e di Alex brollo spostate in Pagina discussione ]

@@ Riga 45: / Riga 45: @@
 * Si può tener d'occhio quello che il sistema sta facendo da questa pagina: http://toolserver.org/~thomasv/robot.php
-=== Note di Xavier121 ===
+{{smaller|[Alcune osservazioni di Xavier121 e di Alex brollo spostate in [[Discussioni aiuto:Match and Split|Pagina discussione]] ]}}
-*Fine primo esperimento: spettacolare... non ci posso credere... è una forza :)))))))))) --'''[[Utente:Xavier121|<span style="color:orange;">X</span><span style="color:black;">avier</span>]][[Discussioni_utente:Xavier121|<span style="color:orange;">1</span><span style="color:black;">21</span>]]''' 11:21, 6 ott 2010 (CEST)
-=== Note di Alex ===
-* Magnifico su [[Storia della letteratura italiana]]: non procedo per lasciare qualcosa a chi vuol provare.
-* Difficile il caso di [[Osservazioni sulla morale cattolica]]: capirtoli 1 e 2 ok,  si inceppa al capitolo 3. Il problema sono le note che continuano da una pagina alla successiva.
-* Le note "semplici" sono gestite perfettamente. Anche i capitoli che iniziano a metà pagina sembrano gestiti bene.
-* Importante  che il codice match stia su una riga a se stante (tipo titolo).
-* Testata su [[Adelchi]] la strategia di match and split su testo globale (capitoli riuniti in [[Adelchi/TestoCompleto]]). L'impressione è che sia conveniente il M&S sui singoli capitoli, tranne in casi molto particolari.
-* Nelle opere non proofread pare opportuna la conversione di eventuali codici di inizio sezione (tipo == ==, === === ecc) con tag di formato carattere (tipo <nowiki><big></nowiki> o altri), per evitare la necessità di gestire gli indici automatici
-* Opportuna l'apertura di una pagina dedicata per il governo dei lavori di trascrizione inversa mediante M&S (elenco opere di cui va ricercata e caricata una versione immagine; elenc delle opere pronte per il M&S)
-* Pronto per il M&S [[I promessi sposi]] vs. [[Indice:I promessi sposi (1840).djvu]], caricato or ora prima di utilizzarlo, attendere che questo link: [[:File:I promessi sposi (1840).djvu]] si "fluifichi"). --[[User:Alex brollo|Alex brollo]] ([[User talk:Alex brollo|disc.]]) 10:07, 7 ott 2010 (CEST)
-* Pronte per il M&S molte opere di Manzoni in [[Indice:Opere varie (Manzoni).djvu]]; nell'indice, provvisoriamente, è stato introdotto in sommario l'elenco delle opere presenti in Ns0 dell'autore (l'elenco va rivisto conservando quelle che sono comprese nel grosso file djvu).
-* Nota: istruire Alebot a cambiare il codice <nowiki>---- <references /></nowiki> in <nowiki>{{Sezione note}}</nowiki>