Progetto:Trascrizioni/Tecniche di edit alternative

Da Wikisource.

Sono in corso di sperimentazione alcune tecniche di edit alternative, che hanno lo scopo di velocizzare la revisione complessiva delle pagine, gli edit "puntuali", l'utilizzo dei dati di formattazione potenziali presenti nell'hOCR.

I progetti, ad oggi (novembre 2014) sono in fase alfa (da testare, lontani dall'essere stabili). Non esiste, al momento, una vera documentazione.

EditInView[modifica]

Come suggerisce il nome, il progetto permette di editare rapidamente il codice di una pagina senza entrare in modalità modifica; si apre semplicemente un pop-up in cui compare il codice della pagina, che può essere modificato e salvato. Il tool è adatto per piccole rifiniture che si notano meglio in modalità view che in modalità edit. L'idea è quella di rivedere rapidamente, pagina per pagina o direttamente in ns0, il "prodotto finito" e modificare rapidamente i piccoli errori che vengono scovati.

newThumbs[modifica]

Il tool apre, dalla pagina Indice, un ambiente molto particolare, in cui vengono caricate, in piccoloformato, tutte le immagini del libro. E' possibile accedere, in modifica, a qualsiasi pagina, con link sottostanti le immaginette. Entrati in ambiente modifica, si può editare passando rapidamente da una pagina alla successiva; l'idea è di aumentare la velocità di editing in testi in cui le modifiche da fare sono poche e non serve tutto l'armamentario della normale interfaccia di modifica (es. le opere in prosa con ottimo OCR), o per ripassare rapidamente le pagine di un libro assegnando un SAL superiore.

textSelect[modifica]

Apre un ambiente di edit molto particolare, che consente la cattura di dell'OCR selezionandolo sull'immagine della pagina, e assegnandolo a un "tipo di testo". In corso la sperimentazione su poesie, dove la selezione in modalità "Poesia" riconosce con buona (non infallibile) attendibilità le indentature dei versi e la separazione fra strofe, velocizzando moltissimo la formattazione. La cattura in modalità "titoli" aggiunge a ogni riga catturata il template Centrato.

Il tool potenzialmente potrebbe diventare uno strumento molto potente; per ora va considerato un semplice abbozzo, un "assaggio".

Si basa sull'analisi delle coordinate delle parole nell'hOCR, ottenuto da un tool di Phe modificato in modo da memorizzarle in modo permanente nella fase di edit della pagina.