Utente:Alex brollo/MIlano 10 settembre

Da Wikisource.
Jump to navigation Jump to search

Bozza[modifica]

  • Parte prima: dal libro cartaceo al file searchable
  • Parte seconda: dal file searchable all'ipertesto

Dal libro cartaceo al file searchable[modifica]

  1. Definizione: immagini delle pagine con sottostante testo mappato. Il testo mappato consente di evidenziare, sull'immagine, il risultato di una ricerca di parole.
  2. Tre esempi: Il pdf. Il djvu. Uno pseudo-file: il visualizzatore di IA.
  3. Utilizzo di un testo (lo stesso testo) per esplorare il requisito searchable nelle tre modalità.
  4. Requisiti dello strato testo per consentire il requisito searchable: procedura OCR. OCR come fonte sia del contenuto testuale che della mappatura sull'immagine. XML, dsed, hOCR.
  5. Output di un OCR avanzato (ABBYY): XML di dettaglio (font-family, font-size, font-style, certezza del riconoscimento grafico, riconoscimento facilitato mediante vocabolario...).