Vai al contenuto

Aiuto:Gadget ErroriOrtografici

Da Wikisource.

Il gadget ErroriOrtografici permette di individuare dei possibili errori di trascrizione all'interno dei testi proofread. È disponibile per tutti gli utenti, in tutte le pagine Indice, cliccando il bottone Cerca errori ortografici.

La ricerca degli errori avviene applicando al testo una serie di regole ortografiche, definite dal gadget stesso, che individuano ad esempio: accenti mancanti, maiuscole invece che minuscole, sequenze di lettere normalmente non presenti in parole italiane, e così via. Queste regole sono definite mediante delle espressioni regolari (dette per brevità regex).

Una volta cliccato "Cerca errori ortografici", si apre una finestra e inizia la ricerca: man mano che vengono trovati dei possibili errori, vengono mostrati in una lista, con un link alla pagina corrispondente. Cliccando sul link, si atterra sulla pagina e la parola incriminata è evidenziata in giallo per essere facilmente individuata.

La correzione degli errori è comunque lasciata all'utente; questo perché non è sempre possibile determinare quale sia la forma corretta (ad esempio un accento mancante potrebbe essere acuto o grave, a seconda della parola e delle convenzioni tipografiche adottate nel libro).

Ricerca in tutti gli indici di una categoria

[modifica]

Nel menu di sinistra è presente anche un link "Cerca errori ortografici", che permette di cercare gli errori scegliendo una categoria, e specificando un numero massimo di indici da prendere a caso in quella categoria (in modo da limitare il numero di risultati). È possibile indicare anche una categoria contenente pagine ns0: verranno caricati gli indici corrispondenti.

Regex personali

[modifica]

È possibile definire una lista di regex personali creando una propria pagina dal titolo: "Utente:il tuo nome utente/customRegex.js", dal contenuto simile al seguente:

customRegex = [
[ /\b[Uu]sci\b/g, "uscì senza accento" ],
[ /\b[Aa]pri\b/g, "aprì senza accento" ],
];

Provare una regex direttamente dal box di ricerca

[modifica]

Una volta lanciata la ricerca su un Indice, premendo il bottone Cerca... è possibile scrivere "al volo" una qualunque regex, e vedere immediatamente i risultati trovati.

Eccezioni specifiche per un singolo indice

[modifica]

È possibile definire delle eccezioni per un dato indice, andando sulla sua pagina di discussione e creando una sezione dal titolo "ErroriOrtografici", con contenuto simile al seguente:

{
  "eccezioni": [ "Aaron", "Caschcasch" ]
}

Falsi positivi

[modifica]

Può capitare che il gadget segnali degli errori che tali non sono. Ciò è da considerarsi in certa misura inevitabile, data la complessità delle regole ortografiche e grammaticali della lingua italiana, il loro variare nel corso dei secoli, la loro diversa applicazione da un testo all'altro, le differenti convenzioni tipografiche usate dai diversi editori nelle varie epoche, e la presenza di vocaboli stranieri che ovviamente non seguono le medesime regole.

L'obiettivo del gadget è di mantenere il numero dei falsi positivi entro una piccola percentuale del totale delle segnalazioni, anche al costo di rinunciare ad individuare certi errori più rari, se questo porta ad un gran numero di falsi errori.

Scaricare il testo puro

[modifica]

Il gadget effettua le sue verifiche sul puro testo dell'opera, senza formattazione e al netto dell'azione dei vari template (dunque recependo già le correzioni apportate mediante il template {{Ec}}).

È possibile scaricare il testo generato dal gadget in due modi:

  • all'interno della finestra "Cerca errori ortografici", mediante il pulsante Scarica il testo puro, che fornisce un testo volto a facilitare l'analisi degli errori riscontrati: di conseguenza mostra i numeri delle pagine seguendo la numerazione del file djvu o pdf;
  • nella parte sinistra della pagina Indice, mediante il pulsante Testo puro sotto all'immagine di frontespizio e vicino ai bottoni di download EPUB, PDF ecc.: fornisce un testo rivolto principalmente alla lettura, perciò mostra invece la numerazione stampata sulle pagine.

In entrambi i casi viene restituito il solo testo di tutte le pagine non allo 0%, privo di copertine o credits.

Bug noti

[modifica]
  • Il gadget potrebbe non caricare correttamente tutte le pagine, nel caso in cui queste contengano un numero eccessivo di template.
  • L'evidenziazione degli errori nelle pagine non sempre funziona, in particolare fallisce quando la parola contiene un carattere speciale come ! o ? o quando è all'interno di alcuni template o tag di formattazione.
  • In presenza di note a piè di pagina, le parole spezzate a fine pagina non vengono riunite, dunque è possibile che vengano segnalate come falsi errori, o che eventuali errori in queste parole non vengano rilevati.
  • Nel secondo bottone "Scarica il testo puro", eventuali note presenti nel testo vengono visualizzate ogni 50 pagine, e non tutte in fondo al testo.

Possibili evoluzioni

[modifica]
  • Avere la possibilità di definire delle regex specifiche per ciascuna opera.