Discussioni indice:Antonino Traina - Nuovo vocabolario siciliano-italiano.pdf

Contenuti della pagina non supportati in altre lingue.
Da Wikisource.

memoRegex[modifica]

{"<span style=\"font-variant: normal\">(.*?)</span>":["(regex)"," $1 ","g"], "\\{\\{Sc\\|\\ ":["","{{Sc|","g"], "\\ \\}\\}":["","}}","g"], "^\\n*'''":["(regex)","\n\n'''","g"], "''''''":["","","g"], "''''":["","","g"], "\\}\\}\\{\\{Sc\\|":["","","g"], "'''\\ '''":[""," ","g"], "^([a-z])":["(regex)","\n$1","g"]}

Ancore e link[modifica]

@Alex brollo, OrbiliusMagister, Àncilu Salve! Vedendo iniziare i lavori, mi chiedo se sia fattibile e una buona idea rendere l'opera ipertestuale, ovvero avere la possibilità di linkare a una voce specifica grazie alle ancore #, e ad utilizzare appunto dei link per ogni "V." del testo. Di sicuro renderebbe il dizionario più navigabile. Catonif (disc.) 20:02, 19 gen 2023 (CET)[rispondi]

@Catonif Le voci sono tutte identificabili, vista la costanza della formattazione (sistematico uso del grassetto per la sola voce). Si potrebbe fare in automatico, quindi, ma penso sia più opportuno farlo dopo una prima sistemata: ogni codice di formattazione in più rintralcia la revisione. Ci sono poi alcuni problemi: translitterazione dei caratteri speciali, convenzioni nel caso di varianti multiple della voce, eccetera. Da considerare l'ipotesi di aggiungere ancore solo nelle voci che costituiscono target di qualche link. Alex brollo (disc.). 20:28, 19 gen 2023 (CET)[rispondi]
@Catonif@Alex brollo,
ammetto che ho pensato anch'io alla possibilità indicata da Catonif, ma proprio perché il lavoro di creazione pagine è già stato fatto mi sono taciuto. Rilancio la palla ad Alex perché valuti la possibilità di automatizzare il processo di linkaggio (a me sembra un'impresa impegnativa). εΔω 22:09, 19 gen 2023 (CET)[rispondi]
Ciao @Alex brollo e @OrbiliusMagister, sono contento che la proposta venga presa in considerazione. Avete ragione sul suo impatto nella revisione, e quindi mi pare una giusta considerazione compiere il linkaggio in automatico dopo le revisioni umane. La scelta di "ancorare" solo le voci che sono linkate è comprensibile, anche se un ancoraggio completo gioverebbe al wikizionario inglese e francese per i loro riferimenti (che per ora portano al PDF di LiberLiber). Catonif (disc.) 22:56, 19 gen 2023 (CET)[rispondi]
@Catonif @OrbiliusMagister In Pagina delle prove ho fatto un paio di test, sembra che anche i caratteri accentati non diano fastidi. L'applicazione dei link per ogni V. invece la vedo molto problematica, mi riservo di studiare bene il testo di qualche pagina a caso, e comunque temo sia inumano inserire i link doppi (rispettivamente da nsPagina a nsPagina e da ns0 a ns0).
Ho provato, per quest'opera, il visualizzatore, mi piace molto e suggerisco di sperimentarlo, la funzione ricerca è rapida ed efficace. Alex brollo (disc.). 23:04, 19 gen 2023 (CET)[rispondi]
@Alex brollo Hai ragione! Il visualizzatore funziona molto bene qui. Mi azzardo a suggerire, per il problema dei link doppi, la creazione di un template apposito per i dizionari per i link, ad esempio: {{Link|cartuleggi}} creerebbe [[../C#cartuleggi|cartuleggi]] se si trova in ns0, mentre se si trova in nsPagina, cosa che può scoprire grazie a {{NAMESPACE}}, il link non lo fa proprio (per evitare il link rosso, senza che ci impicchiamo a trovare le pagine giuste). Catonif (disc.) 23:21, 19 gen 2023 (CET)[rispondi]
@Catonif Per fortuna abbiamo recuperato la formattazione. Esito delle prime guardate rapide: i riferimenti sono di due tipi: il più comune V. [testo in maiuscoletto] e l'alternativo Per [testo in maiuscoletto] V.. Questo potrebbe essere sfruttato per un cauto tentativo di applicazione automatica dei link via bot, sfruttando la presenza del codice template Sc adiacente a V. . Non escluderei però che si superi, nelle pagine più lunghe, il limite massimo di template. Se si ipotizza che la futura consultazione avvenga soprattutto in ns0, si potrebbe inserire il link semplice, soloverso ns0; l'unico inconveniente è che anche il click in nsPagina porterebbe alla voce in ns0, poco male. Alex brollo (disc.). 23:37, 19 gen 2023 (CET)[rispondi]
@Alex brollo Ah, giusto, non avevo pensato che il link poteva essere assoluto. In tal caso concordo convenga linkare all'ns0 direttamente. :) Catonif (disc.) 23:44, 19 gen 2023 (CET)[rispondi]

Rieccomi[modifica]

@Àncilu Adesso che hai provato a correggere, come va? Ti sarebbe utile che in tutte le pagine fosse precaricato il tl RigaIntestazione? Io andrei avanti nel lavoro di rifinire i fine pagina-inizi pagina, dove ho verificato che l'algoritmo di splitting produce spesso errori. Alex brollo (disc.). 00:24, 29 gen 2023 (CET)[rispondi]

@Alex brollo: Non che sia troppo da aggiungere il {{RigaIntestazione}}. Àncilu (disc.) 07:42, 29 gen 2023 (CET)[rispondi]
@Àncilu La mia politica è: "non fare a mano quello che si può fare in automatico", ma ok, soprassiedo (si può fare anche dopo).
Piuttosto, il bot è pronto (salvo esiti sperimentazione...) per aggiungere le ancore ai lemmi, con le seguenti convenzioni e limitazioni:
  1. l'ancora viene applicata solo al primo lemma di un'eventuale sequenza (ci sono sequenze di alternative di desinenza, e sequenze li lemmi separati da e ;
  2. il nome dell'ancora è costituito dal lemma normalizzato (tutte minuscole, eliminazione delle lettere non ascii, con diacritici come gli accenti)
Mi pare che il wikitesto non sia eccessivamente appesantito e non venga ostacolata la rilettura. E' abbastanza urgente sperimentare la cosa, perchè c'è il rischio che nelle lettere pesanti (tipo la A) si superi il limite di complessità della pagina ns0, dopo l'aggiunta di parecchie migliaia di template; se il sistema non regge, occorre modificare la struttura ns0, riducendo la dimensione delle pagine splittando diversamente (es. basandosi su due lettere iniziali invece che una sola; ma sarebbe estremamente fastidioso).
OK alla cauta sperimentazione su tutte le pagine della lettera A? Alex brollo (disc.). 10:40, 29 gen 2023 (CET)[rispondi]
Alla fine ho ripiegato su una soluzione che esegue l'applicazione dell'ancora sul solo primo lemma di default, e anche sulle desinenze in modo opzionale.
Questi i due possibili risultati:
  • testo: '''Abbajaturi –tura –trici'''. ''verb.'' Chi o che abbaja: ''abbajatore–trice''. -> Abbajaturi –tura –trici. verb. Chi o che abbaja: abbajatore–trice.
  • risultato di default: '''{{§|abbajaturi|Abbajaturi}} –tura –trici'''. ''verb.'' Chi o che abbaja: ''abbajatore–trice''. -> Abbajaturi –tura –trici. verb. Chi o che abbaja: abbajatore–trice.
  • risultato opzionale: '''{{§|abbajaturi|Abbajaturi}} –{{§|abbajatura|tura}} –{{§|abbajatrici|trici}}'''. ''verb.'' Chi o che abbaja: ''abbajatore–trice''. -> Abbajaturituratrici. verb. Chi o che abbaja: abbajatore–trice.
Alex brollo (disc.). 15:32, 29 gen 2023 (CET)[rispondi]
@Àncilu Ti pingo, in ritardo. Meglio tardi che mai. Alex brollo (disc.). 19:39, 29 gen 2023 (CET)[rispondi]
Ma a che serve il {{§}}? Cioè iintendi che il CSS causa errori? Àncilu (disc.) 09:11, 30 gen 2023 (CET)[rispondi]
@Àncilu Il template § associa ai lemmi un'ancora HTML, e quindi permette a un link (esterno o interno a itwikisource) di puntare su un lemma specifico. Ne abbiamo parlato abbastanza a fondo con @Catonif, vedi nella sua pagina di discussione. Alex brollo (disc.). 09:39, 30 gen 2023 (CET)[rispondi]

Contributori[modifica]

Il punto sui lavori[modifica]

@Catonif @Àncilu @OrbiliusMagister Eccomi a fare il punto dei lavori.

  1. il libro è stato portato a SAL 75% (salvo E&O, speriamo pochi, le sezioni delle pagine sono OK; le ancore sui lemmi sono state applicate; i link tipo V. [lemma] e Per [lemma] V. sono stati applicati)
  2. sta correndo il bot per ripescare e trasformare in link i lemmi multipli tipo [primo lemma] [secondo lemma] ... che nell'edizione originale in genere sono rappresentati riuniti da una graffa
  3. manca l'estrazione delle ancore omonime, da raccogliere dopo che il bot avrà finito di correre

La suddivisione in sottopagine è stata fatta sempre in base alle due lettere iniziali del lemma, dopo normalizzazione; il numero dei lemmi per sottopagina è molto variabile, da uno a molte centinaia; la costanza della regola di suddivisione permette una struttura generalizzata dei link ai lemmi, a prescindere dal loro numero.

In caso di errori, segnalatemeli, possibilmente con un messaggio "pingato" nella pagina di discussione della pagina contenente l'errore/la difficoltà.

Resta da risolvere il quiz del perchè il visualizzatore non parta da nsIndice, ma parte sia da nsPagina che da ns0. Boh? Il visualizzatore è importante perchè consente la ricerca per testo dei lemmi nell'intero vocabolario, anche se i lemmi non sono linkati.

Se tutto va bene, io avrei finito :-) Alex brollo (disc.). 10:38, 9 feb 2023 (CET)[rispondi]

@Alex brollo Ottimo lavoro! :D Ci sarebbero anche casi come "lo stesso che jiri V.", "In certi luoghi vale: ficurinnia V.", che avendo la "V." direi che un link se lo meritano (assicurandosi che non ci sia già un link dopo, nei casi "lemma V. lemma"). Ci sono anche casi come "V. benignarisi" il cui link dovrebbe portare in verità ad #benignari, o "V. pigghiari pesti.", che dovrebbe portare a #pigghiari. Mi offro volentieri di aggiustare questi link che non funzionano, dàtami una lista appunto di tutti i link che non sono presenti anche nella lista delle ancore. Catonif (disc.) 13:11, 9 feb 2023 (CET)[rispondi]
@Catonif Ci sarà sempre qualche problema causato dall'elaborazione automatica, che funziona solo nei casi rigorosamente "tipici". Esempio, che ho notato e che è difficile da risolvere: talora i lemmi successivi al primo hanno le due lettere iniziali diverse dal primo, e quindi si trovano materialmente in una sottopagina diversa da quella attribuita automaticamente. Resto a disposizione per risolvere, se possibile, i problemi che emergeranno man mano.
Il caso è stato comunque molto interessante e istruttivo, e sarà utile per procedere in altro caso analogo, lasciato a SAL 25%: Dizionario - Vocabolario del dialetto triestino. Alex brollo (disc.). 13:38, 9 feb 2023 (CET)[rispondi]