Teoria degli errori e fondamenti di statistica/C.4.7

Da Wikisource.
C.4.7 Il run test per i residui

../C.4.6 ../C.5 IncludiIntestazione 3 settembre 2022 100% Da definire

C.4.6 C.5

[p. 270 modifica]

C.4.7. Il run test per i residui

Un’altra tecnica che ci permette di capire se una funzione di primo grado è o meno adeguata a rappresentare un insieme di dati è quella che consiste nell’osservare l’andamento, in funzione della , del solo segno dei residui differenza tra i valori misurati e quelli stimati della :

.

Per meglio chiarire questo concetto, osserviamo la figura C1 tratta dal paragrafo 8.3.2 del testo di Barlow citato nella bibliografia (appendice H, a pagina 323). È evidente come l’andamento dei dati sperimentali non suggerisca affatto l’ipotesi di una dipendenza lineare del tipo ; questo anche se l’entità degli errori assunti sulle fa sì che l’accordo tra i dati stessi e la retta interpolante, se valutato con il calcolo del , risulti comunque accettabile: infatti il metodo citato usa come stima la somma dei quadrati dei rapporti tra i residui e gli errori stimati, ovviamente piccola se questi ultimi sono stati sopravvalutati.

Quello che è in grado di suggerire il sospetto di un andamento non lineare della legge , in casi come questo, è un altro tipo di controllo basato appunto sul solo segno dei residui e non sul loro valore (come il calcolo del , o dell’errore a posteriori, o del coefficiente di correlazione lineare, o [p. 271 modifica]
Figura C1 - Esempio di interpolazione lineare per un insieme di 12 punti.

dalla somma pesata dei quadrati dei residui). Segni che siano (come nell’esempio di figura C1) per piccole tutti positivi, poi tutti negativi, ed infine tutti positivi per i valori più grandi delle suggeriranno che si sta tentando di approssimare con una retta una funzione che in realtà è una curva più complessa (ad esempio una parabola) avente concavità rivolta verso l’alto.

Cominciamo con l’osservare che il valore medio dei residui è identicamente nullo: infatti dalla (C.7) ricaviamo immediatamente

.

Questo è dovuto al fatto che sia la somma degli scarti che quella degli scarti sono identicamente nulle in conseguenza della (4.2), ed è vero quindi indipendentemente dal valore di : questa proprietà vale insomma per residui calcolati rispetto a qualunque retta del fascio di centro cui sappiamo che la retta interpolante deve appartenere.

Continuiamo osservando che i residui e le coordinate hanno tra loro [p. 272 modifica]covarianza nulla:

(si è sfruttata, alla fine, la (C.6)). Questa condizione non è sufficiente, come si sa, ad assicurare l’indipendenza statistica tra i residui e le coordinate dei punti interpolati; in effetti queste due variabili casuali non sono tra loro indipendenti, essendo ad esempio impossibile che i residui si presentino in una sequenza crescente all’aumentare delle ascisse .

Però, quando il numero dei dati è grande, delle sequenze possibili di residui assai poche sono quelle escluse a priori dalla natura della loro origine; mentre la probabilità delle altre sequenze (che decresce in maniera inversamente proporzionale a ) è comunque assai piccola: e si può in prima approssimazione assumere che tutte le sequenze di residui siano possibili ed equiprobabili.

Tornando alla figura C1, i residui sono (muovendosi nel senso delle crescenti) dapprima positivi, poi negativi, poi ancora positivi; sono composti insomma da una sequenza di tre sottoinsiemi di valori aventi tutti lo stesso segno (o, con parola anglosassone, da una sequenza di tre runs). Se possiamo assumere equiprobabili tutte le possibili sequenze dei residui è intuitivo capire come un numero così basso di runs si debba presentare con piccola probabilità sulla base di fluttuazioni unicamente casuali; per cui l’osservazione di tale evento può essere attribuita invece alla falsità dell’ipotesi che ha prodotto i residui, ovvero alla non linearità della dipendenza funzionale .

Nell’ipotesi di avere un insieme composto da numeri positivi (corrispondenti, nel caso dei residui, a punti al di sopra della retta interpolante) e da numeri negativi (residui di punti al di sotto della retta interpolante), è possibile calcolare quante delle loro permutazioni producono un prefissato numero di runs ; se è accettabile l’approssimazione cui abbiamo appena accennato, il rapporto tra ed il numero totale di permutazioni possibili ci darà la probabilità di ottenere un certo .

I calcoli dettagliati si possono trovare nel citato paragrafo 8.3.2 del [p. 273 modifica]Barlow o, più in breve, nel paragrafo 11.3.1 di Eadie et al. (testo sempre citato nella bibliografia); qui ricordiamo solo come:

  1. se o (caso impossibile questo per i residui di un'interpolazione lineare) l'unico valore possibile è .
  2. Se e , ed indicando con il più piccolo di questi due valori, il numero di runs è compreso tra i seguenti estremi:

    Il massimo valore di corrisponde, nel primo caso, ad un alternarsi di valori positivi e negativi; nel secondo, a singoli valori del segno che si è presentato con minore frequenza che separino sequenze di uno o più valori dell'altro segno.
  3. Se è pari, con , la probabilità di avere runs è data da
  4. ; (C.14)
  5. se è dispari, con (ed ovviamente essendo e ), la probabilità di avere runs è data da
    . (C.15)
  6. In ogni caso, valore medio e varianza di valgono rispettivamente

    e

    .

Nel caso della figura C1 () la probabilità di ottenere casualmente , calcolata applicando direttamente le formule (C.14) e (C.15), vale appena l'1.3%; è insomma lecito (almeno ad un livello di confidenza del 98.7%) rigettare l'ipotesi di un andamento lineare della in funzione di .