Teoria degli errori e fondamenti di statistica/C.4.1

Da Wikisource.
C.4.1 Riscrittura delle equazioni dei minimi quadrati

../C.4 ../C.4.2 IncludiIntestazione 3 settembre 2022 100% Da definire

C.4.1 Riscrittura delle equazioni dei minimi quadrati
C.4 C.4.2

[p. 262 modifica]

C.4.1 Riscrittura delle equazioni dei minimi quadrati

Sebbene i valori della siano scelti dallo sperimentatore e privi di errore, e non siano pertanto variabili casuali in senso stretto; e sebbene la variabilità delle sia dovuta non solo agli errori casuali di misura ma anche alla variazione della , introduciamo ugualmente (in maniera puramente formale) le medie e le varianze degli valori e , date dalle espressioni

e

(e simili per la ); e la covarianza di e , data dalla

.


Queste grandezze permettono di riscrivere le equazioni (11.9) risolutive del problema dell'interpolazione lineare per un insieme di dati, che abbiamo già incontrato a pagina 181, nella forma

La prima equazione intanto implica che la retta interpolante deve passare per il punto le cui coordinate sono le medie dei valori misurati delle due variabili in gioco; poi, ricavando da essa e sostituendo nella seconda equazione, dopo aver semplificato alcuni termini si ottiene la soluzione per l'altra incognita:

(C.6)

e la retta interpolante ha quindi equazione

[p. 263 modifica]

o anche

(in cui ha il valore (C.6)). Introduciamo ora le due variabili casuali ausiliarie e , per le quali valgono le

e

(con le analoghe per ed ), ed inoltre la

ed indichiamo poi con il valore della sulla retta interpolante in corrispondenza dell’ascissa :

(C.7)

e con la differenza . Le differenze prendono il nome di residui, e di essi ci occuperemo ancora più avanti; risulta che

in cui è il coefficiente di correlazione lineare calcolato usando, sempre solo formalmente, i campioni dei valori misurati delle e delle .

Visto che quest’ultimo, nel calcolo dell’interpolazione lineare fatto con le calcolatrici da tasca, viene in genere dato come sottoprodotto dell’algoritmo, [p. 264 modifica]la sua conoscenza permette (usando questa formula) di ottenere facilmente l’errore a posteriori sulle ordinate interpolate (studiato nel paragrafo 11.4.2):

(C.8)

oltre a fornire una grossolana stima dell’allineamento dei punti; quanto più infatti esso è rigoroso, tanto più si avvicina a .

Il valore dell’errore rappresenta sempre anche una stima dell’allineamento dei punti, a differenza del coefficiente di correlazione lineare, per cui implica allineamento perfetto, ma non inversamente: potendo essere ad esempio (punti su di una retta parallela all’asse ) e ancora con allineamento perfetto.

È opportuno qui osservare che non è il coefficiente di correlazione fra gli errori delle grandezze ed ; infatti, per ipotesi, la non è affetta da errore e, se pur lo fosse, la correlazione fra gli errori sarebbe nulla qualora ciascuna fosse misurata indipendentemente dalla corrispondente o, altrimenti, sarebbe tanto più prossima ai valori estremi quanto maggiore fosse il numero di cause d’errore comuni alle misure di e di .

Invece è il coefficiente di correlazione per l’insieme dei punti aventi coordinate date dalle coppie di valori misurati, e nell’ipotesi di effettiva dipendenza lineare delle grandezze ed sarebbe sempre rigorosamente uguale a se non intervenissero gli errori sperimentali.