Teoria degli errori e fondamenti di statistica/12.2.2

Da Wikisource.
12.2.2 Il metodo del minimo χ²

../12.2.1 ../12.2.3 IncludiIntestazione 1 settembre 2022 100% Da definire

12.2.1 12.2.3

[p. 205 modifica]

12.2.2 Il metodo del minimo

Supponiamo di sapere a priori che i nostri dati istogrammati debbano seguire una data distribuzione, ma che essa dipenda da parametri incogniti che dobbiamo stimare a partire dai dati stessi; visto che l’accordo tra i dati e la distribuzione è dato dalla definita nella (12.9), ed è tanto migliore quanto più il valore ottenuto per essa è basso, un metodo plausibile di stima potrebbe essere quello di trovare per quali valori dei parametri stessi la è minima (metodo del minimo ).

Indicando con () i parametri da stimare, ognuna delle sarà esprimibile in funzione delle ; ed imponendo che le derivate prime della rispetto ad ognuna delle siano tutte nulle contemporaneamente, [p. 206 modifica]
Figura 12b L’integrale da a della funzione di frequenza del , per alcuni valori del parametro .

[p. 207 modifica]
Figura 12c - I valori del ridotto () che corrispondono, per differenti gradi di libertà , ad un certo livello di confidenza.

[p. 208 modifica]otteniamo

ossia

(12.10)

L’insieme delle (12.10) costituisce un sistema di equazioni, nelle incognite , che ci permetterà di stimarne i valori (salvo poi, nel caso il sistema delle (12.10) abbia più di una soluzione, controllare quali di esse corrispondono in effetti ad un minimo e quale tra queste ultime corrisponde al minimo assoluto); le condizioni sotto le quali il metodo è applicabile sono quelle già enunciate in precedenza1, ossia e .

In genere però si preferisce servirsi, in luogo delle equazioni (12.10), di una forma semplificata, ottenuta trascurando il secondo termine nella parentesi quadra: che, si può dimostrare, è molto inferiore al primo per grandi (infatti il rapporto tra i due termini vale

e converge ovviamente a zero all’aumentare di ); e risolvere, insomma, il sistema delle

(12.11)

(metodo semplificato del minimo ).

Si può dimostrare che le soluzioni del sistema delle (12.11) tendono stocasticamente ai valori veri (in assenza di errori sistematici) al crescere di ; inoltre il valore di calcolato in corrispondenza dei valori ricavati dà, se rapportato alla distribuzione del con gradi di libertà, una misura della bontà della soluzione stessa.

Ora, le equazioni (12.11) si possono scrivere anche

[p. 209 modifica]e si possono ulteriormente semplificare, visto che l’ultimo termine si annulla, essendo

se si fa l’ulteriore ipotesi che l’intervallo dei valori indagati copra, anche approssimativamente, tutti quelli in pratica permessi; per cui il sistema di equazioni da risolvere è in questo caso quello delle

. (12.12)

Per la stima di parametri incogniti a partire da dati misurati abbiamo già affermato che teoricamente è da preferire il metodo della massima verosimiglianza, le cui soluzioni sono quelle affette, come sappiamo, dal minimo errore casuale (almeno asintoticamente); in questo caso particolare (dati in istogramma), come lo si dovrebbe applicare? Se le misure sono indipendenti, la probabilità di avere eventi nella generica classe di frequenza è data da ; la funzione di verosimiglianza2 da

(12.13)

ed il suo logaritmo da

.

La soluzione di massima verosimiglianza (e quindi di minima varianza) si trova cercando il massimo di : e risolvendo quindi il sistema delle

;

in questo caso, vista l’equazione (12.12) in precedenza ricavata, i due metodi (della massima verosimiglianza e del minimo semplificato) conducono dunque alla stessa soluzione.

Note

  1. Se la prima di esse non si può ritenere accettabile, delle equazioni ancora valide ma più complesse si possono ottenere dalla (12.9) sostituendo al posto di nel denominatore.
  2. Per essere precisi, la probabilità che misure si trovino nella prima classe di frequenza, nella seconda e così via, è dato dalla espressione (12.13) moltiplicata per il numero di modi differenti in cui oggetti possono essere suddivisi in gruppi composti da oggetti rispettivamente (numero delle partizioni ordinate) questo vale, come mostrato nel paragrafo A.7, , e rappresenta un fattore costante che non incide nella ricerca del massimo della (12.13).