Teoria degli errori e fondamenti di statistica/12.2.2

Questo testo è stato riletto e controllato.

Maurizio Loreti - Teoria degli errori e fondamenti di statistica (2006)

12.2.2 Il metodo del minimo χ²

Informazioni sulla fonte del testo

◄

12.2.1

12.2.3

►

[p. 205 modifica]

12.2.2 Il metodo del minimo $\chi ^{2}$

Supponiamo di sapere a priori che i nostri dati istogrammati debbano seguire una data distribuzione, ma che essa dipenda da $R$ parametri incogniti che dobbiamo stimare a partire dai dati stessi; visto che l’accordo tra i dati e la distribuzione è dato dalla $X$ definita nella (12.9), ed è tanto migliore quanto più il valore ottenuto per essa è basso, un metodo plausibile di stima potrebbe essere quello di trovare per quali valori dei parametri stessi la $X$ è minima (metodo del minimo $\chi ^{2}$ ).

Indicando con

\alpha _{k}

(

k=1,\ldots ,R

) i parametri da stimare, ognuna delle

p_{i}

sarà esprimibile in funzione delle

\alpha _{k}

; ed imponendo che le derivate prime della

X

rispetto ad ognuna delle

\alpha _{k}

siano tutte nulle contemporaneamente, [p. 206 modifica]

Figura 12b L’integrale da

x

a

+\infty

della funzione di frequenza del

\chi ^{2}

, per alcuni valori del parametro

N

.

[p. 207 modifica]

Figura 12c - I valori del

\chi ^{2}

ridotto (

\chi ^{2}/N

) che corrispondono, per differenti gradi di libertà

N

, ad un certo livello di confidenza.

[p. 208 modifica]otteniamo

${\frac {\partial X}{\partial \alpha _{k}}}\;=\;\sum _{i=1}^{M}{\frac {-2\left(n_{i}-Np_{i}\right)N^{2}p_{i}-N\left(n_{i}-Np_{i}\right)^{2}}{N^{2}{p_{i}}^{2}}}\,{\frac {\partial p_{i}}{\partial \alpha _{k}}}\;=\;0,$

ossia

-{\frac {1}{2}}\,{\frac {\partial X}{\partial \alpha _{k}}}\;=\;\sum _{i=1}^{M}\left[{\frac {n_{i}-Np_{i}}{p_{i}}}+{\frac {\left(n_{i}-Np_{i}\right)^{2}}{2N{p_{i}}^{2}}}\right]{\frac {\partial p_{i}}{\partial \alpha _{k}}}\;=\;0.

(12.10)

L’insieme delle (12.10) costituisce un sistema di $R$ equazioni, nelle $R$ incognite $\alpha _{k}$ , che ci permetterà di stimarne i valori (salvo poi, nel caso il sistema delle (12.10) abbia più di una soluzione, controllare quali di esse corrispondono in effetti ad un minimo e quale tra queste ultime corrisponde al minimo assoluto); le condizioni sotto le quali il metodo è applicabile sono quelle già enunciate in precedenza¹, ossia ${p_{i}}^{2}\ll p_{i}$ e $n_{i}\gtrsim 5$ .

In genere però si preferisce servirsi, in luogo delle equazioni (12.10), di una forma semplificata, ottenuta trascurando il secondo termine nella parentesi quadra: che, si può dimostrare, è molto inferiore al primo per grandi $N$ (infatti il rapporto tra i due termini vale

${\frac {\left(n_{i}-Np_{i}\right)^{2}}{2N{p_{i}}^{2}}}\,{\frac {p_{i}}{n_{i}-Np_{i}}}\;=\;{\frac {n_{i}-Np_{i}}{2Np_{i}}}\;=\;{\frac {1}{2p_{i}}}\left({\frac {n_{i}}{N}}-p_{i}\right)$

e converge ovviamente a zero all’aumentare di $N$ ); e risolvere, insomma, il sistema delle

\sum _{i=1}^{M}\left({\frac {n_{i}-Np_{i}}{p_{i}}}\right){\frac {\partial p_{i}}{\partial \alpha _{k}}}=0

(12.11)

(metodo semplificato del minimo $\chi ^{2}$ ).

Si può dimostrare che le soluzioni ${\bar {\alpha }}_{k}$ del sistema delle (12.11) tendono stocasticamente ai valori veri $\alpha _{k}^{*}$ (in assenza di errori sistematici) al crescere di $N$ ; inoltre il valore di $X$ calcolato in corrispondenza dei valori ricavati ${\bar {\alpha }}_{k}$ dà, se rapportato alla distribuzione del $\chi ^{2}$ con $M-R-1$ gradi di libertà, una misura della bontà della soluzione stessa.

Ora, le equazioni (12.11) si possono scrivere anche

$\sum _{i=1}^{M}\left({\frac {n_{i}-Np_{i}}{p_{i}}}\right){\frac {\partial p_{i}}{\partial \alpha _{k}}}=\sum _{i=1}^{M}{\frac {n_{i}}{p_{i}}}\,{\frac {\partial p_{i}}{\partial \alpha _{k}}}-N\sum _{i=1}^{M}{\frac {\partial p_{i}}{\partial \alpha _{k}}}$

[p. 209 modifica]e si possono ulteriormente semplificare, visto che l’ultimo termine si annulla, essendo

$\sum _{i=1}^{M}{\frac {\partial p_{i}}{\partial \alpha _{k}}}\;=\;{\frac {\partial }{\partial \alpha _{k}}}\sum _{i=1}^{M}p_{i}\;=\;{\frac {\partial }{\partial \alpha _{k}}}\,1\;\equiv \;0$

se si fa l’ulteriore ipotesi che l’intervallo dei valori indagati copra, anche approssimativamente, tutti quelli in pratica permessi; per cui il sistema di equazioni da risolvere è in questo caso quello delle

\sum _{i=1}^{M}{\frac {n_{i}}{p_{i}}}\,{\frac {\partial p_{i}}{\partial \alpha _{k}}}=0

.

(12.12)

Per la stima di parametri incogniti a partire da dati misurati abbiamo già affermato che teoricamente è da preferire il metodo della massima verosimiglianza, le cui soluzioni sono quelle affette, come sappiamo, dal minimo errore casuale (almeno asintoticamente); in questo caso particolare (dati in istogramma), come lo si dovrebbe applicare? Se le misure sono indipendenti, la probabilità di avere $n_{i}$ eventi nella generica classe di frequenza è data da $p_{i}^{n_{i}}$ ; la funzione di verosimiglianza² da

{\mathcal {L}}(\alpha _{1},\ldots ,\alpha _{R})=\prod _{i=1}^{M}p_{i}^{n_{i}}

(12.13)

ed il suo logaritmo da

$\ln {\mathcal {L}}=\sum _{i=1}^{M}\left(n_{i}\cdot \ln p_{i}\right)$ .

La soluzione di massima verosimiglianza (e quindi di minima varianza) si trova cercando il massimo di $\ln {\mathcal {L}}$ : e risolvendo quindi il sistema delle

${\frac {\partial }{\partial \alpha _{k}}}\,\ln {\mathcal {L}}\;=\;\sum _{i=1}^{M}n_{i}\,{\frac {1}{p_{i}}}\,{\frac {\partial p_{i}}{\partial \alpha _{k}}}\;=\;0$ ;

in questo caso, vista l’equazione (12.12) in precedenza ricavata, i due metodi (della massima verosimiglianza e del minimo $\chi ^{2}$ semplificato) conducono dunque alla stessa soluzione.

Note

↑ Se la prima di esse non si può ritenere accettabile, delle equazioni ancora valide ma più complesse si possono ottenere dalla (12.9) sostituendo $Np_{i}(1-p_{i})$ al posto di $Np_{i}$ nel denominatore.
↑ Per essere precisi, la probabilità che $n_{1}$ misure si trovino nella prima classe di frequenza, $n_{2}$ nella seconda e così via, è dato dalla espressione (12.13) moltiplicata per il numero di modi differenti in cui $N$ oggetti possono essere suddivisi in $M$ gruppi composti da $n_{1},n_{2},\ldots ,n_{M}$ oggetti rispettivamente (numero delle partizioni ordinate) questo vale, come mostrato nel paragrafo A.7, $N!/(n_{1}!\,n_{2}!\cdots n_{M}!)$ , e rappresenta un fattore costante che non incide nella ricerca del massimo della (12.13).

[1] Se la prima di esse non si può ritenere accettabile, delle equazioni ancora valide ma più complesse si possono ottenere dalla (12.9) sostituendo $Np_{i}(1-p_{i})$ al posto di $Np_{i}$ nel denominatore.

[2] Per essere precisi, la probabilità che $n_{1}$ misure si trovino nella prima classe di frequenza, $n_{2}$ nella seconda e così via, è dato dalla espressione (12.13) moltiplicata per il numero di modi differenti in cui $N$ oggetti possono essere suddivisi in $M$ gruppi composti da $n_{1},n_{2},\ldots ,n_{M}$ oggetti rispettivamente (numero delle partizioni ordinate) questo vale, come mostrato nel paragrafo A.7, $N!/(n_{1}!\,n_{2}!\cdots n_{M}!)$ , e rappresenta un fattore costante che non incide nella ricerca del massimo della (12.13).

1

2