Teoria degli errori e fondamenti di statistica/6.1

Da Wikisource.
6.1 La densità di probabilità

../6 ../6.2 IncludiIntestazione 29 agosto 2022 100% Da definire

6 6.2

[p. 65 modifica]

6.1 La densità di probabilità

Definiamo arbitrariamente delle classi di frequenza, suddividendo l’asse delle in intervalli di ampiezze che, per semplicità, supponiamo siano tutte uguali; ed immaginiamo di fare un certo numero di misure della grandezza fisica . Come sappiamo, possiamo riportare le misure ottenute in istogramma tracciando, al di sopra dell’intervallo che rappresenta ogni classe, un rettangolo avente area uguale alla frequenza relativa1 con cui una misura è caduta in essa; l’altezza dell’istogramma in ogni intervallo è data quindi da tale frequenza divisa per l’ampiezza dell’intervallo di base, e l’area totale dell’istogramma stesso vale uno. [p. 66 modifica]
Figura 6a - Nella prima figura, l’istogramma della grandezza per un numero piccolo di misure; nella seconda, lo stesso istogramma per un numero molto grande di misure; nell’ultima, l’istogramma si approssima alla curva limite quando l’intervallo di base tende a zero.

Frequenze relative


[p. 67 modifica]

Se immaginiamo di far tendere all’infinito il numero di misure effettuate, in base alla legge dei grandi numeri ci aspettiamo un “aggiustamento” dell’istogramma in modo che l’area rappresentata sopra ogni intervallo tenda alla probabilità che il valore misurato cada entro di esso; le altezze tenderanno quindi al rapporto tra questa probabilità e l’ampiezza dell’intervallo di base dell’istogramma.

Disponendo di un numero infinitamente grande di misure, ha senso diminuire l’ampiezza degli intervalli in cui l’asse delle x è stato diviso, e renderla piccola a piacere. Se l’intervallo corrispondente ad una data classe di frequenza tende a zero, la probabilità che una misura cada in esso tende ugualmente a zero; ma se esiste ed è finito il limite del rapporto tra probabilità dp ed ampiezza dx dell’intervallo, l’istogramma tenderà ad una curva continua la cui ordinata sarà in ogni punto data da tale limite.

L’ordinata di questa curva al di sopra di un intervallo infinitesimo dx vale quindi

e le dimensioni della grandezza y sono quelle di una probabilità (un numero puro) divise per quelle della grandezza x; la y prende il nome di densità di probabilità, o di funzione di frequenza, della x.

La variabile continua schematizza il caso in cui i valori osservabili (sempre discreti per la sensibilità limitata degli strumenti) sono molto densi, separati cioè da intervalli molto piccoli, e assai numerosi. In questa situazione la probabilità di osservare uno solo di tali valori è anch’essa estremamente piccola — ed ha interesse soltanto la probabilità che venga osservato uno tra i molti possibili valori della che cadono in un dato intervallo di ampiezza grande rispetto alla risoluzione sperimentale.

Se dividiamo tale intervallo in un numero molto grande di sottointervalli infinitesimi di ampiezza dx, gli eventi casuali consistenti nell’appartenere il risultato della misura ad una delle classi di frequenza relative sono mutuamente esclusivi; di conseguenza, vista l’equazione (3.2), la probabilità che x appartenga all’intervallo finito e data dalla somma delle probabilità (infinitesime) rispettive : e questa, per definizione, è l’integrale di rispetto ad nell’intervallo .

Insomma, qualunque sia l’intervallo vale la

;

e, in definitiva:

Per le variabili continue non si può parlare di probabilità attraverso le definizioni già esaminate. È invece possibile associare ad ogni [p. 68 modifica]
variabile continua x una funzione “densità di probabilità” , da cui si può dedurre la probabilità che la x cada in un qualsiasi intervallo finito prefissato: questa è data semplicemente dall’area sottesa dalla curva nell’intervallo in questione.

Analogamente al concetto sperimentale di frequenza cumulativa relativa, introdotto a pagina 33 nel paragrafo 4.1, si può definire la funzione di distribuzione per una variabile continua x come

.

Essa rappresenta la probabilità di osservare un valore non superiore ad x, e dovrà necessariamente soddisfare la . Quindi deve valere la cosiddetta

Condizione di normalizzazione: l’integrale di una qualunque funzione che rappresenti una densità di probabilità, nell’intervallo vale 1.
. (6.1)

È da enfatizzare come il solo fatto che valga la condizione di normalizzazione, ossia che converga l’integrale (6.1), è sufficiente a garantire che una qualsiasi funzione che rappresenti una densità di probabilità debba tendere a zero quando la variabile indipendente tende a più o meno infinito; e questo senza alcun riferimento alla particolare natura del fenomeno casuale cui essa è collegata. Questo non è sorprendente, visto che la disuguaglianza (5.7) di Bienaymé-Cebyšef implica che a distanze via via crescenti dal valore medio di una qualsiasi variabile casuale corrispondano probabilità via via decrescenti, e che si annullano asintoticamente.

Al lettore attento non sarà sfuggito il fatto che, per introdurre il concetto di densità di probabilità, ci si è ancora una volta basati sul risultato di un esperimento reale (l’istogramma delle frequenze relative in un campione); e si è ipotizzato poi che la rappresentazione di tale esperimento si comporti in un determinato modo quando alcuni parametri (il numero di misure e la sensibilità sperimentale) vengono fatti tendere a limiti che, nella pratica, sono irraggiungibili.

Questo è in un certo senso analogo all’enfasi che abbiamo prima posto sulla definizione empirica della probabilità, in quanto più vicina all’esperienza reale di una definizione totalmente astratta come quella assiomatica; per un matematico la densità di probabilità di una variabile casuale continua è [p. 69 modifica]invece definita semplicemente come una funzione non negativa, integrabile su tutto l’asse reale e che obbedisca alla condizione di normalizzazione. Il passo successivo consiste nell’associare ad ogni intervallo infinitesimo dx la quantità , e ad ogni intervallo finito il corrispondente integrale: integrale che, come si può facilmente controllare, soddisfa la definizione assiomatica di probabilità.

Note

  1. Non vi è alcuna differenza nell’usare frequenze relative o assolute: essendo esse proporzionali l’una all’altra, l’aspetto dell’istogramma è il medesimo — cambia solo la scala dell’asse delle ordinate.