Teoria degli errori e fondamenti di statistica/8.4

Da Wikisource.
8.4 La distribuzione di Bernoulli

../8.3.1 ../8.4.1 IncludiIntestazione 30 agosto 2022 100% Da definire

8.3.1 8.4.1

[p. 108 modifica]

8.4 La distribuzione di Bernoulli

Consideriamo un evento casuale ripetibile E, avente probabilità costante p di verificarsi; indichiamo con la probabilità del non verificarsi di E (cioè la probabilità dell’evento complementare ). Vogliamo ora determinare la probabilità che in N prove ripetute E si verifichi esattamente x volte (deve necessariamente risultare ).

L’evento casuale costituito dal presentarsi di E per x volte (e quindi dal presentarsi di per le restanti ) è un evento complesso che può verificarsi in diverse maniere, corrispondenti a tutte le diverse possibili sequenze di successi e fallimenti; queste sono ovviamente mutuamente esclusive, ed in numero pari a quello delle possibili combinazioni di N oggetti a x a x, che vale

.

 [p. 109 modifica]

Essendo poi ognuna delle prove statisticamente indipendente dalle altre (infatti la probabilità di E non cambia di prova in prova), ognuna delle possibili sequenze di x successi ed fallimenti ha una probabilità di presentarsi che vale ; in definitiva

(8.7)

Questa distribuzione di probabilità per una variabile casuale discreta x si chiama distribuzione binomiale o di Bernoulli1; vogliamo ora determinarne alcune costanti caratteristiche.

Verifichiamo per prima cosa che vale la condizione di normalizzazione: sfruttando la formula per lo sviluppo delle potenze del binomio, risulta

.

Vogliamo ora calcolare la speranza matematica della variabile x (ossia il numero di successi attesi, in media, in N prove): per questo useremo la stessa variabile casuale ausiliaria già considerata nel paragrafo 5.6.3, y, che rappresenta il numero di successi nella generica delle N prove eseguite.

Avevamo a suo tempo già calcolato, sempre nel paragrafo 5.6.3, la speranza matematica della y

;

e, osservando che anche può assumere i due soli valori 1 e 0, sempre con le probabilità rispettive p e q,

e quindi la varianza della y esiste e vale

(8.8)

Il numero totale x di successi nelle N prove è legato ai valori y_i della y in ognuna di esse dalla

[p. 110 modifica]

e risulta quindi, per speranza matematica e varianza della distribuzione binomiale,

.


Figura 8e - La distribuzione binomiale, per un numero di prove e due differenti valori della probabilità p.

Come è evidente dalla figura 8e, la forma della distribuzione binomiale è molto simile a quella di una curva di Gauss; si può in effetti dimostrare che [p. 111 modifica]quando N tende all’infinito la distribuzione di probabilità dei possibili valori tende ad una distribuzione normale avente la stessa media Np e la stessa varianza Npq. Infatti la funzione generatrice dei momenti della distribuzione di Bernoulli è

o anche, ricordando che ,

e se, per semplificare i calcoli, ci riferiamo alla variabile standardizzata

ove si è posto

e

applicando la (6.16) si trova

da cui, passando ai logaritmi naturali, [p. 112 modifica]

ove si è sviluppato in serie di McLaurin prima

e poi

e si sono svolti i prodotti tenendo solo i termini dei primi ordini.

Chiaramente quando viene fatto tendere all'infinito tutti i termini eccetto il primo tendono a zero, per cui

[p. 113 modifica]

e tende quindi alla funzione generatrice dei momenti di una distribuzione normale standardizzata; in conseguenza si è effettivamente provato, visto uno dei teoremi citati nel paragrafo 6.4, che la distribuzione binomiale tende ad una distribuzione normale.

In pratica, quando il numero di prove N è elevato e la probabilità p non è troppo vicina ai valori estremi 0 ed 1, la distribuzione binomiale è bene approssimata da una distribuzione normale; in generale si ritiene che l’approssimazione sia accettabile quando entrambi i prodotti Np e Nq hanno valore non inferiore a 5.

Note

  1. I Bernoulli furono una famiglia originaria di Anversa poi trasferitasi a Basilea, numerosi membri della quale ebbero importanza per le scienze del diciassettesimo e del diciottesimo secolo; quello cui vanno attribuiti gli studi di statistica ebbe nome Jacob (o Jacques), visse dal 1654 al 1705, e fu zio del più noto Daniel (cui si deve il teorema di Bernoulli della dinamica dei fluidi).