Teoria degli errori e fondamenti di statistica/9.8.1

Da Wikisource.
9.8.1 Applicazione: numeri casuali normali

../9.8 ../10 IncludiIntestazione 31 agosto 2022 100% Da definire

9.8 10
[p. 157 modifica]

9.8.1 Applicazione: numeri casuali normali

Siano gli (con ) dei numeri provenienti da una popolazione u distribuita uniformemente nell’intervallo ; abbiamo visto nel paragrafo (8.1) che e . La loro media aritmetica , in conseguenza del teorema del limite centrale, tende asintoticamente (al crescere di N) alla distribuzione normale con media e varianza ; quindi la loro somma è asintoticamente normale con media e varianza ; e, infine, la variabile casuale

(9.10)

è asintoticamente normale con media 0 e varianza 1.

Di questa proprietà si può far uso per ottenere da un computer dei numeri pseudo-casuali con distribuzione (approssimativamente) normale, a partire da altri numeri pseudo-casuali con distribuzione uniforme; in pratica l’approssimazione è già buona quando , e scegliendo possiamo, ad esempio, porre semplicemente

.

È da notare, comunque, che non è buona pratica servirsi di questo metodo: anche se la parte centrale della distribuzione normale è approssimata abbastanza bene, le code mancano totalmente (essendo impossibile che risulti ); l’effetto di questa mancanza, quando (come nelle analisi fisiche basate su metodi di Montecarlo) vengano richiesti numeri pseudo casuali per generare eventi simulati in quantità dell’ordine di milioni almeno, è tale da invalidare completamente i risultati.

Soprattutto, poi, generare numeri pseudo-casuali normali usando il teorema del limite centrale non è solo sbagliato, ma inutile: esistono altri metodi (come ad esempio quello di Box-Muller che discuteremo ora) che sono in grado di generare numeri pseudo-casuali con una vera distribuzione normale usando, per il calcolo, un tempo non molto superiore a quello richiesto dalla (9.10).

Siano x ed y due variabili casuali statisticamente indipendenti, ed aventi distribuzione uniforme nell’intervallo ; consideriamo le altre due variabili casuali u e v definite attraverso le

e . (9.11)
[p. 158 modifica]

Queste funzioni si possono invertire, e risulta

e

con derivate parziali prime date da

e da

Il determinante Jacobiano delle rispetto alle vale

per cui, essendo la densità di probabilità congiunta delle due variabili casuali x ed y data dalla

e applicando la (7.9), la densità di probabilità congiunta della u e della v è data da

e quindi, in conseguenza della (7.8), la u e la v sono due variabili casuali statisticamente indipendenti tra loro ed entrambe aventi funzione di frequenza data dalla distribuzione normale standardizzata; questo è appunto il metodo cosiddetto “di Box-Muller” per la generazione di numeri pseudo-casuali con distribuzione normale, a partire da numeri pseudo-casuali con distribuzione uniforme.

Una variante che consente di sveltire questo metodo (lento, perché l’esecuzione delle funzioni logaritmo, seno e coseno consuma molto tempo [p. 159 modifica]di cpu) consiste nel generare dapprima due numeri pseudo-casuali e distribuiti uniformemente tra i limiti e ; e nell’accettarli se , in modo che il punto P le cui coordinate essi rappresentano nel piano sia uniformemente distribuito entro il cerchio avente centro nell’origine O e raggio unitario — o nel rigettarli in caso contrario, ripetendo il passo precedente.

Questa prima condizione in realtà rallenta il procedimento, perché la coppia di numeri a caso viene accettata con probabilità ; ma se, a questo punto, si usa al posto della x nella (9.11) il valore di S (che, come non è difficile dimostrare, è anch’esso distribuito uniformemente nell’intervallo ); e se si prende poi in luogo dell’angolo l’angolo polare tra e l’asse delle , il calcolo risulta in definitiva molto più rapido: perché il seno ed il coseno di si possono valutare come ed rispettivamente, eseguendo il calcolo di una radice quadrata e due divisioni soltanto.