Teoria degli errori e fondamenti di statistica/8.1.2

Da Wikisource.
8.1.2 Applicazione: generazione di numeri casuali con distribuzione data

../8.1.1 ../8.1.3 IncludiIntestazione 30 agosto 2022 100% Da definire

8.1.2 Applicazione: generazione di numeri casuali con distribuzione data
8.1.1 8.1.3
[p. 96 modifica]

8.1.2 Applicazione: generazione di numeri casuali con distribuzione data

Supponiamo che la variabile casuale x abbia densità di probabilità e funzione di distribuzione : vogliamo ora dimostrare che la variabile casuale è distribuita uniformemente nell’intervallo qualunque siano e . Chiaramente y può appartenere solo a tale intervallo; ed inoltre, essendo funzione integrale di , è dotata della proprietà di essere continua e derivabile in tutto l’insieme di definizione e con derivata prima data da

così che, ricordando l’equazione (6.15), la densità di probabilità della nuova variabile y è data (ove non sia nulla) dalla

come volevamo dimostrare.

Supponiamo sia nota la densità di probabilità di una qualche variabile casuale x; e che si vogliano ottenere dei numeri che si presentino secondo una legge di probabilità data appunto da questa . I moderni calcolatori numerici sono in grado di generare sequenze di numeri casuali1 che hanno distribuzione uniforme in un intervallo dipendente dall’implementazione dell’algoritmo, e che possono a loro volta essere usati per produrre numeri casuali con distribuzione uniforme nell’intervallo ; se y è uno di tali numeri, e se si è in grado di invertire, numericamente od analiticamente, la funzione di distribuzione della variabile casuale x, i numeri

hanno densità di probabilità data da , come appunto richiesto.

Generalmente le funzioni di distribuzione non si sanno invertire per via analitica; un metodo numerico spesso impiegato, e che richiede la sola preventiva conoscenza della (quindi non bisogna nemmeno saper calcolare la , per non parlare della sua inversa) è illustrato qui di seguito (metodo dei rigetti). Si faccia riferimento alla figura 8b: sia x limitata in un intervallo chiuso (nella figura, e ); e si conosca [p. 97 modifica]
Figura 8b - La scelta di un numero a caso con distribuzione prefissata mediante tecniche numeriche (la densità di probabilità è la stessa della figura 4d); la funzione maggiorante è una spezzata (superiormente) o la retta (inferiormente).

[p. 98 modifica]una funzione maggiorante della , ossia una funzione che risulti comunque non inferiore alla f per qualunque .

Nel caso si sappia scegliere, sul piano , un punto con distribuzione uniforme nella parte di piano limitata inferiormente dall’asse delle ascisse, superiormente dalla funzione , e, lateralmente, dalle due rette di equazione ed , basta accettare tale punto se la sua ordinata risulta non superiore alla corrispondente ; e rigettarlo in caso contrario, iterando il procedimento fino a che la condizione precedente non è soddisfatta: le ascisse x dei punti accettati seguono la funzione di distribuzione .

Infatti, i punti accettati saranno distribuiti uniformemente nella parte di piano limitata dalla ; quindi, in un intervallino infinitesimo centrato su una particolare x, vi sarà un numero di punti accettati proporzionale all’altezza della curva sopra di esso — ovverosia ogni ascissa x viene accettata con densità di probabilità che è proprio .

La scelta, infine, di un punto che sia distribuito uniformemente nella parte di piano limitata dalla funzione si sa sicuramente effettuare se è stata scelta in modo che si sappia invertire la sua funzione integrale

così che si possa associare, a qualsiasi valore A compreso tra 0 e , quella che lascia alla propria sinistra un’area A al di sotto della funzione (una scelta banale è quella di prendere come maggiorante una retta, o meglio una spezzata — come illustrato nella figura 8b).

In tal caso basta scegliere un numero A con distribuzione uniforme tra i limiti e ; trovare la che soddisfa la condizione precedente; ed infine scegliere una y con distribuzione uniforme tra 0 e . Non è difficile rendersi conto che il punto soddisfa alla condizione richiesta di essere distribuito uniformemente nella parte del semipiano limitata superiormente dalla funzione : a questo punto non rimane che calcolare la ed accettare x se .

Se proprio non si è in grado di effettuare una scelta migliore, anche una retta del tipo può andar bene; basta tener presente che l’algoritmo viene sfruttato tanto più efficacemente quanto più è vicina alla (in tal caso il numero di rigetti è minore).

Per questo motivo, una scelta del tipo è assolutamente da evitare se la è sensibilmente diversa da zero solo in una parte ristretta dell’intervallo di definizione (perché in tal caso la scelta uniforme di x all’interno dell’area su detta ci farebbe trascorrere gran parte del tempo ad esa[p. 99 modifica]minare valori poco probabili rispetto alla , che vengono in conseguenza quasi sempre rifiutati).

Note

  1. O meglio pseudo-casuali: ovverosia prodotti da un algoritmo ripetibile, quindi non propriamente “imprevedibili”; ma in modo tale che le loro proprietà statistiche siano indistinguibili da quelle di una sequenza casuale propriamente detta.