Pagina:Teoria degli errori e fondamenti di statistica.djvu/51

Da Wikisource.
Jump to navigation Jump to search


4.2.1 La moda

Nella statistica esistono varie stime della cosiddetta tendenza centrale di un campione; una di queste stime è il valore corrispondente al massimo della frequenza, cioè il valore che si è presentato il maggior numero di volte (ovvero la media dei valori contigui che presentassero tutti la medesima massima frequenza): tale stima (se esiste) si chiama moda del campione, e si indica con il simbolo .

In generale però la distribuzione potrebbe non avere massimo (distribuzioni amodali), oppure averne più d’uno in intervalli non contigui (distribuzioni multimodali); anche se questo non dovrebbe essere il caso per le distribuzioni di misure ripetute. Talvolta si dice che la distribuzione non ha moda anche se il massimo esiste, ma si presenta ad uno degli estremi dell’intervallo che contiene le misure; non essendo in tal caso la moda, ovviamente, una stima di tendenza centrale.

Per tutti questi motivi la moda non è di uso molto frequente, e non è opportuna in questo contesto anche per ragioni che saranno esaminate più avanti.

4.2.2 La mediana

Un’altra stima di tendenza centrale di uso frequente nella statistica (anche se non nella fisica) è la mediana di un campione: indicata col simbolo , è definita come quel valore che divide l’istogramma dei dati in due parti di uguale area 1; in termini meno precisi, la mediana lascia un uguale numero di dati alla propria sinistra ed alla propria destra 2. Usando questa forma della definizione, per trovare la mediana di un insieme di valori tutti distinti basta disporli in ordine crescente e prendere il valore centrale (per un numero dispari di misure; si prende la semisomma dei due valori centrali se le misure sono in numero pari).

Al contrario della moda, la mediana esiste sempre; nel diagramma della frequenza cumulativa relativa è definita dall’ascissa corrispondente all’ordinata del 50%. Si può dimostrare anche che la mediana è quel valore di che rende minima la somma dei valori assoluti degli scarti delle nostre

  1. Il valore della mediana di un insieme di dati, così definito, dipende dalla scelta delle classi si frequenza; per questo motivo la mediana in genere non si adopera tanto per i campioni sperimentali di dati, quanto per le distribuzioni teoriche.
  2. Basta applicare le due definizioni ad un insieme di dati composto dai tre valori per rendersi conto della differenza.