Stime basate su sequenze di osservazioni

La teoria della stima si occupa di studiare quantitativamente

l'accuratezza con cui si misurano grandezze non deterministiche che dipende dal numero di osservazioni disponibili

Media Campionaria

è il comportamento asintotico della media aritmetica di n variabili aleatorie ed è definita dalla seguente relazione

media campionaria

per quanto riguarda la media si ha

la media campionaria è una variabile aleatoria la cui media statistica si ricava semplicemente utilizzando la proprietà di linearità

si avrà infatti che

media campionaria1media campionaria2media campionaria3

dove μ è la media statistica delle variabili aleatorie X_i. Sinteticamente si dice che S_n è uno stimatore della media statistica.

se lo stimatore è uguale alla grandezza da misurare cioè:

stimatore

lo stimatore si dice non polarizzato cioè il suo valore coincide con il "Valore vero"

per quanto riguarda la varianza si avrà

varianza campionaria1varianza campionaria2varianza campionaria3

svolgendo i calcoli

varianza campionaria4varianza campionaria5

procedendo

varianza campionaria6varianza campionaria7varianza campionaria8

otteniamo in fine che la varianza è uguale

varianza campionaria9varianza campionaria10varianza campionaria11

dove si riconosce facilmente la Covarianza delle variabili aleatorie prese in considerazione

dunque possiamo scrivere senza perdita di generalità

varianza campionaria12varianza campionaria13

nel caso siano indipendenti si avrà

che la covarianza è uguale alla varianza della singola X_i se i=j mentre sarà 0 se i è diverso da j

cov1cov2

da cui possiamo dedurre che la varianza della somma di variabili aleatorie incorrelate è data dalla somma delle varianze delle singole variabili aleatorie

varianza finalevarianza finale2

Se infine le variabili oltre ad essere incorrelate, hanno tutti la stessa varianza si ottiene che

varianza finale3

Legge dei grandi numeri

data una successione di variabili aleatorie indipendenti e identicamente distribuite la media campionaria converge, in media quadratica, al valore comune μ della media statistica delle singole variabili aleatorie

legge dei grandi numeri

tale legge è valida anche se le variabili aleatorie non sono indipendenti ma solamente incorrelate, aventi tutte la stessa media e la stessa varianza

Ci dice essenzialmente che, da un punto di vista analitico, la media statistica coincide con la media aritmetica di un numero molto grande di osservazioni

si può affermare che pur essendo la media campionaria a sua volta una variabile aleatoria, al crescere del numero delle osservazioni essa tende a diventare una quantità deterministica

l'errore quadratico medio che si commette nell'approssimare la media statistica con la media campionaria è inversamente proporzionale al numero di osservazioni

l'errore quadratico medio indica la discrepanza quadratica media fra i valori dei dati osservati ed i valori dei dati stimati.

non si opera con un numero infinito di prove ma con un numero definito che è possibile misurare a partire dalla deviazione standard che si vuole commettere nel calcolare tale probabilità

considerando che più il numero di osservazioni cresce più la deviazione standard decresce

se si considera l'evento A che ha probabilità P(A) di accadere e probabilità 1-P(A) di non accadere per la legge dei grandi numeri si avrà che

legge dei grandi numeri1

dove N_A è il numero di volte che si è verificato l'evento A

la varianza dello stimatore è data

varianza stimatore

dove Var(X_A) è data da P(A)*(1-P(A))

da cui si ottiene che la deviazione standard

dev_standard1dev_standard2

considerando che P(A)*(1-P(A) non sarà mai maggiore di 1/4

partendo da questa definizione

possiamo dire che a seconda di quanto più piccolo vogliamo la nostra deviazione standard possiamo calcolare il numero di osservazioni da dover fare.

in realtà tranne nel caso in cui P(A)=(1-P(A) basta un numero inferiori di osservazioni, per il calcolo preciso bisognerebbe conoscere con precisione la probabilità di P(A)