POST-STRATIFICAZIONE E CAMPIONAMENTO PER QUOTE
POST-STRATIFICAZIONE
Talvolta, si possono ipotizzare ragionevoli variabili di stratificazione, ma il valore di queste non è noto a priori per tutti gli elementi della popolazione e quindi non si possono utilizzare nella fase di disegno del campione
Ad esempio, in un'indagine sulle famiglie, si vuole stimare la spesa mensile per l'acquisto di beni alimentari. Sarebbe interessante stratificare per dimensione delle famiglie, che è però ignota per le unità della lista. Da una fonte amministrativa è disponibile la distribuzione della dimensione familiare nella popolazione. Tale distribuzione fornisce i Wh
Se si prende un CCS piuttosto grande, il campione assomiglierà a uno stratificato proporzionale con riferimento alla variabile “numero di membri della famiglia" (ciò varrebbe per qualsiasi variabile). Possiamo stimare yh in ogni strato h= 1, 2, …, H e poi combinare yh come in un campione stratificato utilizzando i valori di 𝑊ℎ dati nella distribuzione della popolazione
formulario
In generale allora, se: 𝑊ℎ è noto per strati definiti a valle della rilevazione; nh non è piccolo (>30); n è grande, possiamo considerare la seguente approssimazione per la stima della varianza che è essenzialmente ottenuta utilizzando la varianza dello stratificato proporzionale
Formulario
Questa tecnica è anche utilizzata per correggere gli effetti di mancate risposte che dipendano esclusivamente dalle variabili di post-stratificazione
Esempio slide 13
CAMPIONAMENTO NON PROBABILISTICO PER QUOTE
Alcune unità della popolazione oggetto d’indagine hanno probabilità nulla di entrare a far parte del campione
Esempi:
non si dispone di una lista della popolazione, per cui si reclutano unità campionarie senza partire da una lista
Ma anche: si parte da una lista della popolazione che non coincide con la popolazione d’interesse
Il riferimento è il campionamento stratificato proporzionale
a)Si suddivide la popolazione secondo alcune variabili delle quali si conosce la distribuzione nella popolazione (es: titolo studio dal Censimento)
b)Il campione viene costruito rispettando le proporzioni delle variabili di stratificazione nella popolazione
c)Non è disponibile la lista dettagliata secondo le var. di stratificazione, per cui si prosegue a reclutare fino a che tutte le quote sono riempite
Il campionamento non è probabilistico perché:
Non c’è una selezione casuale da una lista
L’intervistatore è libero di scegliere chi intervistare, presumibilmente chi è più comodo da raggiungere o dà sicurezza di risposta
Infine, nel camp. per quote è impossibile analizzare la qualità del campione mediante un confronto con la distribuzione nella popolazione, perché tale distribuzione è comunque rispettata in virtù del meccanismo delle quote. Non esiste una distribuzione dei dati mancanti
COME SELEZIONARE LE UNITÀ
Indagini telefoniche (tipicamente sondaggi di opinione): le unità sono selezionate a partire dagli elenchi telefonici
Si chiede della presenza di un soggetto con determinate caratteristiche (es. donna fra i 20 e i 40 anni); se assente, si salta alla famiglia successiva
Indagini telefoniche: a partire da numeri generati casualmente
Indagini via web
Interviste faccia a faccia: all’uscita del supermercato, del seggio elettorale, ....
Si scelgono più luoghi, più giorni e più orari, persone con caratteristiche diverse
I SONDAGGI
Esempi su slide
DISEGNO CAMPIONARIO STRATIFICATO VS. PER QUOTE
Quote: è nota la quota della popolazione negli strati, e si cercano rispondenti finché non si riempiono tutti gli strati
Stratificato: la popolazione è suddivisa in strati, da ogni strato è estratto un campione
sono diversi