POST-STRATIFICAZIONE E CAMPIONAMENTO PER QUOTE

POST-STRATIFICAZIONE

Talvolta, si possono ipotizzare ragionevoli variabili di stratificazione, ma il valore di queste non è noto a priori per tutti gli elementi della popolazione e quindi non si possono utilizzare nella fase di disegno del campione

Ad esempio, in un'indagine sulle famiglie, si vuole stimare la spesa mensile per l'acquisto di beni alimentari. Sarebbe interessante stratificare per dimensione delle famiglie, che è però ignota per le unità della lista. Da una fonte amministrativa è disponibile la distribuzione della dimensione familiare nella popolazione. Tale distribuzione fornisce i Wh

Se si prende un CCS piuttosto grande, il campione assomiglierà a uno stratificato proporzionale con riferimento alla variabile “numero di membri della famiglia" (ciò varrebbe per qualsiasi variabile). Possiamo stimare yh in ogni strato h= 1, 2, …, H e poi combinare yh come in un campione stratificato utilizzando i valori di 𝑊ℎ dati nella distribuzione della popolazione

formulario

In generale allora, se: 𝑊ℎ è noto per strati definiti a valle della rilevazione; nh non è piccolo (>30); n è grande, possiamo considerare la seguente approssimazione per la stima della varianza che è essenzialmente ottenuta utilizzando la varianza dello stratificato proporzionale

Formulario

Questa tecnica è anche utilizzata per correggere gli effetti di mancate risposte che dipendano esclusivamente dalle variabili di post-stratificazione

Esempio slide 13

CAMPIONAMENTO NON PROBABILISTICO PER QUOTE

Alcune unità della popolazione oggetto d’indagine hanno probabilità nulla di entrare a far parte del campione

Esempi:

non si dispone di una lista della popolazione, per cui si reclutano unità campionarie senza partire da una lista

Ma anche: si parte da una lista della popolazione che non coincide con la popolazione d’interesse

Il riferimento è il campionamento stratificato proporzionale

a)Si suddivide la popolazione secondo alcune variabili delle quali si conosce la distribuzione nella popolazione (es: titolo studio dal Censimento)

b)Il campione viene costruito rispettando le proporzioni delle variabili di stratificazione nella popolazione

c)Non è disponibile la lista dettagliata secondo le var. di stratificazione, per cui si prosegue a reclutare fino a che tutte le quote sono riempite

Il campionamento non è probabilistico perché:

Non c’è una selezione casuale da una lista

L’intervistatore è libero di scegliere chi intervistare, presumibilmente chi è più comodo da raggiungere o dà sicurezza di risposta

Infine, nel camp. per quote è impossibile analizzare la qualità del campione mediante un confronto con la distribuzione nella popolazione, perché tale distribuzione è comunque rispettata in virtù del meccanismo delle quote. Non esiste una distribuzione dei dati mancanti

COME SELEZIONARE LE UNITÀ

Indagini telefoniche (tipicamente sondaggi di opinione): le unità sono selezionate a partire dagli elenchi telefonici

Si chiede della presenza di un soggetto con determinate caratteristiche (es. donna fra i 20 e i 40 anni); se assente, si salta alla famiglia successiva

Indagini telefoniche: a partire da numeri generati casualmente

Indagini via web

Interviste faccia a faccia: all’uscita del supermercato, del seggio elettorale, ....

Si scelgono più luoghi, più giorni e più orari, persone con caratteristiche diverse

I SONDAGGI

Esempi su slide

DISEGNO CAMPIONARIO STRATIFICATO VS. PER QUOTE

Quote: è nota la quota della popolazione negli strati, e si cercano rispondenti finché non si riempiono tutti gli strati

Stratificato: la popolazione è suddivisa in strati, da ogni strato è estratto un campione

sono diversi