Please enable JavaScript.
Coggle requires JavaScript to display documents.
Economics for Data Science - Coggle Diagram
Economics for Data Science
Validità del modello di inferenza causale
Modello causale
Causazione
Teoria
Visione retrospettiva
Bias
Modello predittivo
Associazione
Dati
Visione prospettiva
Bias-variance trade off
4 domande per una ricerca
Effetto di interesse?
Esperimento adatto?
Identification strategy?
Modalità inferenza statistica?
OLS
Assunzioni
E(u | X) = E(u) = o
(Xi, Yi) son iid
X ed Y hanno momenti fino al quarto
Minacce per la validità interna
Omitted variable bias
Sample selection bias
Simultaneous casuality bias
Wrong functional form bias
Measurament error
Econometria vs Data science
Econometria
Interesse nella relazione causale
Teoria
Migliora con DS
DS
Focus su previsioni
Ambiente di studio stabile
Critica di Lucas
Now casting
Mancanza di teoria
Mancanza di significatività statistica
Migliora con econometria
Prediction Policy problems
Problemi che richiedono solo previsioni
Machine Learning
Predictive and causal question
Problemi di previsione
Interesse anche in domande causali
DS + Econometria
Valutazione del programma ed inferenza causale
Modello causale di Rubin
Y0: risultato potenziale senza il trattamento
Y1: risultato potenziale con il trattamento
D = 0: se i non riceve il trattamento
D=1: se i riceve il trattamento
Risultato atteso: Y = DY1 + (1-D)Y0
Non si conoscono i controfattuali
Y1 | D=0
Y0 | D=1
E(Y|D=1) - E(Y|D=0) = effetto del trattamento + bias
Bias dovuto alla selezione
Parametri di interesse
ATE = E(Y1 - Y0|X)
TTE = E(Y1 - Y0|X, D=1)
UTE = E(Y1 - Y0|X, D=0)
Program evaluation
Difficoltà ottenere controfattuali
Esperimenti
Naturale
Randomizzati
E(Yi|D=1) = E(Yi|D=0) = E(Yi) per i = 0,1
Posso calcolare ATE = E(Y1) - E(Y0)
Procedura
1: randomizzare elegibbilità
2: randomizzare treatment e control
Stimatore differenze
y = a + bD + u
b^ effetto causale
Problemi
Costi
Funziona in media
può richiedere anni
Etici
Minacce validità interna
Mancata randomizzazione
Partial compliance
Abbandono
Distorsione sperimentale
Comportano stimatore distorti
Minacce validità esterna
Campione non rappresentativo
Effetti di equilibrio generale
OLS corretto, ma effetto causale rilevato sbagliato
Dati per costruire controfattuale
Differences in differences (DID)
Dati panel
Common trend assumption
Machine learning con TTC per costruire controfattuali
β^ = (Ytreat,1 - Ytreat,0) - (Ycontrol,1 - Ycontrol,0)
Matching estimator
Assunzioni
(Y0, Y1) indip D | Z
0 < P(D = 1|Z) < 1
E(Z|D, Y1, Y0) = E(Z|Y1, Y0)
Idea: associo 2 individui di gruppo e controllo in base a variabile Z
Propensity Score: P(D = 1|Z)
Problema univariato
(Y0, Y1) ind D| P(D = 1|Z)
Regression Discontinuity
Essere assegnato al trattamento dipende da una variabili
Sharp
Netta
Yi = α + f(xi) + ρDi + ui
D = 1 se xi >= x*
D = 0 se xi < x*
ρ effetto causale
Fuzzy
Altri fattori oltre la soglia influenza l'assegnazione
P(Di = 1 | xi) =g1(xi) se xi >= x*
P(Di = 1 | xi) =g0(xi) se xi < x*
Bassa validità esterna
Alta validità interna
Meccanismi Causali
Mediation analysis
Total effetct = direct effetct + indirect effect
ATE = ACME + ADE
Modelli strutturali
Equazioni basate su assunzioni teoriche
Dati empirici per stimare i parametri
Interesse sia nella previsione sia nel comportamento individuale
DCDP
Esperimenti
Modello per scolarizzazione e lavoro minorile
Progresa