Please enable JavaScript.
Coggle requires JavaScript to display documents.
7 Survey sampling (Stratified Random Sampling (Methods of allocation…
7 Survey sampling
-
Estimation of a ratio
-
-
With simple random sampling, the approximate variance of \(R=\bar{Y}/\bar{X}\) is
\[Var(R)\approx\frac{1}{\mu_{x}^{2}}\left(r^{2}\sigma_{\bar{X}}^{2}+\sigma_{\bar{Y}}^{2}-2r\sigma_{\bar{X}\bar{Y}}\right)\]
\[=\frac{1}{n}\left(1-\frac{n-1}{N-1}\right)\frac{1}{\mu_{x}^{2}}\left(r^{2}\sigma_{x}^{2}+\sigma_{y}^{2}-2r\sigma_{xy}\right)\] #
With simple random sampling, the expectation of R is given approximately by
\[E(R)\approx r+\frac{1}{n}\left(1-\frac{n-1}{N-1}\right)\frac{1}{\mu_{x}^{2}}(r\sigma_{x}^{2}-\rho\sigma_{x}\sigma_{y})\] #
Låt \(x_i\) och \(y_i\) vara antalet sängar och discharges på det i:te sjukuset. Antag att vi känner till alla \(x_i\) och vill utnyttja detta när vi estimerar antalet discharges.
Ett sätt är att forma en ratio estimate av \(\mu_y\):
\(\bar{Y}_{R}=\frac{\mu_{x}}{\bar{X}}\bar{Y}=\mu_{x}R\)
Det bygger på att vi tror att xi och yi är starkt relaterade.
Om \(\bar{X}<\mu_x\) så underestimerar samplet antalet sängar, och förmodligen antalet discharges också; multiplikationen av \(\bar{Y}\) med \(\mu/\bar{X}\) ökar \(\bar{Y}\) till \(\bar{Y}_R\).
population \(x_1, x_2, ..., x_N\)
-
-
-
-
sample \(X_1, X_2, ..., X_n\)
-
-
\(\)
An unbiased estimate of \(Var\bar{X}\) is
\[\begin{align*}
s_{\bar{X}}^{2} & =\frac{\hat{\sigma}^{2}}{n}\left(\frac{n}{n-1}\right)\left(\frac{N-1}{N}\right)\left(\frac{N-n}{N-1}\right)\
& =\frac{s^{2}}{n}\left(1-\frac{n}{N}\right)
\end{align*}\]
where
\[s^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}\]
An unbiased estimate of \(Var(\hat{p})\) is
\(s_{\hat{p}}^{2}=\frac{\hat{p}(1-\hat{p})}{n-1}\left(1-\frac{n}{N}\right)\)
The central limit theorem says that
\(P\left(\frac{\bar{X_{n}}-\mu}{\sigma_{\bar{x}}}\leq z\right)\rightarrow\Phi(z)\)
as \(n\rightarrow\infty\)
An unbiased estimate av \(Var X\) is\[\frac{1}{n-1}\left(1-\frac{1}{N}\right)\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}=\left(1-\frac{1}{N}\right)s^{2}\]
Konfidensintervall
\(P(\bar{X}-z_{\alpha/2}\sigma_{\bar{X}}\leq\mu\leq\bar{X}+z_{\alpha/2}\sigma_{\bar{X}})\approx1-\alpha\)
För stora n (säg, över 25-30) kan vi använda \(s_\bar{X}\) ist. för \(\sigma_\bar{X}\)
-
Genom att beteckna populationens distinkta värden med
ζ1, ... ζm
och antalet populationsmedlemmar som har värdet ζj med nj kan vi visa att ...
\(E(\bar{X})=\mu\) #
\(E(T)=\tau\)
\(E(X_i)=\mu\)
\(Var(X_i)=\sigma^2\) #
-
Med simple random sampling har vi
\(E(\hat{\sigma}^{2})=\sigma^{2}\color{red}{\left(\frac{n-1}{n}\right)\frac{N}{N-1}}\)
\(\hat{\sigma}^2\) är alltså biased!
-
-
-
Med Taylor-series-expansion av g kring \(\mu_X\) kan vi visa att (4.6 Approximate methods (s.161)) för Y=g(X):
\(\mu_{Y}\approx g(\mu_{X})+\frac{1}{2}\sigma_{X}^{2}g''(\mu_{X})\)
\(\sigma_{Y}^{2}\approx\sigma_{X}^{2}[g'(\mu_{X})]^{2}\)
och för Z=g(X, Y):
\(E(Z)\approx g(\mu)+\frac{1}{2}\sigma_{X}^{2}\frac{\partial^{2}g(\mu)}{\partial x^{2}}+\frac{1}{2}\sigma_{Y}^{2}\frac{\partial^{2}g(\mu)}{\partial y^{2}}+\sigma_{XY}\frac{\partial^{2}g(\mu)}{\partial x\partial y}\)
\(Var(Z)\approx\sigma_{X}^{2}\left(\frac{\partial g(\mu)}{\partial x}\right)^{2}+\sigma_{Y}^{2}\left(\frac{\partial g(\mu)}{\partial y}\right)^{2}+2\sigma_{XY}\left(\frac{\partial g(\mu)}{\partial x}\right)\left(\frac{\partial g(\mu)}{\partial y}\right)\)
där \(\mu\) är punkten \((\mu_X, \mu_Y)\)
(fås från ovan och att vi sätter in \(Var(\bar{X})\) och \(Var(\bar{Y})\), och \(Cov(\bar{X}, \bar{Y})\) fås på samma sätt som dessa två)
Estimated variance of R
\[s_{R}^{2}=\frac{1}{n}\left(1-\frac{n-1}{N-1}\right)\frac{1}{\bar{X}^{2}}(R^{2}s_{x}^{2}+s_{y}^{2}-2Rs_{xy})\]
där \(s_{xy}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})(Y_{i}-\bar{Y})\)
\(=\frac{1}{n-1}\left(\sum_{i=1}^{n}X_{i}Y_{i}-n\bar{X}\bar{Y}\right)\)
-
Skillnaden mellan variansen av mean av ett (i) simple random sample och ett (ii) stratifierat sample med proportionell allokering, är (utan finit populationskorrektion):
-
- prop. bättre än s.r.s. om means variabla
- opt. bättre än prop. om var. variabla
-
Förklaring av substitution i konfidensintervall:
Som vi ser till vänster innehåller uttrycket egentligen \(\sigma_\bar{X}\), standardavvikelsen av estimatet \(\bar{X}\). Som vi ser i tabellen ovan innehåller uttrycket för \(\sigma_\bar{X}^2\) populationsvariansen \(\sigma^2\), vilket vi förmodligen INTE KÄNNER TILL. DÄRFÖR är vi tvungna att ersätta \(\sigma_\bar{X}\) med den estimerade standardavvikelsen av estimatet, \(s_\bar{X}\), dvs roten ur det uttryck för (s^2_\bar{X}\) som vi kan läsa ut i tabellen.
-
-