Please enable JavaScript.
Coggle requires JavaScript to display documents.
Statistik (Induktive Statistik (Schätzprobleme: Statistisches Schätzen…
Statistik
Induktive Statistik
Schätzprobleme:
Statistisches Schätzen
Punktschätzung
Gütekriterien
Effizienz = stehen mehrere Schätzer zur Auswahl, ist i.d.R. derjenige zu bevorzugen, der den kleineren MSE aufweist.
Erwartete quadratische Abweichung (MSE)
= Varianz + Bias^2
Konsistenz = Die Wahrscheinlichkeit, dass sich das Stichprobenmittel außerhalb eines beliebig kleinen Bereichs um den Erwartungswert herum realisiert, konvergiert für wachsendes n gegen Null -> 1. MSE konvergiert gegen Null 2. stochastische Konvergenz gegen den wahren Wert
1. MSE Konsistenz
MSE Konsistenz impliziert schwache Konsistenz
Ein erwartungstreuer oder asymptotic erwartungstreuer Schätzer ist genau dann MSE-Konsistent, falls dessen Varianz für wachsendes n gegen Null konvergiert
Stichprobenmittel und korrigierte Stichprobenvarianz sind MSE-konistent
2. Schwache Konsistenz
über die stärkere Form der MSE-Konsistenz
anhand asymptotischer Resultate (GGZ + Stetigkeitssatz)
direkt anhand der Definition
Erwartungstreue
= der Erwartungswert des Schätzers entspricht dem Parameterwert
Verzerrung: Bias = Erwartungswert - Schätzer
Asymptotisch erwartungstreu
Stichprobenvarianz
nicht
erwartungstreu
korrigierte Stichprobenvarianz mit n/(n-1)
Intervallschätzung
Konfidenzintervall
= ein Zufallsintervall, das mit einer vorgegebenen Wahrscheinlichkeit, die als Sicherheitswahrscheinlichkeit oder als Konfidenzniveau bezeichnet wird, einen zu schätzenden Parameter überdeckt.
Ein Konfidenzintervall wird i.d.R. länger wenn:
Die Sicherheitswahrscheinlichkeit zunimmt
Die Streuung in der Grundgesamtheit zunimmt
der Stichprobenumfang abnimmt
--> Intervallgrenzen = Schätzer +/- Quantile * (geschätzter) Standardfehler
Konfidenzintervalle für Erwarungswerte
Bei Normalverteilung und bekannter Varianz -> Standard, Formel 10.2.1
Bei Nominalverteilung und unbekannter Varianz
Schätzer für die Varianz = korrigierte Stichprobenvarianz
T-Werte!
Bei einer beliebigen Ausgangsverteilung
Im Fall Varianz unbekannt -> Stichprobenvarianz
Konfidenzintervall für Erwartungswertdifferenzen
Bei Normalverteilung und bekannten Varianzen
analog zu 10.2.1
Bei Normalverteilt und unbekannten Varianzen
"gepoolten" Schätzung = Gruppenvarianz anteilig nach den jeweiligen Gruppengrößen (Varianz ~ Stichprobenvarianz)
T-Werte!
Bei beliebigen Ausgangsverteilungen
ähnlich wie bei 1, aber Stichprobenvarianz
Bei Abhängigkeit in Form verbundener Werte
Stichprobenmittel der Differenz statt Differenz der Stichprobenmittel!
-> Varianz(A-B)=Var(A)-Var(B)-2Cov(A,B)
wenn gemeinsam normalverteilt -> Normalverteilung
ansonsten: ähnlich Erwartungswert bei beliebiger Ausgangssituation (s.o. 3)
Konfidenzintervalle für Anteilswerte
Annahme: 𝜋 = Stichprobenmittel
Konfidenzintervalle für Anteilswertdifferenzen
gleiches Prinzip wie bei den Erwrtungswertdifferenzen
Adäquatheit
Unabhängigkeitsannahme
Repräsentativität
Verteilung (identisch vs. heterogen? normal?)
Bei Differenzenschätzung
Schätzmethoden
Momentenmethode
= gemäß GGZ laufen die stochastischen Werte gegen die korrespondierenden theoretischen Werte
Zu schätzende Parameter als Funktion der theoretischen
theoretische durch korrespondierende Stichprobenmomente ersetzen
Maximum-Likelihood-Methode
= Unter welchem Parameterwert sind die Beobachtungen am wahrscheinlichsten?
Bayes-Methode
= Welcher Parameterwert ist unter den Beobachtungen am wahrscheinlichsten
Kleinste-Quadratische-Methode
Entscheidungsprobleme:
Statistisches Testen
Testverfahren
Tests über Erwartungswerte
Test über Erwartungswertdifferenzen
Nichparametische X^2 Tests
Hypothesenwahl
Fehlerarten
Irrtumswahrscheinlichkeit
Kritische Werte
p-Werte
Das lineare Regressionsmodell
Ziehungsschema
unabhängig und identisch verteilt (u.i.v.) - Urnenmodell mit Zurücklegen/ Paneldaten
abhängig identisch verteilt (a.i.v.) - Urnenmodell ohne Zurücklegen
unabhängig heterogen verteilt (u.h.v.) - Subgruppen/ Paneldaten
a.i.v. und a.h.v - Zeitreihen und räumliche Daten
Theoretischer Kalkül - Wahrscheinlichkeitsrechnung
spezielle Eindimensionale Verteilungen
Einpunktverteilung
Bernoulli-Verteilung
Binominalverteilung
Poisson-Verteilung
Verteilung stochastischer Summen und Mittelwerte
Deskriptive Statistik - Empirischer Kalkül