Statistik

Deskriptive Statistik - Empirischer Kalkül

Theoretischer Kalkül - Wahrscheinlichkeitsrechnung

Induktive Statistik

Schätzprobleme: Statistisches Schätzen

Entscheidungsprobleme: Statistisches Testen

Das lineare Regressionsmodell

spezielle Eindimensionale Verteilungen

Einpunktverteilung

Bernoulli-Verteilung

Binominalverteilung

Poisson-Verteilung

Verteilung stochastischer Summen und Mittelwerte

Punktschätzung

Intervallschätzung


Konfidenzintervall = ein Zufallsintervall, das mit einer vorgegebenen Wahrscheinlichkeit, die als Sicherheitswahrscheinlichkeit oder als Konfidenzniveau bezeichnet wird, einen zu schätzenden Parameter überdeckt.


Ein Konfidenzintervall wird i.d.R. länger wenn:

  • Die Sicherheitswahrscheinlichkeit zunimmt
  • Die Streuung in der Grundgesamtheit zunimmt
  • der Stichprobenumfang abnimmt

--> Intervallgrenzen = Schätzer +/- Quantile * (geschätzter) Standardfehler

Testverfahren

Tests über Erwartungswerte

Test über Erwartungswertdifferenzen

Nichparametische X^2 Tests

Hypothesenwahl

Irrtumswahrscheinlichkeit

p-Werte

Fehlerarten

Kritische Werte

Ziehungsschema

unabhängig und identisch verteilt (u.i.v.) - Urnenmodell mit Zurücklegen/ Paneldaten

abhängig identisch verteilt (a.i.v.) - Urnenmodell ohne Zurücklegen

unabhängig heterogen verteilt (u.h.v.) - Subgruppen/ Paneldaten

a.i.v. und a.h.v - Zeitreihen und räumliche Daten

Gütekriterien

Effizienz = stehen mehrere Schätzer zur Auswahl, ist i.d.R. derjenige zu bevorzugen, der den kleineren MSE aufweist.

Erwartete quadratische Abweichung (MSE)
= Varianz + Bias^2

Konsistenz = Die Wahrscheinlichkeit, dass sich das Stichprobenmittel außerhalb eines beliebig kleinen Bereichs um den Erwartungswert herum realisiert, konvergiert für wachsendes n gegen Null -> 1. MSE konvergiert gegen Null 2. stochastische Konvergenz gegen den wahren Wert

Erwartungstreue = der Erwartungswert des Schätzers entspricht dem Parameterwert

Verzerrung: Bias = Erwartungswert - Schätzer

Asymptotisch erwartungstreu

Stichprobenvarianz nicht erwartungstreu

korrigierte Stichprobenvarianz mit n/(n-1)

1. MSE Konsistenz

  • MSE Konsistenz impliziert schwache Konsistenz
  • Ein erwartungstreuer oder asymptotic erwartungstreuer Schätzer ist genau dann MSE-Konsistent, falls dessen Varianz für wachsendes n gegen Null konvergiert

Stichprobenmittel und korrigierte Stichprobenvarianz sind MSE-konistent

2. Schwache Konsistenz

  • über die stärkere Form der MSE-Konsistenz
  • anhand asymptotischer Resultate (GGZ + Stetigkeitssatz)
  • direkt anhand der Definition

Konfidenzintervalle für Erwarungswerte

  1. Bei Normalverteilung und bekannter Varianz -> Standard, Formel 10.2.1


  2. Bei Nominalverteilung und unbekannter Varianz

  • Schätzer für die Varianz = korrigierte Stichprobenvarianz
  • T-Werte!
  1. Bei einer beliebigen Ausgangsverteilung
  • Im Fall Varianz unbekannt -> Stichprobenvarianz

Konfidenzintervall für Erwartungswertdifferenzen

  1. Bei Normalverteilung und bekannten Varianzen
  • analog zu 10.2.1
  1. Bei Normalverteilt und unbekannten Varianzen
  • "gepoolten" Schätzung = Gruppenvarianz anteilig nach den jeweiligen Gruppengrößen (Varianz ~ Stichprobenvarianz)
  • T-Werte!
  1. Bei beliebigen Ausgangsverteilungen
  • ähnlich wie bei 1, aber Stichprobenvarianz
  1. Bei Abhängigkeit in Form verbundener Werte
  • Stichprobenmittel der Differenz statt Differenz der Stichprobenmittel!
    -> Varianz(A-B)=Var(A)-Var(B)-2Cov(A,B)
  • wenn gemeinsam normalverteilt -> Normalverteilung
  • ansonsten: ähnlich Erwartungswert bei beliebiger Ausgangssituation (s.o. 3)

Konfidenzintervalle für Anteilswerte

  • Annahme: 𝜋 = Stichprobenmittel

Konfidenzintervalle für Anteilswertdifferenzen

  • gleiches Prinzip wie bei den Erwrtungswertdifferenzen

Adäquatheit

Unabhängigkeitsannahme

Repräsentativität

Verteilung (identisch vs. heterogen? normal?)

Bei Differenzenschätzung

Schätzmethoden

Momentenmethode
= gemäß GGZ laufen die stochastischen Werte gegen die korrespondierenden theoretischen Werte

  1. Zu schätzende Parameter als Funktion der theoretischen
  2. theoretische durch korrespondierende Stichprobenmomente ersetzen

Maximum-Likelihood-Methode
= Unter welchem Parameterwert sind die Beobachtungen am wahrscheinlichsten?

Bayes-Methode
= Welcher Parameterwert ist unter den Beobachtungen am wahrscheinlichsten

Kleinste-Quadratische-Methode