Please enable JavaScript.
Coggle requires JavaScript to display documents.
WS 07: Operationalisierung und Messen (3. Stufe, 2. Teil) - Coggle Diagram
WS 07: Operationalisierung und Messen (3. Stufe, 2. Teil)
Hauptgütekriterien
Objektivität
Durchführung
Auswertung
Interpretation
Reliabilität
Konsistenzkoeffizienten
Paralleltest-Koeffizienten
Retest-Koeffizienten
Validität
Inhaltsvalidität
Konstruktvalidität
Divergente Validität
Konvergente Validität
Faktorielle Validität
Kriteriumsvalidität
Vorhersage
Übereinstimmung
retrospektiv
inkrementell
Skalierbarkeit
Nebengütekriterien
Normierung
Vergleichbarkeit
Ökonomie
Zumutbarkeit
Nützlichkeit
Fairness
Nicht-Verfälschbarkeit
Möglichkeiten der quantitativen Messung
Zählen
Hkeiten qualitativer Merkmale
Nominalskala
Kategorien möglichst genau definiert, exklusiv, erschöpfend
Indexbildung: komplexes Merkmal in Teilmerkmalen (z.B. Aufsatzqualität)
additiv/multiplikativ
gewichtet/ungewichtet
Urteilen
manche Sachen nicht gut mit physikalischen Geräten messbar (z.B. künstlerisches Vermögen)
Arten: Präferenzurteile, Ähnlichkeitsurteile, ...
Rangordnungen (Ranking)
direkte Rangordnung mit/ohne ties (schwierig wenn viele Objekte, weniger genau als Paarvergleich)
Methode der sukzessiven Intervalle (viele Objekte --> in Untergruppen sortieren)
Law of categorial judgement (normalverteilte Fluktuation von Beurteilungen, mehrere Rangurteile zu z-standardisierten relativen Häufigkeiten rechnen)
Paarvergleiche
Dominanz-Paarvergleiche
optimal = vollständiger Paarvergleich
indirekte Rangordnung
"Anzahl der Dominanzen" (wie oft präferiert)
Problem: zirkuläre Triaden oder intransitive Urteile wenn Rangordnung nicht möglich
Berechenbare Koeffizienten
Konkordanz (Übereinstimmung Beurteiler)
Konsistenz (Widerspruchsfreiheit der Einzelurteile eines Beurteilers
Transitivität: Wenn A>B und B>C dann auch A>C
Law of comparative judgement
Annahme: Empfindungsstärken um wahren Wert normalverteilt
Paarvergleiche auch typisch in Psychophysik
Dominanzmatrix
Ähnlichkeitspaarvergleiche
globale Ähnlichkeit
relevante Merkmalsdimension werden extrahiert (nicht vorweggenommen) :!:
Signalentdeckungstheorie (SDT)
Trennungsverfahren von
Diskriminationsfähigkeit (d')
Reaktionsschwelle (bias)
Rating-Skalen
Arten
uni-/bipolar
Verankerung: numerisch, verbal, symbolisch, beispiele
graphisches Rating
Stufenanzahl
Probleme
suggerierte Intervallskalenqualität (nicht immer gut begründet)
mögliche Verschiebung des Referenzrahmens bei sukzessiven Ratings
Urteilsfehler (Halo, Milde/Härte, Extrem-/Mittentendenz, primacy/recency ...)
Beispiele
semantisches Differential (Erfassung konnotativer Bedeutungen von Objekten)
Grid-Technik
Testen
großer Testkatalog
Gütekriterien
Objektivität
Reliabilität
Validität
KTT (Testergebnis = wahre Merkmalsausprägung + unsystematischer Messfehler)
PTT
Wkeit einer Itemantwort basiert auf latent vorhandener Merkmalsdimension
logistische item characteristic curves (Zsh Itemlösewkeit und Person-Fähigkeit)
besser, da Hintergrundannahmen besser geprüft
adaptives Testen
Entscheidungen
Itemformat
Maßnahmen zur Ratekorrektur (Leistungstests)
Skalenkonstruktion
Thurstone (Expertenurteile)
Likert (eichstichprobe)
Skalogramm-Analyse
Rasch (PTT, sehr präzise)
Itemanalyse
Rohwerteverteilung normal
Itemschwierigkeit (Anteil korrekter Lösungen)
Trennschärfe (Korrelation Item-Gesamtscore)
Cronbach's alpha
Testanalyse
interne Konsistenz/Homogenität (Iteminterkorrelation)
Dimensionalität (Faktorenanalyse)
Effekt-Diagnostikum-Fehlschluss
Krebs-waage-Bsp
Bsp.: FFA und Gedankenlesen
Befragen
häufig in empirischen Sozialwissenschaften
mündlich
Standardisierungsgrad
hart/weich (Autorität Befrager)
face-to-face vs. Telefon/internet
Einzel/Gruppe
Vorsicht: Interviewereffekt + Antwortbiasprobleme
Kategorisierung, Rating, Itemkonstruktion
Schrifltich
Fragenauswahl
Fragenformulierung
Fragebogenaufbau
Rücklaufquote
Delphi Methode (hochstrukturierte Gruppenkommunikation mit anonymisierten Beiträgen)
Beobachten
Alltag vs. systematisch
klare Beobachtungskriterien (ggf. Beobachtertraining)
Prozesse: Abstraktion, Selektion, Klassifikation, Systematisierung
Relativierung
Selektionsfehler beim Messen
Abweichung von Linearität
Ausreißer (v.a. bei kleinen Stp, Ursache = Methode der kleinesten Quadrate)
Unterbrochene Verteilung (Extremgruppen überschätzen einen Zsh)
Einschränkung des Wertebereichs
Heterogene Unterstichproben
siehe Beispiele Präsentation