Please enable JavaScript.
Coggle requires JavaScript to display documents.
ML (Kapitel 1, Kapitel 2) - Coggle Diagram
ML
Kapitel 1
Schlussfolgern
Deduktion
Von einer allgemeingültigen Theorie mittels Logik auf Einzelfälle schließen
Bsp: Jeder Mensch hat einen Kopf. Mein Nachbar ist ein Mensch. Also hat mein Nachbar einen Kopf.
Induktion
Anhand von Einzelfälle auf eine allgemeine Theorie schließen
Bsp: Mein Nachbar ist ein Mensch. Mein Nachbar hat einen Kopf. Also haben alle Menschen einen Kopf.
Korrelation und Kausalität
Korrelation
Zusammenhang
"Es besteht ein Zusammenhang zwischen zwei Dingen"
Kausalität
Ursache
"Etwas ist die Ursache für etwas anderes"
Nachweis
Kontrollierte Experimente sind benötigt
Beobachtungsstudien sind NICHT geeignet da die Daten meist nicht in einem kontrollierten Experiment entstanden sind. Durch Beobachtungsstudien können in der Regel deswegen nur Korrelationen gezeigt werden.
Versuchsdesign:
Kontrolliert
:
Eine Gruppe erhält die zu untersuchende Behandlung, eine seperate Kontrollegrupp erhält die Behandlung nicht
Randomisiert
:
Die Einteilung in die beiden Gruppen erfolgt zufällig (niemand darf selbst entscheiden in welcher Gruppe er/sie ist.)
Doppel-blind
:
Weder Versuchsperson noch Bewerter weiß, wer in welcher Gruppe ist. (Z.b. weiß weder Versuchsperson noch Arzt ob jemand Placebo oder richtige Medikamente bekommt)
Bsp:
"Mein Nachbar hat Globuli genommen, danach ging es ihm besser. Also wirken Globuli"
Dadurch lässt sich jedoch nur eine Korretextlation, keine Kausalität feststellen (andere Gründe/Kausalitäten für die Besserung z.B.: Selbstheilung, Placebo-Effekt
Data Mining und Statistik
Data Mining
Geht eher darum gute Prognosen zu berechnen
Statistik
Geht um Induktion -> Herleiten von Theorien
Bsp: "Wenn die Schwalben tief fliegen, dann wird es bald ein Gewitter geben."
Datamining
Wissen nutzen um Gewitter vorherzusagen
Statistik
Fragestellen wäre die Überprüfung, ob die Schwalben das Gewitter verursachen
Wie funktioniert lernen?
Lernen ist nur möglich, wenn der Lernende Rückmeldungen zu "richtig" oder "falsch" erhält. Prognosen sind typischerweise überall da schlecht, wo die Prognosen nicht systematisch auf Ihre Güte überprüft werden (können).
Kapitel 2
Begrifflichkeiten
Datenpunkt
Ein Fall/Untersuchungsprojekt. Normalerweise Zeile in Datensatz
Merkmal/Variable
Ein bei den Untersuchungsobjekten erhobener Wert. Normalerweise eine Spalte im Datensatz (Gewicht, Größe..)
Ausprägung eines Merkmals
Konkreter Wert eines Merkmals
Arten von Daten
Kategoriell:
Für die Ausprägung eines Merkmals sind nur vorgegebene Kategorien möglich
Nominal
Keine Rangfolge zwischen den Kategorien
(Geschlecht, Blutgruppe, Religion, Geburtsort,..)
Ordinal
Zwischen den Kategorien gibt es eine natürliche Reihenfolge.
(Schulnoten, Einkommensklassen, Ratingsstufen)
Kardinal/Metrisch
Zahlenwerte, wobei die Abstände zwischen den Zahlenwerten eine sinnvolle inhaltliche Bedeutung haben (Bildung von Differenzen ist sinnvoll)
(z.B. Temperatur, Jahreszahl, Lebensalter, Volumen, Länge, ...)
Statistische Kennzahlen
Mittelwert
Gibt an wo sich der Schwerpunkt der Daten befindet.
Median
Der Wert einer Datenreihe sodass 50% der Daten kleiner gleich und 50% größer gleich dem Median sind.
Vorgehen:
Daten der Größe nach sortieren und mitteleren Wert nehmen
Modus
Der Modus einer Datenreihe ist der Wert, der am häufigsten auftaucht.
Beispiel Datenreihe:
blau, blau, grün, braun, grün, grün, braun, grau
blau = 2, grün = 3, braun = 2, grau = 1
Modus: grün
Häufigkeiten
Quantile
Beispiel: 25% Quantil ist der Wert sodass 25% der Daten kleiner als q und 75% größer als q sind.
(Der Median ist damit ein Spezialfall eines Quantils, nämlich dem 50% Quantil)
Standardabweichung
Die durchschnittliche Abweichung der Daten zu ihrem Mittelwert. :