Please enable JavaScript.
Coggle requires JavaScript to display documents.
DEL 2 (SKALTYPER:
Nominalskala
Ordinalskala
Intervallskala
…
DEL 2
SKALTYPER:
- Nominalskala
- Ordinalskala
- Intervallskala
- Kvotskala
- NOMINALSKALA:
- Delas in kategoriskt.
- Man / kvinna eller blodgrupper.
- Beskrivs med ord
- Kan beräkna typvärde, ej medelvärde eller median.
- ORDINALSKALA:
- Rangordnar tex individer. Kan avgöra om individen mår bra eller dåligt, men ej säga något om skillnaderna. Kan ej säga att skillnad mellan bra och utmärkt är lika stor som mellan dåligt och mycket dåligt.
- INTERVALLSKALA:
- Numerisk data
- Temperatur. 39C är högre än 37C, skillnad lika stor där som med 37C och 35C.
- EJ bilda kvot då absolut 0 punkt saknas.
- KVOTSKALA (ratio scale):
- Utgör den högsta datanivån.
- Har en absolut 0 punkt och kan därför säga att en på 40 år har levt dubbelt så länge som en på 20 år.
- Multiplicera & dividera är möjligt.
Sambandsanalyser = undersöka om det finns något samband mellan de två variablerna och dels att i så fall beskriva hur sambandet ser ut. Använder oss av regression och korrelation.
Korrelation (correlation)
- Statistisk teknik som används för att se hur starkt samband är mellan variablerna.
Positiv korrelation/positivt samband = höga värden på x-axeln, ena variabeln, hänger ihop med höga värden på y-axeln, den andra variabeln.
Ex. Ju fler dagar du pluggar, desto bättre kan du få på provet.
Negativ korrelation/negativt samband = höga värden på y-axeln, ena variabeln, hänger ihop med låga värden på x-axeln, den andra variabeln.
Ex. Ju fler cigg du röker per dag, desto snabbare dör du.
Regression (regression)
- Används för att kunna förutsäga värdet på en variabel över tid, utifrån kunskapen om en annan.
Linjär regression (linear regression) = Man utgår från en rät linje som går igenom och matchar punkterna bäst.
Vad använder vi regressionsmodeller i alla metoder för att skatta ett värde. Det hjälper oss att bla se hur ett riskvärde kan påverka en sjukdom. Man kommer närmre sanningen med hjälp av regressionsmodellen.
GENOMSNITT:
Medelvärde:
- Vanligaste måttet på genomsnitt som ger mest info.
- Summan av alla mätvärden / antal mätvärden som är med.
- x och ett streck över.
Median:
- Näst mest info
- Alla värden ställs i storleksordning, lägst till högst, median det mittersta värdet.
- Udda tal = 1 median
- Jämna tal = addera och / 2.
- 3 tal = mittvärdet median.
Typvärde:
- Minst info
- Fördelning symmetrisk = medelvärde och median lika.
- Fördelning EJ symmetrisk = genomsnittsvärden skiljer sig.
det tal som förekommer flest gånger, högst frekvens.
POS:
- Positivt skewed är medelvärdet högre än median. Enstaka värden påverkar medelvärdet mycket.
-^---- , short tail.
- Medelvärde > median
NEG:
- Negativt skewed är medelvärdet alltid lägre än medianen.
------^
- Medelvärde < Median
-
-
2 hypoteser:
- H0, nollhypotesen = det är inte någon skillnad mellan två grupper/metoder/behandlingar i populationen.
- H1, mothypotesen = där finns en skillnad mellan grupper/metoder/behandlingar i populationen.
-
Vi vill jämföra två behandlingar, a och b, tar ett stickprov från hela populationen och testar om det finns en skillnad mellan dessa två. Vi använder statistiken för att kunna gissa hur populationen är, så nära som möjligt.
P-värde = sannolikhet. Så nära noll som möjligt. Vi är aldrig 100% säkra, därför finns det 5% för felmarginal alltså 95%.
- Signifikansnivå = 0,05
- Signifikant = FINNS SKILLNAD
- Ej signifikant = INGEN SKILLNAD
Outliers = något som sticker ut från statistiken.
- Problemet med outliers är att de kan ha en negativ effekt på regressionen, det har en svagare samband.