Please enable JavaScript.
Coggle requires JavaScript to display documents.
óra, Adat számos formában létezhet, pl. a kérdőív minden válasza, a…
óra
mérés és adat
pszichológiában nem kézzel fogható dolgokat mérünk (pl: IQ, személyiségvonások)
Ezeket összefoglaló néven
konstruktumok
nak nevezzük
Következtetéseinket korlátozhatja, hogy a mérés mennyire
konzisztens (reliabilitás)
érvényes (validitás)
Pl. azt akarom mérni, hogy mennyire depressziós valaki, akkor a tünetekkel kapcsolatban teszek fel kérdéseket. Ha viszont olyan kérdések is kerülnek a kérdőívbe, amelyek a skizofrénia tüneteire vonatkoznak, akkor a kérdőív nem lesz pontos, és a kérdések sem lesznek egymással konzisztensek.
négy különböző mérési szintet különböztetünk meg, ezt két csoportra oszthatjuk
Diszkrét: Csak bizonyos értékeket vehetnek fel.
Kategorikus: Az értékek nem rendezhetőek sorba (pl. nem).
egyediség
Ordinális: Az értékek sorba rendezhetőek, de a szintek közötti különbség nem egyenlő (pl. iskolázottság, Likert skála)
egyediség
sorrendiség
Folytonos: Bármilyen értéket felvehet egy bizonyos értéktartományban
Intervallum: az értékek közötti távolság egyenlő (pl. IQ, hőmérséklet Celsius fokban)
sorrendiség
egyenlő távolság
egyediség
Arány: van valódi nulla értéke (pl. távolság)
sorrendiség
egyenlő távolság
egyediség
abszolút 0
Adat granularitás
A változó szintjeinek a számát jelenti, azaz, hogy hány különböző értéket tud felvenni egy változó.
Függ a választható szintek számától, és attól, hogy hány elemből áll egy érték
Kiszámítás: (maximum érték - minimum érték) * itemek száma + 1
Például ha egy pszichológiai skála 3 kérdésből áll, és a kérdésekre 7-fokú skálán kell válaszolni, akkor a változó 3-tól 21-ig vehet fel értékeket, azaz elméletben 19 (a képletből (7-1) * 3 + 1) különböző értéket vehet fel
Értékelőskálák
A pszichológiai kutatásban gyakori a szöveges és numerikus értékelő skálák használata, ahol megadott értékeket tudunk bejelölni.
Ezek ordinális mérési szintűek.
A vizuális analóg skálán csak végpontok vannak megadva.
Ezek a skálák a granularitásban (változó szintjeinek a száma) is különböznek.
Ha egy skálának a granularitása kicsi (<12), akkor azt nem tekintjük intervallum szintűnek
Adat
definíció
Az adat olyan információ, amelyeket megfigyelések alapján rendszerezetten gyűjtünk.
Nyers adat (feldolgozatlan adat)
Megfigyelés (observation): ugyanannak a megfigyelési egységnek (pl. egy ember) az összes adatpontja (pl. összes kérdésre adott válasza).
Változó (variable): több megfigyelési egységnek az ugyanarra a mérésre adott értékei
Adatpont (data point): egy mérésből származó érték, pl. egy ember egy válasza egy kérdésre.
Adattábla (dataset): közös táblázatban lévő változók és megfigyelések. Általában az oszlopok a változók, és a sorok a megfigyelések, a cellákban pedig az egyes adatpontok vannak.
Adat anomáliák
Hibás adat: Olyan adat, amely hibás adatrögzítés miatt került az adattáblába. Értéke kívül esik a változó értéktartományán, vagy más típusú, mint a változó.
Outlier: Olyan érték, ami a többitől távol esik (kiugró adatpont).
Hiányzó adat: Nem rögzített adatpont (gyakran NA-val jelölik)
Adattábla
A változó egy információt tartalmaz a megfigyelésről (pl. “Férfi 18-29” az két infó)
Minden információ explicit adat (és nem formázási mód vagy komment)
A cimkék szó szerint szerepelnek, és nem kódolva (pl. a kategorikus adatokhoz). (“férfi”, és nem 1)
A hiányzó adat hiányzó cella, nem pedig pl. -999.
A változónevek emberi és gépi olvasásra is alkalmasak (tanács: minél rövidebb, a változónevek mindig angolul, ékezetek nélkül, szóközök nélkül legyenek írva, legyen egyértelmű jelentésük, pl. education, bdi_1, bdi_sum).
Minden megfigyelési egységnek (pl. résztvevő) egyedi azonosítója van
“négyzetes”: a sorok és oszlopok következetes módon megfigyeléseket és változókat jelentenek.
Van hozzá “kódkönyv” (code book vagy data dictionary).
Változók jelentése, mértékegysége, típusa, a változó hogyan lett kiszámítva
Információ az adatgyűjtés módszeréről
Információ az adatok formátumáról (pl. adattábla x sorral és y változóval)
Értékek eloszlása
Következtetések levonásához fontos látnunk, hogy melyik értékek a jellemzőbbek a mintára, és melyek számítanak ritkának.
Ez az adatok eloszlása
Például a diszkrét változók gyakorisága, azaz hányan választották az egyik opciót.
Nemcsak a diszkrét változóknak, hanem a folytonosaknak is van eloszlása.
Hisztogram
Itt is vannak “vödrök”.
Az oszlopok magassága arányosítható, így a sok megfigyelést is jól lehet ábrázolni.
Az x tengely a változó értéktartománya, az y tengely a gyakoriság.
Dotplot
Az x tengely az értéktartomány.
Meghatározzuk, hogy milyen széles “vödrökbe” (binwidth) tesszük az adatokat. Ha pl. 10cm, akkor a 150-160, 161-170, 171-180 kerülnek egy oszlopba.
Vagy azt is meg lehet határozni, hogy hány db. vödör (bin) legyen.
Minden adatot egy pötty jelképez.
Mivel a pöttyök mérete adott, nagyon sok adatot nem tudunk egyszerre ábrázolni.
Értékek összesítése
Adat számos formában létezhet, pl. a kérdőív minden válasza, a facebook posztok egy adott témában, terápia hangfelvételei, reakcióidő adatok egy kísérleti programban, stb
Sokszor a nyers adatok csak intenzív adatkinyerés után elemezhetőek