Tehnici de testare a ipotezelor
ASOCIERI
semnificativ statistic
există o probabilitate f mică de a obține datele culese in cazul in care ipoteza nulă este adevărată
condiții
date numerice (interval sau proportii)
relație liniară
homoscedasticitate
Ipoteze unidirecționale și bidirecționale
Intensitatea relației
mărimea efectului
in cazul corelațiilor
in cazul in care avem VI și VD
arată GRADUL DE COMUNALITATE între 2 variabile
arată PROCENTUL DIN DISPERSIA VD EXPLICAT DE INFLUENȚA VI
Valori = .01, .06, .14
sursele/cauzele relației dintre 2 variabile
dependență cauzală (creșterea consumului de apă cu cât gradul de deshidratare crește)
dependența de o terță variabilă (fenomenele atmosferice care pot afecta dispozitia afectivă, pe lângă zilele ploioase)
variabilă moderatoare
variabilă mediatoare
var etichetă
explică relația
SOLUȚIE
corelație parțială
COMPARAȚII
tehnici nonparametrice
tehnici parametrice
tehnicile hi pătrat: definiția
testele t și testele z
compară diferențele dintre frecvențele de răspuns a categoriilor unei variabile (dacă există diferențe între frecventele asteptate și cele observate) + scale nominale
tipuri
compară diferențele dintre medii a 2 grupuri + VD prin scale numerice (interval sau proportii)
hi pătrat al gradului de potrivire
hi pătrat al gradului de omogenitate
de ex. dacă există diferențe semnificative între răspunsurile la o întrebare de genul: dacă duminică ar avea loc alegerile prezidențiale, v-ati prezenta la vot? Da/Nu/Nu știu
de ex. când vrem să vedem diferențe sau asocieri între categoriile de răspuns de la două întrebări: dacă duminică ar avea loc alegerile prezidențiale, v-ati prezenta la vot? Da/Nu/Nu știu //////// Ati votat ultima data la alegeri? Da/Nu
date colectate
VI ordinală sau nominală
VD nominal
condiții
observațiile trebuie să fie independente - să nu se influențeze reciproc, fără dg cu măsuri repetate
să fie cel puțin 20 de frecvențe observate. Frecvența așteptată (teoretică) să nu fie mai mică de 1
Pt tabele de contingență de tip 2x2, se aplică corelația Yates
la tehnicile hi pătrat se urmărește frecvența
tipuri de teste t
pt un singur eșantion
pt eșantioane independente
pt eșantioane perechi
= se face diferența dintre media unui eșantion și media populației din care a fost extras
= diferența dintre mediile a două eșantioane independente
= diferența dintre mediile a două eșantioane perechi (corelate, dependente)
au fost alese la întâmplare, pe baza situației lor naturale (ex. două clase paralele de elevi, două grupe de vârstă diferite)
Unde este diferența?
se calculează Reziduurile standardizate ajustate, valoarea semnificativă: în afara intervalului +2,-2
cele 2 grupe sunt într-o relație una cu cealaltă, fie prin intervenția experimentatorului, fie prin corespondența naturală a elementelor din cele 2 grupe
măsurători repetate
perechi naturale
perechi artificiale
pe un grup de subiecți este măsurată aceeași variabilă de două ori (pretest, posttest). Testând la inceputul unei intervenții si la finalul ei se ajunge la perechi de scoruri
formate din una sau mai multe caracteristici prealabile, care există în mod natural = frați, soți
elementele pe baza căruia s-a făcut grupul sunt create de experimentator. De ex, se dă un test inițial pe baza căruia formează grupe in funcție de scoruri
condiții
VD numerică
VD distribuită normal
Pt teste independente = omogenitatea varianțelor
Pt teste dependente (perechi) = nu e nevoie sa fie dispersie omogenă. Trebuie să fie distribuție normală între pretest-posttest
testele z
dacă există un nr suficient de mare (30 participanti în fiecare grup), distribuția z pare normală, și se poate estima AS a populației din care au fost extrase pe baza rezultatelor obtinute din cele 2 gr studiate
Managementul datelor brute
când avem date lipsă
când avem valori extreme/neobișnuite
când trebuie să transformăm datele
puține date lipsă = le eliminăm
multe date lipsă = se estimează valoare datelor lipsă pe baza mediei, mediane, modului
facem regresie + variabila lipsă se folosește drept criteriu, iar var asociate vor fi predictor
pt că am introdus greșit datele
valori min, max
pt că nu face parte din populația respectivă
se elimină
pt că avem mai multe valori extreme
se calculează cu și fără valori extreme să vedem cât de mult ele influențează datele
pentru că avem relație neliniară
împărțim intervalul de valori a variabilei pe 3 categorii
ridicăm la pătrat valoarea x
avem heterodasticitate
transformăm prin logaritm
nu avem normalizate datele/avem distr asimetrică
utilizîm radicalul
mărimea efectului = W=.10, .30, .50
relația dintre managementul impresiei și volumul cheltuielilor este moderat de genul participanților)
când plouă, oamenii rămân acasă și au un contact redus de contacte sociale