STATYSTYKA

populacja i próba

populacja

  • badanie całościowe (inaczej pełne lub wyczerpujące) - bezpośrednie zbadanie całej populacji

próba

badanie częściowe

wyniki badań częściowych

  • opracowanie wyników badań częściowych musi zawierać: 1. opis własności próby 2. wnioski odnoszące się do populacji (wnioski z badania częściowego muszą dotyczyć całej populacji)

reprezentatywność

  • w badaniu częściowym nie jesteśmy w stanie jednoznacznie stwierdzić, czy nasza próba jest reprezentatywna, czy też nie. (W praktyce nie znamy przecież dokładnie własności populacji.)
    zależy od:

losowego doboru próby

  • najważniejsze wymaganie stawiane badaniom częściowym
  • próba jest losowa wtedy, gdy każda jednostka populacji ma jednakowe prawdopodobieństwo znalezienia się w próbie. Przy losowym doborze próby wyniki losowań w postaci własności uzyskanej próby nie układają się w sposób całkowicie dowolny, ale zgodnie z pewnymi regułami
    losowy dobór próby umożliwia:
  • dokonywanie szacunków ilościowych własności populacji na podstawie własności stwierdzonych w pobranej próbie
  • określenie błędu, jakim szacunki te mogą być obciążone - dokonywanie ocen stopnia dokładności tych szacunków

liczebności próby

  • PRAWO WIELKICH LICZB - wraz ze wzrostem liczebności próby prawdopodobieństwo, że próba pod względem określonej własności będzie się różniła od populacji - in plus lub in minus - o więcej, niż o dowolnie przez nas ustaloną dodatnią liczbę, dąży do zera.
    (konsekwencją prawa wielkich liczb jest możliwość wykrywania prawidłowości niewidocznych
    w pojedynczych przypadkach lub w małej ich liczbie, o ile zbadamy dostatecznie dużą liczbę losowo wybranych jednostek)

okoliczności, które mogą sprawić, że różni badacze uzyskają zdecydowanie różniące się od siebie wnioski:

  • Próba uzyskana przez co najmniej jednego badacza nie została pobrana w sposób losowy. Przyczyną może być nierzetelność badacza - chęć ułatwienia sobie pracy, niewiedza lub brak dostatecznej kontroli nad procesem doboru próby
  • Populacja, z której różni badacze losowali próby jest tylko pozornie tą samą populacją. Przykładowo, studenci mieszkający w domach akademickich mogą pod wieloma względami (np. sposobu spędzania wolnego czasu) w dużym stopniu różnić się od pozostałych studentów. Jeżeli w publikacji badacz pominął szczegółowy opis populacji i sposobu doboru próby, czytelnik może odnieść wrażenie, że w badaniu uczestniczyli studenci, podczas gdy faktycznie zbadano specyficzną ich część - mieszkańców domów studenckich.
  • Metody pomiaru różnych cech, pozornie te same, faktycznie mogły nie być takie same - zmienne zakłócające
  • Badania, pozornie tak samo przeprowadzone mogły faktycznie być wykonywane w odmiennych warunkach - zmienne zakłócające

Schematy losowania - sposoby pobierania losowej próby
Przed rozpoczęciem losowania należy określić jednostki losowania - operat. - kompletny wykaz jednostek badanej populacji, którym przydzielono odpowiednie symbole identyfikacyjne (najczęściej liczby) w celu dokonania wyboru próby Operat losowania powinien obejmować wszystkie jednostki populacji i każdą z nich tylko jeden raz.

Losowanie zwrotne i bezzwrotne
próbę losujemy bezzwrotnie (ta sama jednostka nie może wielokrotnie wystąpić
w próbie), natomiast wnioskowanie statystyczne prowadzimy metodami dostosowanymi do losowania ze zwracaniem.

losowanie ze zwracaniem (inaczej: losowanie zwrotne, losowanie niezależne)

  • ta sama jednostka może wielokrotnie wystąpić w tej samej próbie
  • własności jednostek losowanych później nie zależą od tego, jakie jednostki wcześniej wylosowaliśmy, stąd też losowanie zwrotne nazywane jest losowaniem niezależnym
  • liczebność populacji nie ma wpływu na własności wylosowanej próby
  • własności prób losowanych zwrotnie zależą wyłącznie od własności populacji i od liczebności próby
    liczebność populacji,ani stosunek liczebności próby do liczebności populacji, nie mają żadnego wpływu na reprezentatywność prób losowanych ze zwracaniem.
    -> obliczenia prawdopodobieństw w przypadku losowania ze zwracaniem są znacznie prostsze, nie wymagają bowiem uwzględniania liczebności populacji, (która w losowaniu tym nie ma żadnego wpływu na uzyskiwane rezultaty.)

losowanie bezzwrotne (zależne)

  • każda jednostka może pojawić się w próbie tylko raz
  • losowanie nazywa się zależnym, bo prawdopodobieństwa uzyskania określonych wyników w losowaniach następnych jednostek zależą od tego, jakie jednostki wylosowaliśmy wcześniej
  • większa efektywność losowania bezzwrotnego próby bezzwrotne charakteryzują się silniejszą tendencją do odtwarzania struktury populacji, niż próby uzyskiwane w losowaniu ze zwracaniem
    ale większa efektywność losowania bezzwrotnego przyjmuje widoczne rozmiary tylko wtedy, gdy próba stanowi znaczącą część populacji - Gdy próba stanowi powyżej 5 % populacji

losowanie NIEOGRANICZONE INDYWIDUALNE
+ najprostszy rodzaj losowania
+/- losowanie to stosuje się więc raczej w przypadkach populacji mało licznych
W losowaniu tym próbę pobiera się bezpośrednio z całej populacji, nie podzielonej na części, a jednostkami losowania są jednostki populacji
- wymaga operatu losowania w postaci wykazu wszystkich jednostek populacji

  • Losowanie indywidualne - losowanie, w którym jednostkami losowania są jednostki populacji.
  • Losowanie nieograniczone - losowanie, w którym wylosowanie danej jednostki nie ogranicza możliwości późniejszego wylosowania jakiejkolwiek innej jednostki.

wykorzystanie: technikę losowania nieograniczonego indywidualnego wykorzystuje się w ostatnim etapie losowania wielostopniowego lub w losowaniu warstwowym

losowanie SYSTEMATYCZNE
Polega na wyborze do próby elementów populacji oddalonych od siebie o stałą wartość k, zwaną interwałem losowania.
Stosując losowanie systematyczne,należy określić:

  • interwał (odstęp) losowania k=N/n
    gdzie
    N - liczebność populacji
    n - żądana liczebność próby
  • pierwszą jednostkę do próby, którą wybiera się losowo np. przy pomocy tablic losowych
  • te jednostki z operatu losowania, których numery są oddalone od pierwszej jednostki i każdej następnej o wartość interwału losowania k
    jeśli interwał losowania nie jest liczbą całkowitą, to zaokrąglamy go zawsze w dół (bierzemy część całkowitą danej liczby)

losowanie systematyczne indywidualne jest bardziej efektywne od losowania nieograniczonego indywidualnego, gdy jednostki o bliskich sobie numerach są pod pewnymi względami bardziej do siebie podobne, niż jednostki o numerach bardziej odległych
tak samo efektywne jak nieograniczone gdy jednostki populacji nie są uporządkowane pod względem żadnej cechy związanej z przedmiotem badania, a więc np. występują w kolejności alfabetycznej
+ ustalenie numerów wylosowanych jednostek jest prostsze niż przy nieograniczonym (bo losujemy tylko 1 numer)

losowanie GRUPOWE czyli zespołowe
Jednostkami losowania są utworzone grupy.
w losowaniu grupowym opłaca się wykorzystywać naturalne zespoły

losowanie WARSTWOWE
Przed rozpoczęciem losowania populację dzieli się na warstwy.
należy określić kryteria warstwowania.
obliczanie liczby osób jaka powinna się znaleźć w warstwie:
procent populacji jaki stanowi warstwa * liczebność próby = np 3,74 ~ 4 <- liczba osób losowanych z warstwy
w losowaniu warstwowym z każdej warstwy oddzielnie losuje się do próby określoną liczbę jednostek.

losowanie WIELOSTOPNIOWE
(najczęściej sprowadza się do losowania dwu- lub trójstopniowego)
Populację dzieli się na duże zespoły jednostek populacji, tzw. jednostki losowania pierwszego stopnia. Każdą z nich dzieli się na mniejsze zespoły - jednostki losowania drugiego stopnia, te z kolei można ewentualnie podzielić na jeszcze mniejsze jednostki losowania trzeciego stopnia, itd

zasady losowania grupowego:

  • losowanie grupowe jest tym bardziej efektywne, im bardziej różnią się od siebie jednostki z tych samych grup i im bardziej różne grupy są do siebie podobne pod względem ich wewnętrznej struktur
  • losowanie to jest tym bardziej efektywne, im więcej grup wylosujemy,
  • losowanie grupowe jest szczególnie niekorzystne wtedy, gdy cechy, pod względem których członkowie tych samych grup są bardziej podobni do siebie, niż do jednostek z innych grup, pozostają w związku
    z cechami będącymi przedmiotem badania