Please enable JavaScript.

Coggle requires JavaScript to display documents.

H7: selectie van onderzoekseenheden (steekproeven) - Coggle Diagram

- - - - Algemeen universum: algemene of vage termen -> concrete definitie nodig
      - Specifiek universum = een operationele definitie van de populatie, die in tijd en ruimte is afgebakend -> conclusies van onderzoek gelden voor speciaal universum
  - - - Alle eenheden gelijke kans om in steekproef terecht te komen
      - Systematische enkelvoudige toevalssteekproef = een toevalsteekproef die verkregen wordt door op toevallige wijze een startpunt in het steekproefkader te bepalen en vervolgens eenheden te selecteren volgens vast interval
        
        Risico: veronderstellen dat eenheden in willekeurige volgorde staan in het steekproefkader -> vertekening indien niet zo
        
        Nadeel: zien populatie als één ongedifferentieerd geheel -> geen onderscheid tussen types eenheden
        
        Voordeel: eenvoudig uit te voeren en te analyseren + transparant
    - - Houdt rekening met kenmerken van de onderzoekseenheden van de populatie
      - Uit elke strata wordt een enkelvoudige toevalsteekproef genomen
      - 2 varianten in de wijze waarop strata vertegenwoordigd zijn
        
        Proportioneel gestratificeerde steekproef = een gestratificeerde steekproef waarbij het aandeel respondenten per stratum overeenstemt met de omvang van de strata in de populatie -> voorkomt over- of ondervertegenwoordiging: steekproef weerspiegelt de verdeling van de strata in de populatie (omvang van de strata in de steekproef is proportioneel aan de omvang in het universum)
        
        Voordeel: design maakt steekproeffout kleiner -> helpt toeval een beetje
        
        Disproportioneel gestratificeerde steekproef = een gestratificeerde steekproef waarbij het aandeel respondenten per stratum niet overeenstemt met de omvang van de strata in de populatie
        
        Als je uitspraken wil doen over groepen die slechts een beperkte omvang hebben in de populatie -> weegcoëfficiënten gebruiken bij verdere analyse
        
        Houdt geen rekening met hoe de strata verdeeld is in de populatie -> onder- en oververtegenwoordiging
        
        Onder- en oververtegenwoordiging terug representatief maken door weegcoëfficiënten (= aandeel in populatie/aandeel in steekproef); ondervertegenwoordigde groepen -> weegcoëfficiënt +1 en oververtegenwoordigde groepen -> weegcoëfficiënt -1; disproportionaliteit rechttrekken -> telkens laten meetellen volgens de proporties
    - - In eerste stap toevallig enkele primaire eenheden selecteren + in tweede stap alle secundaire eenheden opnemen die onder de primaire vallen
      - Voordeel
        
        Volledige steekproefkaders op individueel niveau is niet meer nodig -> je gaat alle secundaire eenheden selecteren
        
        Reduceren geografische spreiding
      - Nadeel: grote foutenmarge
    - - Kans op selectie dient evenredig te zijn met de grootte van de primaire eenheid
      - Verschil: niet alle secundaire eenheden binnen een primaire eenheid worden opgenomen -> opnieuw toevalsteekproef van secundaire eenheden bij tweetrapsstekproef
      - Voordeel
        
        Volledige steekproefkaders op individueel niveau is niet meer nodig -> lijsten van geselecteerde primaire eenheden zijn eenvoudiger te verkrijgen dan lijsten van alle primaire eenheden
        
        Reduceren geografische spreiding
      - Nadeel: grote foutenmarge
    - - Geen sprake van hogere/lagere niveaus of primaire/secundaire eenheden
      - Wanneer geen steekproefkader beschikbaar is
      - Eerste fase: je trekt een omvangrijke toevalsteekproef uit een ruimere populatie waar wel steekproefkader voor bestaan (de steekproef die hier getrokken wordt moet groter zijn dan het steekproefaantal dat je uiteindelijk wenst te hebben)
      - Tweede fase: je gaat na of geselecteerde eenheden wel degelijk behoren tot de groep waarover het onderzoek handelt (via eenvoudige vraag)
  - - - In stap van universum naar steekproefkader (gebrekkige overlap)
      - Gebrekkige administratie -> populatielijsten die niet up-to-date zijn
      - Steekproefkader overlapt idealiter 100% met de populatie
      - Overcoverage = soms bevat steekproefkader onbedoeld eenheden die niet tot de populatie behoren
      - Undercoverage = wanneer bepaalde elementen ontbreken in het steekproefkader
      - Niet-verkiesbare respondenten = een eenheid in de geplande steekproef die geen deel uitmaakt van de onderzoekspopulatie -> eenheden die wel je in geplande steekproef zaten maar niet tot populatie blijken te horen (fout in steekproefkader)
    - - In stap waarbij je geplande steekproef uit het kader selecteert
      - Resultaat van toevalsfactor
      - Komt onvermijdelijk voort uit het feit dat je gebruikmaakt van toeval -> telkens je een nieuwe steekproef selecteert, zullen de resultaten een beetje anders zijn
      - Steekproeffout -> normaalverdeeld (klokvorm): breder bij minder steekproeven en smaller bij grotere
      - Betrouwbaarheidsinterval = het bereik aan waarden rond een schatting waarin de werkelijke waarde zich met een bepaalde waarschijnlijkheid bevindt (95%) -> drukt uit hoe groot steekproeffout is (onzekerheid inschatten)
    - - In stap van geplande naar gerealiseerde steekproef -> omdat deel van de geselecteerde eenheden niet aan het onderzoek deelenemen
      - Oorzaken non-respons
        
        Onderzoekers slagen er niet in de geselecteerde onderzoekseenheid te contacteren (= non-contacts)
        
        Weigeringen: vaak grootste oorzaak
      - Gevolgen
        
        Wegvallen van eenheden -> kleinere steekproef -> minder nauwkeurige schattingen -> grotere betrouwbarheidsintervallen
      - Responsgraad = het percentage van de geselecteerde steekproefeenheden dat daadwerkelijk aan het onderzoek deelneemt (aantal gerealiseerde observaties/aantal units in geplande steekproef - niet verkiesbare units)
      - Vertekening doordat non-respondenten vaak een specifiek profiel hebben
        
        Non-responsvertekening = een systematische fout in schattingen die optreedt ten gevolge van non-respons; de grootte van de fout hangt af van de responsgraad en de verschillen tussen respondenten en non-respondenten
        
        De mate van vertekening: percentage non-respondenten * hoeveel non-respondenten er verschillen van de respondenten -> hoge non-respons + veel non-respondenten met specifiek profiel = hoge non-respons vertekening
  - - - De gewenste betrouwbaarheid
        
        Grotere steekproeven -> grotere nauwkeurigheid
        
        Hoe breed een betrouwbaarheidsinterval mag zijn is afhankelijk van de aard van de onderzoeksvragen
        
        Betrouwbare uitspraken = smaller betrouwbaarheidsinterval
      - Gewenste kans op vergissing
        
        Constructie betrouwbaarheidsinterval -> hoeveel zekerheid moet dit interval hebben?
        
        95% betrouwbaarheid = 5% kans op vergissing
        
        Grootte betrouwbaarheidsinterval is omgekeerd evenredig met gewenste kans op vergissing
        
        Kleinere kans op vergissing = steekproefgrootte opdrijven
      - Heterogeniteit van de populatie
        
        Heterogeniteit = spreiding/variantie van het kenmerk dat je onderzoekt
        
        Hoe heterogener de populatie, hoe uitdagender om accurate schatting te doen
        
        Heterogene populaties -> grotere steekproefomvang voor zelfde niveau van betrouwbaarheid
      - Analysebehoeften
        
        Geplande analyses en exacte onderzoeksvragen zijn van cruciaal belang om over de steekproefomvang te beslissen
        
        Niet altijd enkel interesse om uitspraken te doen op het niveau van de volledige populatie -> interesse in subgroepen van de populatie (subgroepen met elkaar vergelijken)
      - Praktische overwegingen
        
        Financiële middelen en tijdsperiode kunnen zorgen voor beperkingen
  - - - Er worden subgroepen gemaakt op basis van één of meerdere relevante kenmerken
      - Moeilijk bereikbare groepen blijven buiten beeld
      - Quota = een steekproefplan dat stipuleert hoeveel eenheden er per categorie opgenomen worden; dit gebeurt op basis van hoe de populatie over deze categorieën is verdeeld
      - Een proportioneel gestratificeerde steekproef zonder aselecte keuze binnen verschillende strata
    - - Commerciële onderzoeksbureaus
      - Risico: veralgemening naar een grotere populatie -> pannelleden hebben vaak specifiek profiel
- - - - Onderzoekers maken weloverwogen keuzes in functie van de relevantie voor de onderzoeksvraag
      - Doel: verdiepend inzicht
      - Proces heeft open karakter: selectie van eenheden, observatie en interpretatie wisselen voortdurend
      - Uitkomsten van eerdere observatie beïnvloeden beslissing omtrent steekproeftrekking
      - Gevolgen
        
        Flexibele omgang met de afbakenen van de onderzoekseenheden (ligt niet per se vast in welke populatie onderzoekseenheden getrokken worden)
        
        Interesse van de onderzoeker kan doorheen het onderzoeksproces verschuiven
        
        Omvang van de steekproef ligt niet a priori vast (beslissingen om al dan niet bijkomende eenheden op te nemen is afhankelijk van eerdere observaties)
    - - Inductieve methode: uit observatie theoretische inzichten laten oprijzen: voorlopige hypothese verklaring -> nieuwe info via observatie -> hypothese verfijnen en herformuleren (meerdere keren doorlopen)
    - - Theoretische verzadiging = de theorie is voldoende fijnmazig om de complexe realiteit te vatten -> je vind geen observaties meer die hypothese tegenspreken
    - - Informatieve waarde vs toeval
        
        Geen toevallige selectie van eenheden
        
        Zoeken naar negatieve cases -> je haalt meeste kennis uit eenheden die hypothese tegenspreken
      - Open vs gesloten definitie van populatie
        
        Gesloten = omschrijving van speciaal universum ligt van begin vast
        
        Open = het ligt niet op voorhand vast bij welk type eenheden je gaat observeren
      - Theoretische verzadiging vs vast aantal
        
        Steekproefomvang ligt niet op voorhand vast -> met observeren tot theoretische verzadiging komen (je kan niet voorspelen wanneer dit is)
        
        Vast aantal
  - - - Op zoek naar eenheden die een relatief klein onderzoeksgroep afgrenzen
      - Groep afgebakend op basis van criteria
      - Basis van selectie is de expertise van de onderzoeker, niet het toeval
      - Plausibele logica van selectie: enkel groepen die hiermee bezig zijn selecteren
    - - Gebruikt netwerken van respondenten om op zoek te gaan naar steekproefeenheden
      - Vooral geschikt om steekproeven te bekomen in kleine verborgen populaties
      - Leden staan via netwerken in verbinding met elkaar
      - Risico voor vertekend beeld: steekproef blijft beperkt tot kliek of subgroep van de populatie
    - - Praktische overwegingen spelen belangrijke rol ten nadele van theoretische relevantie
    - - Op maat gemaakte combinatie van strategieën
      - Open karakter: aanpassen en bijsturen wanneer/waar nodig