Please enable JavaScript.
Coggle requires JavaScript to display documents.
H7: selectie van onderzoekseenheden (steekproeven) - Coggle Diagram
H7: selectie van onderzoekseenheden (steekproeven)
Onderzoekseenheden zijn niet enkel mensen -> kunnen ook krantenartikels, partijprogramma's, organisaties of gedrag zijn
Populatie = de verzameling van alle eenheden waarover je uitspraken wilt doen (omvangrijke verzameling)
Steekproef = het onderdeel van de populatie dat je daadwerkelijk observeert; het beperkt aantal eenheden uit de populatie die je zal observeren wegens gebrek aan tijd en geld om populatie te nemen -> hoe je een steekproef selecteert is van cruciaal belang voor de waarheidsgetrouwheid van het onderzoek
Census of volkstelling = een onderzoek waarbij de overheid kenmerken registreert van de ganse populatie die zich op haar grondgebied bevindt
Waarnemingseenheden = de onderzoekseenheden waarbij je waarnemingen uitvoert; moet worden onderscheiden van analyse-eenheden
Analyse-eenheden = eenheid waarover je uitspraak doet; moet worden onderscheiden van waarnemingseenheden
Sociale realiteit is gelaagd -> onderzoekseenheden op verschillende niveaus bekijken (hiërarchische ordening van hoog naar laag); info per niveau heen en weer schuiven niet zonder risico's
Aggregatie = het samenvoegen van observaties op een lager niveau om uitspraken te kunnen doen over eenheden op hoger niveau
Individualiseringsfout/atomistic fallacy = uit observaties op een lager niveau verkeerde conclusies trekken over eenheden op een hoger niveau
Desaggregatie = het gebruiken van observaties van eenheden op een hoger niveau om uitspraken te doen over eenheden op een lager niveau
Ecologische fout/ecological fallacy = uit observaties op een lager niveau verkeerde conclusies trekken over eenheden op een hoger niveau
2 logica's van selectie -> steekproeven moeten waarheidsgetrouw beeld geven
Toevalssteekproef: miniatuurbeeld van de populatie
Populatie zo accuraat mogelijk weerspiegelen
Representativiteit: representatief beeld van de populatie
Toevallige selectie van grote aantallen eenheden
Hoe groter het steekproefaantal, hoe scherper het miniatuuurbeeld
Verdeling van de kenmerken moeten de spreiding in de populatie zo accuraat mogelijk weerspiegelen
Toeval = beste garantie dat alle lagen en groepen van je populatie vertegenwoordigd zijn
Past binnen naturalistische/positivistische traditie + kwantitatieve onderzoeksaanpak
Theoretische steekproef: verdiepend inzicht in de aard van een fenomeen
Niet gericht op objectieve representatie maar op een verdiepend inzicht
Inhoudelijke selectie: niet toevallig loten maar doelbewust naar meest informatieve cases zoeken -> cases in diepte analyseren
Constructivistisch (er bestaat geen objectieve klimaat om na te streven) + kwalitatieve aanpak
Mixed-method aanpak -> combinatie van beide
Toevalssteekproeven
Stappen bij het trekken van toevalssteekproeven
Algemeen universum -> speciaal universum -> steekproefkader -> geplande steekproef -> gerealiseerde steekproef
Populatie of universum (vertrekpunt): verzameling van alle eenheden waarover je uitspraak wil doen
Algemeen universum: algemene of vage termen -> concrete definitie nodig
Specifiek universum = een operationele definitie van de populatie, die in tijd en ruimte is afgebakend -> conclusies van onderzoek gelden voor speciaal universum
Steekproefkader/sampling frame = een lijst van alle eenheden die tot het speciaal universum behoren
Geplande steekproef: aantal eenheden uitloten op toevalsbasis; steekproeffractie = het percentage van alle populatie-eenheden die in de steekproef opgenomen zijn (geplande steekproef/populatie) -> de kans dat een lid van de populatie geselecteerd wordt op in de steekproef opgenomen te zijn
Gerealiseerde steekproef: eenheden die daadwerkelijk geobserveerd worden -> non-respons = de geselecteerde eenheden die je uiteindelijk niet observeert (contact mislukt, niet in staat, niet willen etc.)
Toevalssteekproef (aselecte steekproef) = een steekproef waarbij je eenheden louter toevallig selecteert en waarbij alle eenheden in de populatie een berekenbare kans hebben om geselecteerd te worden
Toevalscomponent (kans): elk lid van de populatie moet een van 0 verschillende kans op selectie hebben -> kans moet niet per se gekend zijn
Selecteren van eenheden moet via strikt ontworpen design
Niet iedereen moet gelijke kans op selectie hebben: over- of ondervertegenwoordiging nuttig?
Niet -> zelfselectie = een mechanisme van steekproeftrekking waarbij de eenheden zelf invloed hebben op hun kans op selectie; vormt een bedreiging voor de representativiteit van de steekproef -> oververtegenwoordiging van personen die deelnemen met interesse in het ontwerp
Types toevalsteekproeven -> er zijn verschillende wijzen waarop de geplande steekproef uit het speciaal universum wordt geloot
Enkelvoudige toevalsteekproef/simple random sample = een toevalssteekproef die geen rekening houdt met kenmerken van de eenheden en elke eenheid een gelijke kans op selectie heeft
Alle eenheden gelijke kans om in steekproef terecht te komen
Systematische enkelvoudige toevalssteekproef = een toevalsteekproef die verkregen wordt door op toevallige wijze een startpunt in het steekproefkader te bepalen en vervolgens eenheden te selecteren volgens vast interval
Risico: veronderstellen dat eenheden in willekeurige volgorde staan in het steekproefkader -> vertekening indien niet zo
Nadeel: zien populatie als één ongedifferentieerd geheel -> geen onderscheid tussen types eenheden
Voordeel: eenvoudig uit te voeren en te analyseren + transparant
Gestratificeerde steekproef = een toevalsteekproef die verkregen wordt door de populatie op te delen in subgroepen (strata) en binnen deze groepen toevallig eenheden te selecteren
Houdt rekening met kenmerken van de onderzoekseenheden van de populatie
Uit elke strata wordt een enkelvoudige toevalsteekproef genomen
2 varianten in de wijze waarop strata vertegenwoordigd zijn
Proportioneel gestratificeerde steekproef = een gestratificeerde steekproef waarbij het aandeel respondenten per stratum overeenstemt met de omvang van de strata in de populatie -> voorkomt over- of ondervertegenwoordiging: steekproef weerspiegelt de verdeling van de strata in de populatie (omvang van de strata in de steekproef is proportioneel aan de omvang in het universum)
Voordeel: design maakt steekproeffout kleiner -> helpt toeval een beetje
Disproportioneel gestratificeerde steekproef = een gestratificeerde steekproef waarbij het aandeel respondenten per stratum niet overeenstemt met de omvang van de strata in de populatie
Als je uitspraken wil doen over groepen die slechts een beperkte omvang hebben in de populatie -> weegcoëfficiënten gebruiken bij verdere analyse
Houdt geen rekening met hoe de strata verdeeld is in de populatie -> onder- en oververtegenwoordiging
Onder- en oververtegenwoordiging terug representatief maken door weegcoëfficiënten (= aandeel in populatie/aandeel in steekproef); ondervertegenwoordigde groepen -> weegcoëfficiënt +1 en oververtegenwoordigde groepen -> weegcoëfficiënt -1; disproportionaliteit rechttrekken -> telkens laten meetellen volgens de proporties
Clustersteekproef = een steekproef die verkregen wordt door toevallig een aantal primaire eenheden te selecteren, waarvan je vervolgens alle secundaire eenheden in het onderzoek opneemt
In eerste stap toevallig enkele primaire eenheden selecteren + in tweede stap alle secundaire eenheden opnemen die onder de primaire vallen
Voordeel
Volledige steekproefkaders op individueel niveau is niet meer nodig -> je gaat alle secundaire eenheden selecteren
Reduceren geografische spreiding
Nadeel: grote foutenmarge
Tweetrapssteekproef = een steekproef die verkregen wordt door eerst toevallig een aantal primaire eenheden te selecteren en vervolgens daarbinnen op toevallige wijze secundaire eenheden te selecteren
Kans op selectie dient evenredig te zijn met de grootte van de primaire eenheid
Verschil: niet alle secundaire eenheden binnen een primaire eenheid worden opgenomen -> opnieuw toevalsteekproef van secundaire eenheden bij tweetrapsstekproef
Voordeel
Volledige steekproefkaders op individueel niveau is niet meer nodig -> lijsten van geselecteerde primaire eenheden zijn eenvoudiger te verkrijgen dan lijsten van alle primaire eenheden
Reduceren geografische spreiding
Nadeel: grote foutenmarge
Tweefasensteekproef = een steekproef die verkregen wordt door in een eerste fase eenheden uit een te ruime populatie te selecteren; vervolgens ga je door middel van een screeningsvraag na of ze wel tot de groep behoren waarover het onderzoek handelt
Geen sprake van hogere/lagere niveaus of primaire/secundaire eenheden
Wanneer geen steekproefkader beschikbaar is
Eerste fase: je trekt een omvangrijke toevalsteekproef uit een ruimere populatie waar wel steekproefkader voor bestaan (de steekproef die hier getrokken wordt moet groter zijn dan het steekproefaantal dat je uiteindelijk wenst te hebben)
Tweede fase: je gaat na of geselecteerde eenheden wel degelijk behoren tot de groep waarover het onderzoek handelt (via eenvoudige vraag)
Foutenbronnen bij steekproeftrekking -> soorten fouten
Dekkingsfout/coverage error = een fout ten gevolge van een gebrek aan overeenstemming tussen populatie en het steekproefkader
In stap van universum naar steekproefkader (gebrekkige overlap)
Gebrekkige administratie -> populatielijsten die niet up-to-date zijn
Steekproefkader overlapt idealiter 100% met de populatie
Overcoverage = soms bevat steekproefkader onbedoeld eenheden die niet tot de populatie behoren
Undercoverage = wanneer bepaalde elementen ontbreken in het steekproefkader
Niet-verkiesbare respondenten = een eenheid in de geplande steekproef die geen deel uitmaakt van de onderzoekspopulatie -> eenheden die wel je in geplande steekproef zaten maar niet tot populatie blijken te horen (fout in steekproefkader)
Steekproeffout/sampling error = de onbetrouwbaarheid die voortvloeit uit het feit dat je een steekproef analyseert in plaats van de ganse populatie
In stap waarbij je geplande steekproef uit het kader selecteert
Resultaat van toevalsfactor
Komt onvermijdelijk voort uit het feit dat je gebruikmaakt van toeval -> telkens je een nieuwe steekproef selecteert, zullen de resultaten een beetje anders zijn
Steekproeffout -> normaalverdeeld (klokvorm): breder bij minder steekproeven en smaller bij grotere
Betrouwbaarheidsinterval = het bereik aan waarden rond een schatting waarin de werkelijke waarde zich met een bepaalde waarschijnlijkheid bevindt (95%) -> drukt uit hoe groot steekproeffout is (onzekerheid inschatten)
Non-responsfout = een fout die optreedt als gevolg van het niet participeren van een deel van de geselecteerde steekproefeenheden
In stap van geplande naar gerealiseerde steekproef -> omdat deel van de geselecteerde eenheden niet aan het onderzoek deelenemen
Oorzaken non-respons
Onderzoekers slagen er niet in de geselecteerde onderzoekseenheid te contacteren (= non-contacts)
Weigeringen: vaak grootste oorzaak
Gevolgen
Wegvallen van eenheden -> kleinere steekproef -> minder nauwkeurige schattingen -> grotere betrouwbarheidsintervallen
Responsgraad = het percentage van de geselecteerde steekproefeenheden dat daadwerkelijk aan het onderzoek deelneemt (aantal gerealiseerde observaties/aantal units in geplande steekproef - niet verkiesbare units)
Vertekening doordat non-respondenten vaak een specifiek profiel hebben
Non-responsvertekening = een systematische fout in schattingen die optreedt ten gevolge van non-respons; de grootte van de fout hangt af van de responsgraad en de verschillen tussen respondenten en non-respondenten
De mate van vertekening: percentage non-respondenten * hoeveel non-respondenten er verschillen van de respondenten -> hoge non-respons + veel non-respondenten met specifiek profiel = hoge non-respons vertekening
Steekproefgrootte
Grote steekproef = hogere nauwkeurigheid van de schattingen
De gewenste steekproefgrootte hangt niet af van de omvang van de populatie -> steekproefeenheden is bepalen voor de nauwkeurigheid, niet de steekproeffractie
Finiteitscorrectie = een correctie die je toepast bij het berekenen van betrouwbaarheidsintervallen wanneer de steekproeffactie erg groot (> 5%) is
Factoren bij bepalen steekproefomvang
De gewenste betrouwbaarheid
Grotere steekproeven -> grotere nauwkeurigheid
Hoe breed een betrouwbaarheidsinterval mag zijn is afhankelijk van de aard van de onderzoeksvragen
Betrouwbare uitspraken = smaller betrouwbaarheidsinterval
Gewenste kans op vergissing
Constructie betrouwbaarheidsinterval -> hoeveel zekerheid moet dit interval hebben?
95% betrouwbaarheid = 5% kans op vergissing
Grootte betrouwbaarheidsinterval is omgekeerd evenredig met gewenste kans op vergissing
Kleinere kans op vergissing = steekproefgrootte opdrijven
Heterogeniteit van de populatie
Heterogeniteit = spreiding/variantie van het kenmerk dat je onderzoekt
Hoe heterogener de populatie, hoe uitdagender om accurate schatting te doen
Heterogene populaties -> grotere steekproefomvang voor zelfde niveau van betrouwbaarheid
Analysebehoeften
Geplande analyses en exacte onderzoeksvragen zijn van cruciaal belang om over de steekproefomvang te beslissen
Niet altijd enkel interesse om uitspraken te doen op het niveau van de volledige populatie -> interesse in subgroepen van de populatie (subgroepen met elkaar vergelijken)
Praktische overwegingen
Financiële middelen en tijdsperiode kunnen zorgen voor beperkingen
Kwantitatieve niet-toevalssteekpoeven
Om de representativiteit te garanderen is het noodzakelijk om de selectie van eenheden op toeval te baseren -> soms onmogelijk
Steekproefdesigns die inferieur zijn aan kwaliteit ten opzichte van een toevalsteekproef zijn gevoelig voor vertekening en hebben geen representativiteit
Quotasteekproef = een niet-toevalsteekproef waarbij je per categorie van de populatie een vast aantal eenheden selecteert
Er worden subgroepen gemaakt op basis van één of meerdere relevante kenmerken
Moeilijk bereikbare groepen blijven buiten beeld
Quota = een steekproefplan dat stipuleert hoeveel eenheden er per categorie opgenomen worden; dit gebeurt op basis van hoe de populatie over deze categorieën is verdeeld
Een proportioneel gestratificeerde steekproef zonder aselecte keuze binnen verschillende strata
Random walk = een methode om steekproefeenheden te selecteren waarbij interviewers vanaf een toevallig gekozen startpunt een route afleggen die volgens bepaalde beslissingsregels is uitgestippeld -> afhankelijk van wie op dat moment thuis is (moeilijk te controleren of interviewers regels nauwgezet volgen)
Acces panels = een bestand van personen die zichzelf opgegeven hebben om op regelmatige basis aan onderzoek mee te werken
Commerciële onderzoeksbureaus
Risico: veralgemening naar een grotere populatie -> pannelleden hebben vaak specifiek profiel
Gelegenheidssteekproef/convenience sample = een niet-toevalssteekproef waarvan de eenheden geselecteerd zijn op basis van het feit dat ze makkelijk voorhanden zijn -> selectie door onderzoeker
Theoretische steekproeven
De eigenheid van theoretische steekproeftrekking
Theoretische steekproef = een selectie van onderzoekseenheden op basis van theoretische overwegingen, die eerder een verdiepend inzicht dan representativiteit nastreeft
Onderzoekers maken weloverwogen keuzes in functie van de relevantie voor de onderzoeksvraag
Doel: verdiepend inzicht
Proces heeft open karakter: selectie van eenheden, observatie en interpretatie wisselen voortdurend
Uitkomsten van eerdere observatie beïnvloeden beslissing omtrent steekproeftrekking
Gevolgen
Flexibele omgang met de afbakenen van de onderzoekseenheden (ligt niet per se vast in welke populatie onderzoekseenheden getrokken worden)
Interesse van de onderzoeker kan doorheen het onderzoeksproces verschuiven
Omvang van de steekproef ligt niet a priori vast (beslissingen om al dan niet bijkomende eenheden op te nemen is afhankelijk van eerdere observaties)
Analytische inductie = een strategie om op inductieve wijze tot een sluitende verklaring voor een fenomeen te komen; de zoektocht naar negatieve cases en het voortdurend ijstellen van hypothesen staan hier centraal -> je blijft bijkomende observaties doen tot dat het punt van theoretische verzadiging is bereikt
Logica om de data te verzamelen en te analyseren
Inductieve methode: uit observatie theoretische inzichten laten oprijzen: voorlopige hypothese verklaring -> nieuwe info via observatie -> hypothese verfijnen en herformuleren (meerdere keren doorlopen)
Om hypotheses zo efficiënt mogelijk te kunnen verfijnen: op zoek naar negatieve cases -> grotere kans om hypothese te verwerpen
Theoretische verzadiging = de theorie is voldoende fijnmazig om de complexe realiteit te vatten -> je vind geen observaties meer die hypothese tegenspreken
Principes van theoretische steekproeftrekking
Informatieve waarde vs toeval
Geen toevallige selectie van eenheden
Zoeken naar negatieve cases -> je haalt meeste kennis uit eenheden die hypothese tegenspreken
Open vs gesloten definitie van populatie
Gesloten = omschrijving van speciaal universum ligt van begin vast
Open = het ligt niet op voorhand vast bij welk type eenheden je gaat observeren
Theoretische verzadiging vs vast aantal
Steekproefomvang ligt niet op voorhand vast -> met observeren tot theoretische verzadiging komen (je kan niet voorspelen wanneer dit is)
Vast aantal
Strategieën in theoretische steekproeftrekking
Er bestaan verschillende wijzen waarop steekproeftrekking rekening kan houden met die theoretische factoren van theoretische steekproeven
Doelgerichte steekproef/purposive sample = een theoretische steekproef die verkregen wordt door de onderzoekseenheden te selecteren die de grootste relevantie hebben voor de onderzoeksvraag
Op zoek naar eenheden die een relatief klein onderzoeksgroep afgrenzen
Groep afgebakend op basis van criteria
Basis van selectie is de expertise van de onderzoeker, niet het toeval
Plausibele logica van selectie: enkel groepen die hiermee bezig zijn selecteren
Sneeuwbalsteekproef = een theoretische steekproef die verkregen wordt door één of meerdere respondenten (de zogenaamde startpunten) te vragen of ze je in contact kunnen brengen met andere leden van een specifieke populatie
Gebruikt netwerken van respondenten om op zoek te gaan naar steekproefeenheden
Vooral geschikt om steekproeven te bekomen in kleine verborgen populaties
Leden staan via netwerken in verbinding met elkaar
Risico voor vertekend beeld: steekproef blijft beperkt tot kliek of subgroep van de populatie
Gelegenheidssteekproef = steekproef wordt samengesteld met leden waartoe je eenvoudig toegang hebt
Praktische overwegingen spelen belangrijke rol ten nadele van theoretische relevantie
Adaptieve steekproef = het combineren van diverse strategieën van selectie om een steekproef te verkrijgen die aangepast is aan de specifieke noden van het onderzoek
Op maat gemaakte combinatie van strategieën
Open karakter: aanpassen en bijsturen wanneer/waar nodig