Please enable JavaScript.
Coggle requires JavaScript to display documents.
((Può essere sia probabilistico che non probabilistico a seconda di come…
Può essere sia probabilistico che non probabilistico a seconda di come sono selezionati i soggetti da collocare negli strati
-
-
-
-
La logica fattoriale non discende da quella del campione, ma da quella
-
-
(analisi esplicativa), adatto per controllo empirico di ipotesi specifiche
-
-
informazioni sulla popolazione, ma per la loro rilevanza esplicativa rispetto allo
-
-
Le unità statistiche sono scelte sulla base di alcune loro caratteristiche. Si può ricorrere a questo campionamento anche quando il collettivo statistico è di dimensioni ridotte e il probabilistico porterebbe a errori di campionamento troppo alti (le oscillazioni casuali potrebbero allontanare troppo il campione dalle caratteristiche della popolazione)
-
numero di quartieri centrali e periferici, senza tener conto di differenze nella
-
-
-
censimento del 1921 ma il campione presentò eccessive discrepanze, non era rappresentativo della popolazione.
Si tratta di una forma di campionamento ragionato, nel quale le unità si
selezionano in modo che la media del campione per determinate variabili sia prossima alla media della popolazione (quindi dobbiamo conoscere la distribuzione nella popolazione)
-
Procedura: si individuano i soggetti da inserire nel campione a partire dai soggetti già intervistati. Si seleziona un piccolo numero di soggetti che hanno gli attributi di interesse e si chiede loro di fornire contatti/indicazioni di soggetti con caratteristiche simili. Si parte da uno o più centri di aggregazione e poi si procede lungo una catena di contatti
-
raggiungere (immigrati non regolari, gruppi sociali con particolari
ideologie, sette religiose, dipendenti da sostanze, sex worker, studenti fuori
sede, comunità di persone con stessa provenienza, etc.). Elementi rari
-
-
-
-
alcune variabili oppure si può tentare di ‘orientare la valanga’ quando il campione appare eccessivamente sbilanciato
-
NON è un disegno campionario, ma è un insieme di persone scelto, in modo
arbitrario dal ricercatore, solo perché facilmente raggiungibili
-
-
-
del volume di informazioni prodotte e scambiate (big data). Lo sviluppo delle tecnologie web e la crescente diffusione dei social media hanno trasformato gli utenti da semplici fruitori a incessanti produttori di contenuti. Qualunque azione sul web diventa informazione e contenuto. La gran parte dei ‘nuovi’ dati prodotti – soprattutto, ma non solo, sul web – sono testi
-
− sono estremamente eterogenei (pagine web personali e aziendali, giornali
on line, articoli scientifici, e-book, cartelle cliniche, trascrizioni di interviste e
focus group, email, forum, relazioni istituzionali, etc.);
− si presentano in vari formati (HTML, PDF, XML, Word, txt, etc.);
− presentano diversi sistemi di codifica dei caratteri (Unicode, ASCII, etc.);
-
− sono dati tipicamente non-strutturati o semi-strutturati, quindi, difficili da
-
-
-
Quali sono le possibili strade metodologiche per analizzare, con tecniche qualitative/quantitative/miste, dati testuali?
Analisi del contenuto (content analysis) → insieme delle procedure di analisi del testo, inteso come ‘atto’ di comunicazione rilevante per i ricercatori in funzione degli
-
-
- Analisi ‘ermeneutica’ del testo → analisi squisitamente qualitativa, attraverso
tecniche di codifica, classificazione, visualizzazione e condivisione di informazioni
- Analisi del contenuto come inchiesta (Losito 2002) → ‘interrogazione’ del testo
attraverso una scheda d’analisi, appositamente progettata, simile ad un
-
Lombardo, Novelli, Ruggero 2019, La società nelle urne. Strategie comunicative,
attori e risultati delle elezioni politiche 2018, FrancoAngeli)
- Analisi automatica dei testi (AAT)
– Analisi statistico-testuale: risponde all’esigenza di affrontare, dal punto di vista analitico, la velocità di produzione di un’ampia mole di dati non strutturati
tecniche, presuppone una non lettura dei testi → analizzare, in una prospettiva qualitativa e quantitativa, i contenuti, le proprietà e le caratteristiche di un testo con procedure automatizzate e semi-automatizzate (non manuali)
L’AAT ha una natura interdisciplinare statistica, information retrieval
-
Come è possibile integrare, in un approccio mixed methods, le tre principali tecniche di analisi del contenuto?
-
deduttivo → «l’esplorazione preliminare con le tecniche di analisi testuale consentirebbe di definire categorie di analisi più aderenti al contenuto effettivo del testo in analisi, integrando il sistema di categorie con le dimensioni emerse dall’analisi testuale e aumentando il grado di validità semantica della scheda di analisi utilizzata» (della Ratta-Rinaldi 2007)
-
induttivo → Analisi del c. come inchiesta, trattando un campione dei
testi, consente di indagare aspetti di interesse specifico del ricercatore
-
-
‘a monte’. Il trattamento e l’analisi automatica dei testi (AAT), a differenza delle altre
linguistica computazionale. Persegue obiettivi e adotta strumenti di tutte queste discipline, fortemente integrate tra loro
L’AAT opera per modelli: ogni modello costituisce una metrica, cioè, una
-
-
• L’approccio statistico consente di analizzare testi di qualsiasi dimensione, anche se dimensioni troppo piccole potrebbero implicare una scarsa robustezza dell’analisi
• L’analisi statistica consente di dare rappresentazioni del testo,
-
-
possibile analizzare corpus multilingue, anche se ciò implica una serie
di problemi/limiti. L’analisi automatica di un corpus di dati testuali, affrontata secondo una logica ‘metrica’, non si identifica con l’approccio quantitativo pur servendosene. Semmai propone un’analisi qualitativa fortemente integrata con una quantitativa, a garanzia della stabilità delle misurazioni. Questa logica propone un trattamento di dati che viene messo in discussione attraverso processi di verifica del risultato delle ricerca sul testo, con correzioni in modalità semi-automatica e con il ricorso a risorse statistico-linguistiche esterne di riferimento (Bolasco 2013)
-
La differenza col campionamento stratificato risiede nella modalità di individuazione delle singole unità statistiche da intervistare. Nel campionamento per quote è il ricercatore a scegliere a sua discrezione i soggetti da intervistare (non sono estratti casualmente)
Pro: Il campione complessivo, limitatamente alle variabili poste alla base delle quote, riproduce la distribuzione della popolazione
-
-
-
-
-
-
lo studio e si calcola la percentuale di popolazione in ciascuno strato; fissato un n campionario, si calcola il numero di casi da selezionare in ogni strato, rispettando le proporzioni della popolazione di riferimento (informazione tratta da altre fonti, ad esempio, un censimento)
Contro: segue criteri utilitaristici di selezione dei casi. Privilegia la selezione dei soggetti più semplici da reperire
-