1.MET QUANT. Caratteri e distribuzioni di frequenza
La Statistica analizza in termini quantitativi i fenomeni collettivi (mai del singolo individuo), ovvero quei fenomeni composta da una pluralità di manifestazioni individuali.
Alcuni esempi, il motivo della presenza di turisti in una certa località; il grado di soddisfazione degli utenti di un’azienda rispetto al servizio erogato; il numero di abitanti dei comuni di una certa provincia; il reddito e il consumo delle famiglie italiane;
Essa si divide in
- Statistica descrittiva si pone di descrivere le principali caratteristiche di fenomeni collettivi;
Supponiamo di conoscere tutte le unità statistiche che ci servono
- Statistica inferenziale si pone di stimare quantità incognite e/o testare ipotesi
riguardanti fenomeni collettivi. Non conosciamo tutta la popolazione oggetto del nostro "lavoro". Quindi un campione
UNITA' STATISTICHE : unità elementari che costituiscono l'oggetto di osservazione (o di studio); ex un individuo, una classe, qualunque cosa... . POPOLAZIONE è l'insieme di unità statistiche, che vogliamo studiare omogenee rispetto a una o più caratteristiche.
Sulle unità statistiche andiamo a rilevare dei CARATTERI/ VARIABILI: è una caratteristica misurabile (rilevabile) dell'unità statistica. Ad esempio:
- un certo individuo è una unità statistica;
- la popolazione è tutti gli studenti di un corso di laurea/facoltà ecc.;
- la variabile può essere la media voti/ altezza/ età ecc..
Modalità è il valore che un carattere può assumere su un'unità statistica. Le modalità di un carattere devono essere esaustive, devono rappresentare tutti i possibili modi di manifestarsi del carattere, non sovrapposte, ad ogni unità statistica si può associare una sola modalità.
La modalità (possono essere/devono essere più di due) può essere ad esempio il media voti: 18-30, il valore dell'altezza: tra 140 e 210 cm ecc.
Si può fare una classificazione delle variabili, le variabili/caratteri si suddividono in qualitativa (non numeriche) e quantitativa (numeriche). La differenza sta in come andiamo a definire le sue modalità, dunque per definire come è fatta si guarda non la variabile ma le sue modalità.
Se le modalità sono numeri è allora quantitativa, se invece non sono numeri allora sono qualitativa. Ad esempio il voto ..l'altezza, è un numero...dunque quantitativa, invece la variabile del colore dei capelli, queste modalità sono colori quindi qualitativa.
La variabili qualitative si dividono in: - caratteri sconnessi o nominali: cioè quando una variabile è quantitativa, non numerica, le modalità non si possono ordinare.
Le variabili quantitative si distinguono: variabili discreti, sono finite o infinite numerabili; variabili continui, caratteri le cui modalità scaturiscono da una misurazione, questo insieme può assumere un'infinità non numerabile.
Rettilinei: l’ordine è crescente o discendente. Esempi: titolo di studio, gradi militari, grado di soddisfazione; ciclici: l’ordine è ciclico. Esempi: direzione del vento, stagioni, mesi dell’anno;
Invece le variabile quantitative si dividono in discrete e continui: le modalità di una variabile discreta sono finite o infinite numerabili (esempio numero figli, età ecc.); viceversa le variabili continue si parla di modalità che sono infinità numerabili (peso, altezza temperatura).
Quando si definiscono l'insieme delle modalità, ogni insieme ha la sua cardinalità; il numero degli elementi che compongono l'insieme. Per esempio, variabile voto materia x, ho solo 13 possibili modalità.
Dunque sono caratteri discreti, i caratteri le cui modalità scaturiscono da un conteggio, ovvero l’insieme delle modalità che possono assumere è un’infinità numerabile (le modalità sono finite o infiite numerabile).
Le medie ci danno una tendenza generale, queste non riescono a comunicarci la variabilità. Gli indici di variabilità è descrivere l'eterogeneità della popolazione.
Media aritmetica e geometrica, quest'ultima è più piccola di quella aritmetica.
Moda è la modalità che si presenza più volte, con la maggior frequenza.
click to edit
INDICI, ESEMPIO E PROPRIETA' DI VARIABILITA.
Il primo indice è il campo di variazione, è dato dalla differenza tra la più grande/la più piccola modalità osservata del carattere.
Confrontare la variabilità.
click to edit
Caratteri continui: caratteri le cui modalità scaturiscono da una misurazione, ovvero l’insieme delle modalità che possono assumere è un’infinità non numerabile (le modalità sono dense).
L’insieme di dati (o dataset) è una raccolta di dati statistici relativi a una popolazione, espressa in forma matriciale: unità statistiche per riga, caratteri statistici per colonna. Il numero di unità statistiche in un dataset si dice numerosità e si indica con N.
Per semplicità di gestione, il nome dei caratteri in un dataset viene spesso codificato con un’etichetta alfanumerica, e le modalità dei caratteri vengono spesso codificate con valori numerici. Anche se le loro modalità sono codificate con numeri, i caratteri qualitativi rimangono tali.
Quando analizziamo una certa variabile, analizziamo una certa frequenza: il numero di volte che una certa modalità si presenta. Le frequenze assolute: numero di volte che una certa modalità di un carattere viene osservata nella popolazione. Essa si indica con n (minuscolo).
Frequenza relativa: rappresenta la frazione di unità statistiche che presentano una certa modalità di un carattere. La frequenza relativa si indica con fj e si calcola come rapporto fra le corrispondente frequenza assoluta e la numerosità totale della
popolazione.
fj= nj/N
Frequenza relativa percentuale: Pj = fj · 100
La frequenza cumulata è il cumulo delle frequenze assolute. La frequenza cumulata di una modalità è data dalla somma della frequenza della modalità con quella delle modalità precedenti.
click to edit