1.MET QUANT. Caratteri e distribuzioni di frequenza

La Statistica analizza in termini quantitativi i fenomeni collettivi (mai del singolo individuo), ovvero quei fenomeni composta da una pluralità di manifestazioni individuali.

Alcuni esempi, il motivo della presenza di turisti in una certa località; il grado di soddisfazione degli utenti di un’azienda rispetto al servizio erogato; il numero di abitanti dei comuni di una certa provincia; il reddito e il consumo delle famiglie italiane;

Essa si divide in

  • Statistica descrittiva si pone di descrivere le principali caratteristiche di fenomeni collettivi;
    Supponiamo di conoscere tutte le unità statistiche che ci servono
  • Statistica inferenziale si pone di stimare quantità incognite e/o testare ipotesi
    riguardanti fenomeni collettivi. Non conosciamo tutta la popolazione oggetto del nostro "lavoro". Quindi un campione

UNITA' STATISTICHE : unità elementari che costituiscono l'oggetto di osservazione (o di studio); ex un individuo, una classe, qualunque cosa... . POPOLAZIONE è l'insieme di unità statistiche, che vogliamo studiare omogenee rispetto a una o più caratteristiche.

Sulle unità statistiche andiamo a rilevare dei CARATTERI/ VARIABILI: è una caratteristica misurabile (rilevabile) dell'unità statistica. Ad esempio:

  • un certo individuo è una unità statistica;
  • la popolazione è tutti gli studenti di un corso di laurea/facoltà ecc.;
  • la variabile può essere la media voti/ altezza/ età ecc..

Modalità è il valore che un carattere può assumere su un'unità statistica. Le modalità di un carattere devono essere esaustive, devono rappresentare tutti i possibili modi di manifestarsi del carattere, non sovrapposte, ad ogni unità statistica si può associare una sola modalità.

La modalità (possono essere/devono essere più di due) può essere ad esempio il media voti: 18-30, il valore dell'altezza: tra 140 e 210 cm ecc.

Si può fare una classificazione delle variabili, le variabili/caratteri si suddividono in qualitativa (non numeriche) e quantitativa (numeriche). La differenza sta in come andiamo a definire le sue modalità, dunque per definire come è fatta si guarda non la variabile ma le sue modalità.

Se le modalità sono numeri è allora quantitativa, se invece non sono numeri allora sono qualitativa. Ad esempio il voto ..l'altezza, è un numero...dunque quantitativa, invece la variabile del colore dei capelli, queste modalità sono colori quindi qualitativa.

La variabili qualitative si dividono in: - caratteri sconnessi o nominali: cioè quando una variabile è quantitativa, non numerica, le modalità non si possono ordinare.

Le variabili quantitative si distinguono: variabili discreti, sono finite o infinite numerabili; variabili continui, caratteri le cui modalità scaturiscono da una misurazione, questo insieme può assumere un'infinità non numerabile.

Rettilinei: l’ordine è crescente o discendente. Esempi: titolo di studio, gradi militari, grado di soddisfazione; ciclici: l’ordine è ciclico. Esempi: direzione del vento, stagioni, mesi dell’anno;

Invece le variabile quantitative si dividono in discrete e continui: le modalità di una variabile discreta sono finite o infinite numerabili (esempio numero figli, età ecc.); viceversa le variabili continue si parla di modalità che sono infinità numerabili (peso, altezza temperatura).

Quando si definiscono l'insieme delle modalità, ogni insieme ha la sua cardinalità; il numero degli elementi che compongono l'insieme. Per esempio, variabile voto materia x, ho solo 13 possibili modalità.

Dunque sono caratteri discreti, i caratteri le cui modalità scaturiscono da un conteggio, ovvero l’insieme delle modalità che possono assumere è un’infinità numerabile (le modalità sono finite o infiite numerabile).

Le medie ci danno una tendenza generale, queste non riescono a comunicarci la variabilità. Gli indici di variabilità è descrivere l'eterogeneità della popolazione.

Media aritmetica e geometrica, quest'ultima è più piccola di quella aritmetica.

Moda è la modalità che si presenza più volte, con la maggior frequenza.

click to edit

INDICI, ESEMPIO E PROPRIETA' DI VARIABILITA.

Il primo indice è il campo di variazione, è dato dalla differenza tra la più grande/la più piccola modalità osservata del carattere.

Confrontare la variabilità.

click to edit

Caratteri continui: caratteri le cui modalità scaturiscono da una misurazione, ovvero l’insieme delle modalità che possono assumere è un’infinità non numerabile (le modalità sono dense).

L’insieme di dati (o dataset) è una raccolta di dati statistici relativi a una popolazione, espressa in forma matriciale: unità statistiche per riga, caratteri statistici per colonna. Il numero di unità statistiche in un dataset si dice numerosità e si indica con N.


Per semplicità di gestione, il nome dei caratteri in un dataset viene spesso codificato con un’etichetta alfanumerica, e le modalità dei caratteri vengono spesso codificate con valori numerici. Anche se le loro modalità sono codificate con numeri, i caratteri qualitativi rimangono tali.

Quando analizziamo una certa variabile, analizziamo una certa frequenza: il numero di volte che una certa modalità si presenta. Le frequenze assolute: numero di volte che una certa modalità di un carattere viene osservata nella popolazione. Essa si indica con n (minuscolo).

Frequenza relativa: rappresenta la frazione di unità statistiche che presentano una certa modalità di un carattere. La frequenza relativa si indica con fj e si calcola come rapporto fra le corrispondente frequenza assoluta e la numerosità totale della
popolazione
.


fj= nj/N

Frequenza relativa percentuale: Pj = fj · 100

La frequenza cumulata è il cumulo delle frequenze assolute. La frequenza cumulata di una modalità è data dalla somma della frequenza della modalità con quella delle modalità precedenti.

click to edit