7. Statistika

Popisná statistika

Střední hodnota E(X)

Medián

Rozptyl D(X)

Korelace ϱ(x, y)

Odhady statistik a jejich spolehlivost

Distribuční fce F(x)

Rozdělení náhodných veličin

Příklady

zpracování číselných dat o nějakém souboru objektů + jejich reprezentace

popis vlastností sbírky dat. stavu či vývoje hromadných jevů

pomocí čísel/obrazců vystihuje info o datech

  1. vymezení souboru prvků
  1. vyšetření z hlediska studovaného jevu
  1. výsledky vyjádří číselným popisem + vytvoří obraz jevu vzhledem k souboru

statistický soubor

stat. jednotky

stat. znaky

identifikační znaky

parametr rozdělení náhodné veličiny

náhodná veličina

vážený průměr daného rozdělení

rovnoměrné rozdělení --> ar. průměr

stř. hodnota diskr. náhodné veličiny X s prstní fcí p(x)

SUM(od 1 po n) xi * P(xi)

spojitá

sčítám prsti násobené hodnotami

hodnota, dělí seřazenou řadu na 2 stejné pol.

+ extrémy nevadí, nemusí být soubor čísel (pouze usp.)

sudý počet --> ar. průměr prostř. 2

50 kvantil

- ne: pouze 2 hodnoty znaku

jak moc jsou hodnoty ve stat. souboru rozptýleny (vzdálené od stř. hodnoty)

směrodatná odchylka s = odmocnina rozptylu

D(X) = E(X^2) - (E(X))^2 = s^2 = 1/n SUM(od 1 po n) (xi - x̄)^2

vyšší proměnlivost, vyšší rozptyl

--> průměr druhých mocnin vzdáleností od x̄ (průměru) (průměrná odchylka)

míra závislosti 2 znaků X a Y

vzájemný vztah mezi 2 procesy/veličinami

pokud se 1 mění, mění se i 2.

její míru vyjadřuje korel. koeficient <-1, 1>

-1... nepříznivá závislost

1... přímá závislost

0... nekorelují, nezávislé (nelze zjistit lin. záv.)

čím blíže +/-1, tím více lin. závislé

odhad parametru

bodové odhady

intervalové odhady

náhodný výběr

nestrannost (nezkreslenost)

konzistence

vydatnost

interval spolehlivosti

náhodná veličina x

diskrétní

spojitá

diskrétní rozdělení

alternativní A(p)

rovnoměrné R(n)

binomické Bi(n, p)

poissonovo Po(λ)

spojité rozdělení

rovnoměrné R(a, b)

normální (Gaussovo) N(µ, σ^2)

exponenxiální exp(λ)

hodnota (bod, int.) + přesnost (int.)

odhadem je hodnota

odhadem je interval, který s velkou prstí obs, danou hodnotu

délka int. vypovídá o přesnosti

bez přesnosti

př.: bodový odhad stř. hodnoty, rozptylu,...

výběrová chyba (odlišnost parametru od odhadu)

parametr zákl. souboru aproximujeme 1 číslem

parametr aprox. intervalem, kde s velkou prstí parametr leží

meze

koeficient α = hladina významnosti

v praxi α = 0,05 nebo 0,01

<td, th>, parametr v něm leží s předem danou prstí 1-α

kratší --> přesnější odhad

= fce rozdělení (prsti), která udává pravděpodobnost, že hodnota náhodné veličiny X bude <= zadané hodnotě x

popis rozdělení

tabulka

prst. fce

distr. fce

F(x) = P(X <= x) ...(X - náh. veličina, x - reál. číslo)

prst, že výsledek bude <= x

spojitá zprava

neklesající

hodnoty v <0, 1>

pravd. fce

pi = P(X = xi)

každé možnosti výsl. náh. veličiny přiřazuje danou prst

reálná fce def. na množ. všech elem. jevů, která každému přiřadí reálné číslo

popis rozdělení

hustotou f(x)

distr. fcí F(x)

náhodné veličiny s 2 možnými výsledky

prst jednoho je p, druhého 1-p

spec. případ binom. rozdělení (pro n=1), A(p) odp. Bi(1, p)

př.: hod mincí

obor hodnot M={0, 1} ... neúspěch/úspěch

p(x) = 1-p (x=0) | p (x=1) | 0 (jinak)

n možných výsledků a všechny jsou stejně pravděpod.

pi = 1/n

př.: hod kostkou

n-krát nezávisle opakovaný pokus popsaný alter. rozd.

náhodná vel. měří počet úspěchů

p(x) = (n nad x)*p^x*(1-p) ^(n-x) (pro x=0,...,n) | 0 (jinde)

př.: n vrhů kostky, nějaké číslo padne x-krát

prst počtu nastoupení sledovaného jevu v určitém čas. intervalu

λ... stř. hodnota i rozptyl

př.: počet úhozů/interval

geometrické Ge(p)

počet úspěchů před 1. neúspěchem

pokusy nezávislé + konst. prst. úspěchu p

př.: mince - orel v 5. hodu

všechny jevy = prst.

na intervalu (a, b) konstantní hustota

f(x) = 1/(b-a) (pro x z <a, b>) | 0 (jinde)

př.: doba čekání v MDH, int. 8 min

popis hustotou fce f(x)

popis prstní fcí p(x)

nejdůležitější spojité

hustota prsti symetrická podle x = µ

tvar závisí na σ

u jevů, jejichž promněnlivost je způsobena velkým množstvím nez. veličin

σ ... směrodaná odchylka

µ... stř. hodnota

platnost centrální lim. věty - součet nez. náh. veličin má cca normální rozdělení

použ. v aplikacích, které interpret. náh. výsledky jako aditivní výsl. mnoha nez. jevů - vnáší náhodné chyby

př.: výška lidí v populaci

čas mezi náhodně se vyskytujícími událostmi

λ > 0

př.: doba mezi poruchami přístroje (poue náhoda, ne opotř.)

dostaví se se stejnou šancí v každém okamžiku bez ohledu na doposud pročekanou dobu

znaky

kvantitativní/kvalitativní

spojité/diskrétní

ordinální/nominální

reálná fce def. na množině všech elem. jevů, která každému jevu přiřadí reálné číslo

diskrétní

spojité

= pravidlo, které přiřazuje prsti událostem/tvrzením

degenerované

hustota prsti f(x)

F"(x) = f(x)

modus = nejčastější hodnota