7. Statistika
Popisná statistika
Střední hodnota E(X)
Medián
Rozptyl D(X)
Korelace ϱ(x, y)
Odhady statistik a jejich spolehlivost
Distribuční fce F(x)
Rozdělení náhodných veličin
Příklady
zpracování číselných dat o nějakém souboru objektů + jejich reprezentace
popis vlastností sbírky dat. stavu či vývoje hromadných jevů
pomocí čísel/obrazců vystihuje info o datech
- vymezení souboru prvků
- vyšetření z hlediska studovaného jevu
- výsledky vyjádří číselným popisem + vytvoří obraz jevu vzhledem k souboru
statistický soubor
stat. jednotky
stat. znaky
identifikační znaky
parametr rozdělení náhodné veličiny
náhodná veličina
vážený průměr daného rozdělení
rovnoměrné rozdělení --> ar. průměr
stř. hodnota diskr. náhodné veličiny X s prstní fcí p(x)
SUM(od 1 po n) xi *
P(xi)
spojitá
sčítám prsti násobené hodnotami
hodnota, dělí seřazenou řadu na 2 stejné pol.
+
extrémy nevadí, nemusí být soubor čísel (pouze usp.)
sudý počet --> ar. průměr prostř. 2
50 kvantil
-
ne: pouze 2 hodnoty znaku
jak moc jsou hodnoty ve stat. souboru rozptýleny (vzdálené od stř. hodnoty)
směrodatná odchylka s = odmocnina rozptylu
D(X) = E(X^2) - (E(X))^2 = s^2 = 1/n SUM(od 1 po n) (xi - x̄)^2
vyšší proměnlivost, vyšší rozptyl
--> průměr druhých mocnin vzdáleností od x̄ (průměru) (průměrná odchylka)
míra závislosti 2 znaků X a Y
vzájemný vztah mezi 2 procesy/veličinami
pokud se 1 mění, mění se i 2.
její míru vyjadřuje korel. koeficient <-1, 1>
-1... nepříznivá závislost
1... přímá závislost
0... nekorelují, nezávislé (nelze zjistit lin. záv.)
čím blíže +/-1, tím více lin. závislé
odhad parametru
bodové odhady
intervalové odhady
náhodný výběr
nestrannost (nezkreslenost)
konzistence
vydatnost
interval spolehlivosti
náhodná veličina x
diskrétní
spojitá
diskrétní rozdělení
alternativní A(p)
rovnoměrné R(n)
binomické Bi(n, p)
poissonovo Po(λ)
spojité rozdělení
rovnoměrné R(a, b)
normální (Gaussovo) N(µ, σ^2)
exponenxiální exp(λ)
hodnota (bod, int.) + přesnost (int.)
odhadem je hodnota
odhadem je interval, který s velkou prstí obs, danou hodnotu
délka int. vypovídá o přesnosti
bez přesnosti
př.: bodový odhad stř. hodnoty, rozptylu,...
výběrová chyba (odlišnost parametru od odhadu)
parametr zákl. souboru aproximujeme 1 číslem
parametr aprox. intervalem, kde s velkou prstí parametr leží
meze
koeficient α = hladina významnosti
v praxi α = 0,05 nebo 0,01
<td, th>, parametr v něm leží s předem danou prstí 1-α
kratší --> přesnější odhad
= fce rozdělení (prsti), která udává pravděpodobnost, že hodnota náhodné veličiny X bude <= zadané hodnotě x
popis rozdělení
tabulka
prst. fce
distr. fce
F(x) = P(X <= x) ...(X - náh. veličina, x - reál. číslo)
prst, že výsledek bude <= x
spojitá zprava
neklesající
hodnoty v <0, 1>
pravd. fce
pi = P(X = xi)
každé možnosti výsl. náh. veličiny přiřazuje danou prst
reálná fce def. na množ. všech elem. jevů, která každému přiřadí reálné číslo
popis rozdělení
hustotou f(x)
distr. fcí F(x)
náhodné veličiny s 2 možnými výsledky
prst jednoho je p, druhého 1-p
spec. případ binom. rozdělení (pro n=1), A(p) odp. Bi(1, p)
př.: hod mincí
obor hodnot M={0, 1} ... neúspěch/úspěch
p(x) = 1-p (x=0) | p (x=1) | 0 (jinak)
n možných výsledků a všechny jsou stejně pravděpod.
pi = 1/n
př.: hod kostkou
n-krát nezávisle opakovaný pokus popsaný alter. rozd.
náhodná vel. měří počet úspěchů
p(x) = (n nad x)*
p^x*
(1-p) ^(n-x) (pro x=0,...,n) | 0 (jinde)
př.: n vrhů kostky, nějaké číslo padne x-krát
prst počtu nastoupení sledovaného jevu v určitém čas. intervalu
λ... stř. hodnota i rozptyl
př.: počet úhozů/interval
geometrické Ge(p)
počet úspěchů před 1. neúspěchem
pokusy nezávislé + konst. prst. úspěchu p
př.: mince - orel v 5. hodu
všechny jevy = prst.
na intervalu (a, b) konstantní hustota
f(x) = 1/(b-a) (pro x z <a, b>) | 0 (jinde)
př.: doba čekání v MDH, int. 8 min
popis hustotou fce f(x)
popis prstní fcí p(x)
nejdůležitější spojité
hustota prsti symetrická podle x = µ
tvar závisí na σ
u jevů, jejichž promněnlivost je způsobena velkým množstvím nez. veličin
σ ... směrodaná odchylka
µ... stř. hodnota
platnost centrální lim. věty - součet nez. náh. veličin má cca normální rozdělení
použ. v aplikacích, které interpret. náh. výsledky jako aditivní výsl. mnoha nez. jevů - vnáší náhodné chyby
př.: výška lidí v populaci
čas mezi náhodně se vyskytujícími událostmi
λ > 0
př.: doba mezi poruchami přístroje (poue náhoda, ne opotř.)
dostaví se se stejnou šancí v každém okamžiku bez ohledu na doposud pročekanou dobu
znaky
kvantitativní/kvalitativní
spojité/diskrétní
ordinální/nominální
reálná fce def. na množině všech elem. jevů, která každému jevu přiřadí reálné číslo
diskrétní
spojité
= pravidlo, které přiřazuje prsti událostem/tvrzením
degenerované
hustota prsti f(x)
F"(x) = f(x)
modus = nejčastější hodnota