- Distribuce náhodné proměnné pozorované na např. jedincích ve výběrovém souboru
- Distribuce statistiky teoreticky pozorovatelné na jednotlivých výběrových souborech
Pokud agregujeme náhodnou proměnnou pomocí sumy nebo průměru, potom distribuce této agregující statistiky bude mít tendenci (posilující s rostoucí velikostí výběrového souboru) k normálnímu rozdělení, nehledě na původní distribuci náhodné proměnné.
Předpoklad: Výběrový soubor je velký.
Směrodatnou odchylku distribuce statistiky nazýváme STANDARDNÍ CHYBA (standard error, S.E.)
Dostatečně velké?
Zdroj obrázku statisticsbyjim.com
Je vidět, že červené rozdělení v sobě ještě trochu šikmosti má.
BBC: “Threefold Variation in UK Bowel Cancer Death Rates”
… 9 per 100,000 people in Rossendale in Lancashire to 31 per 100,000 inhabitants of Glasgow City.
Obrázek z Spiegelhalter (2019)
Přerušované čáry zachycují 95% a 99,7% intervaly spolehlivosti pro jednotlivé velikosti územních celků.
Umožňuje nám usuzovat ze vzorku na populaci (podstata inferenční statistiky).
Číslo 95 je zde zcela arbitrární (i když nejčastěji používané). Můžete za něj dosadit libovolné jiné, třeba 89 nebo 97.
Intuitivně: Interval možných populačních parametrů, pro které je naše pozorovaná statistika věrohodným důsledkem. Ovšem při subjektivním určení hranice “věrohodnosti.”
Exaktně: Pokud bychom náš experiment realizovali mnohokrát, konfidenční interval by v daném procentu případu překrýval skutečnou populační hodnotu.
\[ \bar{X} \]
\[ CI(95) = <\bar{X} - 2*SE; \bar{X} + 2*SE > \]
Poloha daného pozorování vyjádřená v počtu směrodatných odchylek od průměru. Má smysl především v kontextu normálního rozdělení.
\[ Zscore = \frac{x_i-\bar{x}}{S_x}, \]
kde \(\bar{X}\) je průměr z výběrového souboru a \(S_x\) je výběrový směrodatná odchylka.
Zdroj obrázku statisticsbyjim.com
Převod z-skóru na pravděpodobnost:
Zdroj obrázku statisticsbyjim.com
Například v Excelu můžete použít funkci norm.dist(), resp. norm.s.dist().
Číslo 95 si libovolně nahraďte jiným procentem.
Spiegelhalter, David. 2019. The Art of Statistics: Learning from Data. UK USA Canada Ireland Australia India New Zealand South Africa: Pelican.