Processing math: 71%

Pravděpodobnost

Statistika 1, Katedra sociologie Filozofické fakulty UK

Jaromír Mazák

Proč ve statistice potřebujeme pravděpodobnost?

Klasická inferenční statistika funguje asi takto:

  • udělám předpoklad o světě (vytvořím model světa)
  • seberu data
  • ptám se, jak překvapivá jsou tato data za předpokladu modelu
  • pokud jsou velmi překvapivá (nepravděpodobná) odmítnu původní model

Teorie pravděpodobnosti nás učí formálně vyhodnocovat (ne)překvapivost pozorovaných dat.

Motivační příklad

Existuje rozdíl ve výšce žen a mužů?

Model světa: neexistuje

Seberu data:

  • ženy: 166, 175, 164, 171
  • muži: 180, 172, 175, 186

Jaká je pravděpodobnost, že bychom dostali takto nebo více extrémní rozdíl mezi výškou žen a mužů, pokud by skutečný rozdíl v populaci byl 0?

Motivační příklad - rozuzlení

Data:

  • ženy: 166, 175, 164, 171
  • muži: 180, 172, 175, 186

Pravděpodobnost (za určitých předpokladů):

## [1] 0.059

Axiomy teorie pravděpodobnosti

Axiomy teorie pravděpodobnosti

  1. Pr(z)>=0, kde z značí nějakou událost
  2. Pr(samplespace)=1
  3. Pokud zi, …, zk jsou vzájemně se vylučující jevy: Pr(zi...zk)=Pr(zi)+...+Pr(zk)

Z těchto axiomů lze odvodit další užitečná pravidla, například:

  • Pravidlo doplňku: Pr(z)=1Pr(!z), kde vykřičník značí negaci
  • Mlutiplikační pravidlo: Pravděpodobnost, že najednou nastanou vzájemně nezávislé jevy, se rovná součinu jejich individuálních pravděpodobností

Dva přístupy k pravděpodobnosti

  • Analytický přístup
  • Simulační přístup

Funkce rozdělení pravděpodobnosti (Probability distribution functions)

Funkce rozdělení pravděpodobnosti (Probability distribution functions)

Jsou dvě:

  • Hustota pravděpodobnosti (probability density function, PDF)
  • Kumulativní distribuce (cumulative distribution function, CDF)

Zdroj graduatetutor.com

Hustota pravděpodobnosti (probability density function, PDF)

Značení … budeme rozlišovat Pr ve smyslu pravděpodobnost, že proměnná bude nabývat určité hodnoty, a P ve smyslu funkce hustoty pravděpodobnosti pro celé spektrum možných hodnot proměnné.

P(y) … funkce hustoty pravděpodobnosti proměnné y

Pr(y=4) … pravděpodobnost, že na kostce padne 4

Počítání pravděpodobnosti na základě PDF

  • Hod kostkou, Pr(y=3)?
  • Hod kostkou, Pr(y!=3)?
  • Hod kostkou, Pr(y>=3)?
  • Dva hody kostkou, Pr(y1>=3&y2=6)?

Vybraná užitečná rozdělení pravděpodobnosti (užitečné modely světa)

Ideální rozdělení č. 1: Rovnoměrné (uniformní)

  • Všechny hodnoty mají stejnou pravděpodobnost výskytu
  • Hod kostkou, tahání karty z balíčku, tahání tomboly … možná datum narození?

Pravděpodobnost diskrétních a spojitých proměnných

  • Pro diskrétní proměnné: PDF:

forallyP(y)=1

  • Pro diskrétní proměnné: PDF:

+f(y)dy=1

Diskrétní rovnoměrnéDiskrétní rovnoměrné

Diskrétní rovnoměrné

Spojité rovnoměrnéSpojité rovnoměrné

Spojité rovnoměrné

Zdroj obrázků spojité a Zdroj obrázků diskrétní

Diskrétní rovnoměrné rozdělení - průměr a rozptyl

  • a … minimum
  • b … maximum
  • n … počet možných hodnot

Průměr=(a+b)/2

Rozptyl=(n21)/12

Diskrétní rovnoměrnéDiskrétní rovnoměrné

Diskrétní rovnoměrné

Spojité rovnoměrné rozdělení - průměr a rozptyl, nadstavba

  • a … minimum
  • b … maximum

Průměr=(a+b)/2

Rozptyl=(ba)2/12

Diskrétní rovnoměrnéDiskrétní rovnoměrné

Diskrétní rovnoměrné

Ideální rozdělení č. 2: Normální (Gaussovo)

  • Tzv. zvonová křivka
  • Střední a prostřední hodnoty jsou časté. Čím extrémnější hodnoty, tím méně časté
  • Je na obrázku PDF, nebo CDF?

Normální rozdělení: PDF a CDF

Zdroj Wikipedie

  • Všimněte si: čím vyšší je PDF, tím strmější je CDF (obecná vlastnost funkcí rozdělení pravděpodobnosti, nejen pro normální rozdělení)

Normální rozdělení - formální definice PDF (nadstavba)

Vypadá to děsivě, ale pí a eulerovo číslo jsou konstanty, x zastuje hodnoty proměnné, takže jediné, co vám stačí, je μ a σ, tedy průměr a směrodatná odchylka.

Jinými slovy: normální rozdělení je plně efinováno dvěma parametry: průměrem a směrodatnou odchylkou.

Standardní normální rozdělení a jeho vlastnosti

Zdroj Wikipedia

Pravidlo tří sigma (68-95-99,7)

Různá normální rozdělení

Převzato z Wikipedie)

  • Mezi jaké hodnoty spadá prostředních 68 % červeného rozdělení?
  • Kolik procent pozorování červeného rozdělení spadá mezi hodnoty -2 a 1?
  • Kolik procent pozorování červeného rozdělení spadá mezi hodnoty -3 a 0?

Jak vzniká normální rozdělení? Vytvoření intuice

Typicky v důsledku mnoha malých vlivů. Působení těchto vlivů se častěji “vykrátí” (některé přidávají, jiné ubírají).

Alternativní (Bernoulliho) rozdělení

  • Rozdělení náhodné proměnné, která může nabývat pouze 1, nebo 0
  • Pr(y=1) značíme p
  • Pr(y=0) značíme 1p nebo q
  • m=p
  • var=pq

Kontrolní otázky:

  • Kolik vstupních údajů plně definuje alternativní rozdělení?
  • Jak by vypadala funkce hustoty spojitého alternativního rozdělení?

Zdroj Wikipedia

Binomické rozdělení (také Bernoulliho schéma)

  • Popisuje výskyt jevu v n nezávislých pokusech, z nichž každý má stejnou pravděpodobnost úspěchu
  • Plně definováno dvěma údaji:
    • n, počet pokusů
    • p, pravděpodobnost úspěchu
  • m=np
  • var=npq

Zdroj Wikipedia

Počítání s binomickým rozdělením

P(k) = P(X = k) = {n \choose k} p^k(1-p)^{n-k}

kde:

{n \choose k} = \frac{n!}{k!(n-k)!}

Příklad: Přechod na trvalou hybridní výuku?

  • X … proměnná, zda příznivec hybridní výuky (1), nebo ne (0)
  • Pr(X=příznivec) = p_X
  • Počet náhodně vybraných respondentů n = 10
  • Y … počet příznivců v našem vzorku (teoreticky od 0 do 10)

Otázky:

  • Jaké rozdělení má proměnná X? Co proměnná Y?
  • Pr(Y=0), když p_X = 0.2
  • Pr(Y=1), když p_X = 0.2
  • Pr(Y>=2), když p_X = 0.2
  • E(Y)?, když p_X = 0.2
  • E(Y)?, když p_X = 0.5
  • Var(Y)?, když p_X = 0.4
  • Které stavy byste označili za běžné a které za extrémní?
  • Pokud byste předpokládali p_X = 0.2, je 8 příznivců hybridní výuku extrémní stav, který by zpochybnil Vás předpoklad?
  • Jak se výsledky změní, pokud n = 1000? Jak se změní tvar rozdělení?

Změna tvaru binomického rozdělení při růstu n

Vyčíslení pravděpodobností v softwaru

Pravděpodobnost, že z 10 hodů mincí padne 4 nebo 5 orlů.

sum(dbinom(4:5, 10, 0.5))
## [1] 0.4511719

Zkuste si doma ověřit výsledky pomocí funkce binom.dist v MS Excel.

Proč se vůbec věnujeme teorii pravděpodobnosti?

Proč ke statistice potřebujeme pravdědpodobnost?

Statistika nám pomáhá určit, jak (ne)pravděpodobná jsou určitá data za předpokladu určitého modelu.