Úloha pravděpodobnosti

Standardní normální rozdělení je normální rozdělení se střední hodnotou nula a směrodatnou odchylkou 1. Standardní normální rozdělení má střed v nule a míra odchylky daného měření od střední hodnoty je dána směrodatnou odchylkou. Pro standardní normální rozdělení platí, že 68 % pozorování leží do 1 směrodatné odchylky od průměru, 95 % leží do 2 směrodatných odchylek od průměru a 99,9 % leží do 3 směrodatných odchylek od průměru. Až do této chvíle jsme používali „X“ pro označení proměnné, která nás zajímá (např. X=BMI, X=výška, X=hmotnost). Při použití standardního normálního rozdělení však budeme pro označení proměnné v kontextu standardního normálního rozdělení používat „Z“. Po normalizaci je níže uvedeno, že BMI=30, o kterém jsme hovořili na předchozí straně, leží 0,16667 jednotky nad střední hodnotou 0 na standardním normálním rozdělení vpravo.

====

Protože plocha pod standardní křivkou = 1, můžeme začít přesněji definovat pravděpodobnosti konkrétního pozorování. Pro libovolné dané Z-skóre můžeme vypočítat plochu pod křivkou nalevo od tohoto Z-skóre. Tabulka v rámečku níže ukazuje pravděpodobnosti pro standardní normální rozdělení. Prozkoumejte tabulku a všimněte si, že skóre „Z“ 0,0 uvádí pravděpodobnost 0,50 neboli 50 % a skóre „Z“ 1, což znamená jednu směrodatnou odchylku nad průměrem, uvádí pravděpodobnost 0,8413 neboli 84 %. To proto, že jedna směrodatná odchylka nad a pod průměrem zahrnuje přibližně 68 % plochy, takže jedna směrodatná odchylka nad průměrem představuje polovinu, tedy 34 %. Tedy 50 % pod průměrem plus 34 % nad průměrem nám dává 84 %.

Pravděpodobnosti standardního normálního rozdělení Z

Tato tabulka je uspořádána tak, aby poskytovala plochu pod křivkou vlevo nebo menší než zadaná hodnota neboli „hodnota Z“. V tomto případě, protože průměr je nula a směrodatná odchylka je 1, je hodnota Z počet jednotek směrodatné odchylky od průměru a plocha je pravděpodobnost pozorování hodnoty menší než tato konkrétní hodnota Z. Všimněte si také, že tabulka zobrazuje pravděpodobnosti na dvě desetinná místa Z. Místo jednotek a první desetinné místo jsou uvedeny v levém sloupci a druhé desetinné místo je zobrazeno napříč horním řádkem.

Vraťme se však k otázce týkající se pravděpodobnosti, že BMI je menší než 30, tedy P(X<30). Na tuto otázku můžeme odpovědět pomocí standardního normálního rozdělení. Na obrázcích níže jsou vedle sebe zobrazena rozdělení BMI pro muže ve věku 60 let a standardní normální rozdělení.

Rozdělení BMI a standardní normální rozdělení

====

Plocha pod každou křivkou je jedna, ale měřítko osy X je jiné. Všimněte si však, že plochy nalevo od přerušované čáry jsou stejné. Rozdělení BMI se pohybuje od 11 do 47, zatímco standardizované normální rozdělení Z se pohybuje od -3 do 3. Chceme vypočítat P(X < 30). Za tímto účelem můžeme určit hodnotu Z, která odpovídá X = 30, a poté pomocí výše uvedené tabulky standardního normálního rozdělení zjistit pravděpodobnost nebo plochu pod křivkou. Následující vzorec převádí hodnotu X na skóre Z, které se také nazývá standardizované skóre:

kde μ je průměr a σ je směrodatná odchylka proměnné X.

Pro výpočet P(X < 30) převedeme X=30 na odpovídající Z skóre (tomu se říká standardizace):

Takto: P(X < 30) = P(Z < 0,17). Příslušnou pravděpodobnost pro toto skóre Z pak můžeme vyhledat v tabulce standardního normálního rozdělení, z níž vyplývá, že P(X < 30) = P(Z < 0,17) = 0,5675. Pravděpodobnost, že muž ve věku 60 let má BMI menší než 30, je tedy 56,75 %.

Další příklad

Jaká je pravděpodobnost, že muž ve věku 60 let má BMI větší než 35? Jinými slovy, jaká je pravděpodobnost P(X > 35)? Opět standardizujeme:

Přejdeme nyní do tabulky standardního normálního rozdělení a vyhledáme P(Z>1) a pro Z=1,00 zjistíme, že P(Z<1,00) = 0,8413. Všimněte si však, že tabulka vždy udává pravděpodobnost, že Z je menší než zadaná hodnota, tj. dává nám P(Z<1)=0,8413.

Takže P(Z>1)=1-0,8413=0,1587. Interpretace: Téměř 16 % mužů ve věku 60 let má BMI vyšší než 35.

Kalkulátor normální pravděpodobnosti

Z-skóre s R

Aternativně k vyhledávání normální pravděpodobnosti v tabulce nebo pomocí Excelu můžeme k výpočtu pravděpodobnosti použít R. Například

> pnorm(0)

Z-skóre 0 (střední hodnota libovolného rozdělení) má 50 % plochy vlevo. Jaká je pravděpodobnost, že 60letý muž z výše uvedené populace má BMI menší než 29 (průměr)? Z-skóre by bylo 0 a pnorm(0)=0,5 neboli 50 %.

Jaká je pravděpodobnost, že 60letý muž bude mít BMI menší než 30? Z-skóre bylo 0,16667.

> pnorm(0,16667)

Takže pravděpodobnost je 56,6 %.

Jaká je pravděpodobnost, že 60letý muž bude mít BMI větší než 35?

35-29=6, což je jedna směrodatná odchylka nad průměrem. Můžeme tedy vypočítat oblast vlevo

> pnorm(1)

a výsledek pak odečíst od 1,0.

1-0,8413447= 0,1586553

Takže pravděpodobnost, že 60letý muž bude mít BMI větší než 35, je 15,8 %.

Nebo můžeme použít program R a celou věc vypočítat v jednom kroku takto:

> 1-pnorm(1)

Pravděpodobnost pro rozsah hodnot

Jaká je pravděpodobnost, že muž ve věku 60 let má BMI mezi 30 a 35? Všimněte si, že to je totéž jako otázka, jaký podíl mužů ve věku 60 let má BMI mezi 30 a 35. Konkrétně chceme zjistit P(30 < X < 35)? Předtím jsme vypočítali P(30<X) a P(X<35); jak lze tyto dva výsledky použít k výpočtu pravděpodobnosti, že BMI bude mezi 30 a 35? Pokuste se formulovat a odpovědět sami, než se podíváte na vysvětlení níže.

Odpověď

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.