O Papel da Probabilidade

A distribuição normal padrão é uma distribuição normal com média zero e desvio padrão de 1. A distribuição normal padrão é centrada em zero e o grau em que uma determinada medida se afasta da média é dado pelo desvio padrão. Para a distribuição normal padrão, 68% das observações estão dentro de 1 desvio padrão da média; 95% estão dentro de 2 desvios padrão da média; e 99,9% estão dentro de 3 desvios padrão da média. Até este ponto, temos usado “X” para denotar a variável de interesse (por exemplo, X=IMC, X=altura, X=peso). No entanto, ao usar uma distribuição normal padrão, usaremos “Z” para nos referirmos a uma variável no contexto de uma distribuição normal padrão. Após a padronização, o IMC=30 discutido na página anterior é mostrado abaixo de 0,16667 unidades acima da média de 0 na distribuição normal padrão à direita.

====

Desde a área sob a curva padrão = 1, podemos começar a definir com mais precisão as probabilidades de observação específica. Para qualquer pontuação Z, podemos calcular a área sob a curva à esquerda dessa pontuação Z. A tabela no quadro abaixo mostra as probabilidades para a distribuição normal padrão. Examine a tabela e note que uma pontuação “Z” de 0,0 lista uma probabilidade de 0,50 ou 50%, e uma pontuação “Z” de 1, significando um desvio padrão acima da média, lista uma probabilidade de 0,8413 ou 84%. Isso porque um desvio padrão acima e abaixo da média abrange cerca de 68% da área, portanto um desvio padrão acima da média representa metade do de 34%. Assim, os 50% abaixo da média mais os 34% acima da média nos dá 84%.

Probabilidades da Distribuição Normal Padrão Z

Esta tabela é organizada para fornecer a área sob a curva à esquerda ou menos de um valor especificado ou “valor Z”. Neste caso, como a média é zero e o desvio padrão é 1, o valor Z é o número de unidades de desvio padrão longe da média, e a área é a probabilidade de observar um valor menor do que esse valor Z em particular. Observe também que a tabela mostra probabilidades a duas casas decimais de Z. As unidades decimais e a primeira casa decimal são mostradas na coluna da esquerda, e a segunda casa decimal é mostrada na linha superior.

Mas voltemos à questão sobre a probabilidade de o IMC ser inferior a 30, ou seja, P(X<30). Podemos responder a esta pergunta usando a distribuição normal. As figuras abaixo mostram as distribuições do IMC para homens com 60 anos de idade e a distribuição normal padrão, lado a lado.

Distribuição do IMC e Distribuição Normal Padrão

====

A área sob cada curva é uma, mas a escala do eixo X é diferente. Note, contudo, que as áreas à esquerda da linha tracejada são as mesmas. A distribuição do IMC varia de 11 a 47, enquanto que a distribuição normal padronizada, Z, varia de -3 a 3. Queremos calcular P(X <30). Para isso podemos determinar o valor Z que corresponde a X = 30 e depois usar a tabela de distribuição normal padronizada acima para encontrar a probabilidade ou área sob a curva. A seguinte fórmula converte um valor X em um escore Z, também chamado de escore padronizado:

onde μ é a média e σ é o desvio padrão da variável X.

Para calcular P(X < 30) convertemos o X=30 para a sua pontuação Z correspondente (isto é chamado de padronização):

Thus, P(X < 30) = P(Z < 0,17). Podemos então procurar a probabilidade correspondente para esta pontuação Z na tabela de distribuição normal padrão, que mostra que P(X < 30) = P(Z < 0,17) = 0,5675. Assim, a probabilidade de um homem de 60 anos ter IMC inferior a 30 é 56,75%.

Outro Exemplo

Usando a mesma distribuição para o IMC, qual é a probabilidade de um homem de 60 anos ter IMC superior a 35? Em outras palavras, o que é P(X > 35)? Novamente padronizamos:

Vamos agora para a tabela de distribuição normal para procurar P(Z>1) e para Z=1,00 encontramos que P(Z<1,00) = 0,8413. Note, porém, que a tabela sempre dá a probabilidade de que Z seja menor que o valor especificado, ou seja, nos dá P(Z<1)=0,8413.

Então, P(Z>1)=1-0,8413=0,1587. Interpretação: Quase 16% dos homens com 60 anos têm IMC acima de 35,

Calculadora de Probabilidade Normal

Z-Scores com R

Como alternativa à procura de probabilidades normais na tabela ou usando Excel, podemos usar R para computar as probabilidades. Por exemplo,

> pnorm(0)

A Z-score de 0 (a média de qualquer distribuição) tem 50% da área à esquerda. Qual é a probabilidade de um homem de 60 anos na população acima ter um IMC inferior a 29 (a média)? O Z-score seria 0, e pnorm(0)=0,5 ou 50%.

Qual a probabilidade de um homem de 60 anos ter um IMC inferior a 30? A pontuação Z foi 0,16667.

> pnorm(0,16667)

Então, a probabilidade é 56,6%.

Qual é a probabilidade de um homem de 60 anos ter um IMC maior que 35?

35-29=6, o que é um desvio padrão acima da média. Assim podemos calcular a área à esquerda

> pnorm(1)

e depois subtrair o resultado de 1,0,

1-0,8413447= 0,1586553

Então a probabilidade de um homem de 60 anos ter um IMC superior a 35 é de 15,8%.

Or, podemos usar R para calcular tudo num único passo:

> 1-pnorm(1)

Probabilidade para um intervalo de valores

Qual é a probabilidade de um homem de 60 anos ter um IMC entre 30 e 35? Note que isto é o mesmo que perguntar qual a proporção de homens com 60 anos de idade que tem IMC entre 30 e 35. Especificamente, nós queremos P(30 < X < 35)? Calculámos anteriormente P(30<X) e P(X<35); como podem estes dois resultados ser utilizados para calcular a probabilidade de o IMC estar entre os 30 e os 35? Tente formular e responder por si mesmo antes de olhar para a explicação abaixo.

Resposta

Deixe uma resposta

O seu endereço de email não será publicado.