sábado, 23 de maio de 2009

Distribuição Normal

Autores: Saul, Jeane, Núbia, Beatriz, Marcelo

INTRODUÇÃO
A Distribuição Normal é uma das mais importantes distribuições da estatística, conhecida também como Distribuição de Gauss ou Gaussiana, Sem dúvida já conhecida de alguns leitores como a “curva em forma de sinto”. Foi desenvolvida pelo matemático francês Abraham de Moivre. O estudo do problema dos erros de medida levou à introdução da curva que, mais tarde, recebeu o nome de curva normal.
Além de descrever uma série de fenômenos físicos e financeiros, possui grande uso na estatística inferencial. É inteiramente descrita por seus parâmetros de Média e Desvio Padrão
ou seja, conhecendo-se estes consegue-se determinar qualquer probabilidade em uma Normal.

As principais características da distribuição normal são:
1. A média da distribuição é µ
2. O desvio-padrão é σ
3. A moda ocorre em x=µ
4. A curva é simétrica em relação a um eixo vertical passado por x=µ

APLICAÇÃO
Um interessante uso da Distribuição Normal é que ela serve de aproximação para o cálculo de outras distribuições quando o número de observações fica grande. Essa importante propriedade provem do Teorema Central do Limite que diz que "toda soma de variáveis aleatórias independentes de média finita e variância limitada é aproximadamente Normal, desde que o número de termos da soma seja suficientemente grande" (ver o teorema para um enunciado mais preciso).
EXEMPLOS
Um exemplo bastante próximo de todos sobre como a curva de distribuição normal ajuda a definir padrões esperados é a pressão arterial. Quando o médico infla a almofada em nosso braço, lê o manômetro e nos informa que o resultado é 12 por 8, nos sentimos aliviados.Alguém já se perguntou, porém, por que 12/8 e não qualquer outro resultado é considerado padrão de normalidade deste parâmetro médico?

A resposta é simples: as curvas de distribuição normal para a pressão arterial sistólica e diastólica tendem a concentrar seus resultados em torno de 120 e 80 mmHg, respectivamente.
Outras aplicabilidade da Distribuição Normal
1. A vida média de certo aparelho é de 8 anos,com d.p. de 1,8 ano. O fabricante substitui os aparelhos que causam defeito dentro do prazo de garantia.Se ele deseja substituir no máximo 5% dos aparelhos que apresentem defeito,qual deve ser o prazo de garantia?
Solução: a condição do problema é que, de todos os aparelhos defeituosos, apenas 5 % tenham apresentado defeito dentro o prazo de garantia. Se esse prazo é de x anos a contar da data da compra, 5% das incidências de defeito devem ocorrer em um prazo menor do que x. Ora, a probabilidade 0,05 corresponde ao valor z= -1,645.
Então, o prazo de garantia x se obtém como se segue:

2. Uma empresa usa anualmente milhares de lâmpadas elétricas que permanecem acesas continuamente, dia e noite. A vida de uma lâmpada pode ser considerada uma v.a. normal,com média de 50 dias e d.p. de 15 dias.Em 1º de janeiro,a companhia instalou 8.000 lâmpadas novas. Aproximadamente quantas deverão ser substituídas até 1º de fevereiro?
Solução: Para determinar quantas lâmpadas deverá ser substituídas até 1º de fevereiro,devemos calcular P(X≤31):

P(X≤31)=P(Z≤-1,27)=0,1020.
Deverão ser substituídas (0 ,1020). (8.000)=816 lâmpadas,aproximadamente.

_______________________________________________________

terça-feira, 12 de maio de 2009

Distribuição Binomial

Autores: Adilson, Janaina, Roberta, Carlos Castelo, Landsteiner









Definições:
A distribuição binomial verifica as seguintes condições:1. A experiência tem um nº fixo de provas, n.2. As provas são independentes. (O resultado de uma prova não afecta probabilidade de ocorrência das restantes.)3. Cada prova origina um de dois resultados possíveis: sucesso ou fracasso.4. A probabilidade de sucesso, denotada por p, é constante em cada prova.
Notação para a Distribuição Binomial

n denota o nº de provas (valor fixo à partida).
x denota um nº específico de sucessos em n provas, logo x pode ser qualquer nº entre 0 e n, inclusive.
p denota a probabilidade de sucesso em cada uma das n provas.
q denota a probabilidade de insucesso em cada uma das n provas.
P(x) denota a probabilidade de obter exactamente xsucessos em n provas (P(x)=P(X=x)).

Fórmulas da Probabilidade na Distribuição Binomial

P(X=x)= [n!/x!(n-x)!].p^x.q^(n-x) para x = 0, 1, 2, . . ., n ou



onde:

n = nº de provas

x = nº de sucessos nas n provas

p = probabilidade de sucesso em cada prova

q = probabilidade de insucesso em cada prova (q = 1 – p)

Média μ = n • p

Variância s^2 = n • p • (1-p)
Desvio Padrão s = n • p • (1-p) (raíz quadrada)

onde:

n = nº de provas

p = probabilidade de sucesso em cada uma das n provas

q = probabilidade de insucesso em cada uma das n provas

Utilização
A distribuição poderá ser empregada na determinação da probabilidade quando no evento especificado se deseja calcular a probabilidade de uma acontecimento composto estabelecido por vários eventos. Neste caso, os eventos que constituem o acontecimento devem ser independentes e a ordem dos eventos, dentro do acontecimento, não influencia o cálculo da probabilidade. Em muitas outra situações é necessário a reposição dos dados, para que se possa usar a distribuição binomial ou multinomial.
Conceito

Entende-se por distribuição binomial como sendo aquela em que os termos da expansão do binômio (ou multinômio) correspondem às probabilidades de todos os eventos possíveis do espaço amostral. O binômio (ou multinômio) é formado pelas probabilidades de cada acontecimento elevado ao número total de ocorrências.

Ilustração:
Por exemplo: temos um escritório de contabilidade para exemplificar será considerado o exemplo de conquista de novos clientes, considerando três conquistas. A probabilidade de sair um cliente péssimo(em situação financeira)é igual a S (S = ¾) e a probabilidade de encontrar um cliente ótimo( em situação financeira) é igual a C (C = ¼). Assim, tem-se as seguintes situações;
















A seqüência O³ + 3O²P + 3OP² + P³ tem dois significados:
a) Cada elemento corresponde a uma probabilidade de um evento do espaço amostral. Sendo probabilidade, se verifica:


O³ + 3O²P + 3OP² + P³ = 1


b) Corresponde a expansão do binômio:


(O + P)³ = O³ + 3O²P + 3OP² + P³ = 1



Considere um experimento realizado vezes, sob as mesmas condições, com as seguintes características:


1. Cada repetição do experimento (ou ensaio) produz um de dois resultados possíveis, denominados tecnicamente por sucesso (S) ou fracasso (F), ie os resultados são dicotômicos.

2. A probabilidade de sucesso, P(S)=p , é a mesma em cada repetição do experimento. (Note que P(F)=1-p ).

3. Os ensaios são independentes, ie o resultado de um ensaio não interfere no resultado do outro.


As quantidades n e p são os parâmetros da distribuição binomial. O número total de sucessos é X uma variável aleatória com distribuição binomial com parâmetros n e p e é por denotada X~B(n,p) .


A probabilidade de X=x , pode ser encontrada como:






A média de um variável aleatória binomial é np e a variância é np(1-p) .


Para melhor entendimento considere o seguinte exemplo:


Suponha que num pedigree humano envolvendo albinismo (o qual é recessivo), nós encontremos um casamento no qual sabe-se que ambos os parceiros são heterozigotos para o gene albino. De acordo com a teoria Mendeliana, a probabilidade de que um filho desse casal seja albino é um quarto. (Então a probabilidade de não ser albino é 3/4)

Agora considere o mesmo casal com 2 crianças. A chance de que ambas sejam albinas é:








Da mesma forma, a chance de ambas serem normais é :







Portanto, a probabilidade de que somente uma seja um albina deve ser:






Alternativamente, poderiamos ter usado a formula acima definindo como variável aleatória X o número de crianças albinas, com n=2, p=1/4 e estariamos interessados em P(X=1)

Se agora considerarmos a família com n=5 crianças, as probabilidades de existam x=0,1,2...,5 crianças albinas, em que a probabilidade de albinismo é p=1/4 , são dadas por








as quais ficam como segue:
















O número esperado (ou média) de crianças albinas em famílias com 5 crianças para casais heterozigotos para o gene albino é








quarta-feira, 6 de maio de 2009

Distribuição de Frequência usando o Excel

Autores: Luciano, Cristiano, Edney, Renne, Jairo

DISTRIBUIÇÃO DE FREQUÊNCIA USANDO EXCEL


Conceito


A distribuição de frenquência é o número de repetições de um determinado valor de uma variável. Sendo uma função formada pelos valores da variável e suas respectivas frenquências.
Usando o Excel para se trabalhar com estatística, ensina e explica as análises dos resultados através de exemplos resolvidos com os tradicionais cálculos e o Excel.
A utilização do Excel facilita, reduz os cálculos e também realiza resultados exatos.

Exemplo

O gerente do departamento de uma empresa de comércio de roupas, quer analisar o número diário de vendas realizadas nos últimos dois anos por um vendedor de sua empresa. Na tabela a seguir, foi registrada uma amostra probabilística simples de tamanho 26 e extraída das vendas realizadas pelo vendedor B nos ultimos dois anos.





Aplicação

Veja a seguir, como construir a tabela de frequência de número de vendas realizadas por dia pelo vendedor B utilizando a função FRENQUÊNCIA do Excel.

A amostra do número de vendas realizadas por dia foi registrada no intervalo B4:B29 da planilha Função Frenquência. Para a construção da tabela de frequência, serão utilizados os valores do número de vendas realizadas por dia em ordem crescente: 11,12,13,14,15,16 e 17.
Esses valores foram registrados no intervalo D4:D10. Nas descrição, foi visto que função FRENQUÊNCIA, retornará a tabela de distribuição de frequência apresentada como matriz coluna.


Para trabalhar com registros em forma de matriz, devemos proceder desta forma:
  • Posicionar o mouse na célula E4 e selecionar o intervalo E4:E11. Observe que o intervalo selecionado contém uma linha a mais do que o intervalo em que estão registrado os valores do argumento a matriz_bin, intervalo D4:D10.



  • A seguir, digite a fórmula =frequencia(B4:B29;D4:D10) sem pressionar a tecla ENTER, como mostra a figura anterior. Note que o nome da função foi inserido com letras minúsculas e sem os acentos ortográficos, pois felizmente o Excel aceitará e registrará a função com letras maiúsculas e com os acentos ortográficos.

  • Para inserir essa função como matriz, pressione simultaneamente as três teclas Ctrl + Shift + Enter. Mantendo pressionada a tecla Ctrl, pressione e mantenha pressionada a tecla Shift e por último, pressione a tecla Enter. Depois de pressionar as três teclas simultaneamente, obtemos os resultados apresentados na próxima figura, na qual as fórmulas receberam as chaves {}. Você pode usar esse procedimento se utilizar o assistente do Excel Colar Função.





Podemos notar que as fórmulas do intervalo E4:E11 são todas iguais a {=FREQUÊNCIA(B4:B29;D4:D10)}, sendo que as chaves {} indicam que as fórmulas fazem parte da mesma matriz. Por último, o valor zero na célula E11 informa que nenhum dos valores da variável deixou de ser classificado. De outra maneira, o objetivo da última célula E11 é informar quantos valores da variável não foram classificados.


Referências

Livro: Estatística usando Excel

Autor: LAPPONI, Juan Carlos

Editora: CAMPUS




Introdução à Probabilidade

Autores: Diana, Rita de Cássia, Sonia, Thiago

INTRODUÇÃO À PROBABILIDADE

A probabilidade teve origem aproximadamente no século XVI e se aplicava inicialmente em jogos de azar, onde os jogadores ricos tinham mais conhecimento sobre as teorias de probabilidade e planeavam estratégias para levar vantagens nos jogos. Ainda hoje essa prática é utilizada, como em lotearias, cassinos de jogo, corridas de cavalos e esportes organizados. Mais do que isso, a probabilidade é utilizada por governos, empresas e organizações profissionais em seus processos diários de deliberação.

A utilização da probabilidade indica que existe um elemento de acaso ou incerto de ocorrer ou não um evento futuro. Na probabilidade não se pode afirmar o que ocorrerá, mas sim o que pode ocorrer.
Vamos supor que se jogarmos uma moeda para o ar, não podemos afirmar com certeza se vai dar cara ou coroa, mas através de uma determinada combinação de julgamento e experimentos é possível dizer quais as chances (probabilidade) de ocorrer um evento futuro.
A probabilidade proporciona muitas vantagens no dia dia, pois são extremamente úteis para o desenvolvimento de estratégias. Ela obtém, organiza e analisa dados estatísticos com a finalidade de descrever e explicar tais dados e determinar possíveis correlações e nexos-causais.

A IMPORTÂNCIA DA PROBABILIDADE


Meteorologia: É pouco provável que chova durante esta semana.

Seguros: Porque é que um condutor com pouco tempo de carta paga mais seguro?

Jogos: Porque é que o Toto loto tem 49 números e não 10 ou 20?


TERMOS E CONCEITOS

A idéia geral da probabilidade é frequentemente dividida em dois conceitos relacionados:


-Aleatórias


* Lançamento de uma moeda

* Lançamento de um dado

* Toto loto

* Estado do tempo para a semana

* Extração de uma carta

* Tempo que uma lâmpada irá durar

À partida não sabemos o resultado


-Deterministas


* Furar um balão cheio

* Deixar cair um prego num copo de água

* Calcular a área de quadrado de lado 9 cm

À partida já conhecemos o resultado


Experimento Probabilístico:

É uma ação ou um ensaio por meio do qual os resultados específicos (contagens, medidas ou respostas) são obtidos. A consequência de um único ensaio em um experimento probabilístico é um resultado (ponto amostral).

O conjunto de todos os resultados possíveis de um experimento probabilístico é o espaço amostral. Um evento consiste em um ou mais resultados e é um subconjunto do espaço amostral.


Evento:

Os eventos são freqüentemente representados por letras maiúsculas, tais com A, B, C. Um evento que consiste em um único resultado é chamado de evento simples. Por exemplo: se você determinar o tipo sanguíneo de uma amostra, evento simples A será "o sangue tipo A". Em contrate, o evento E será "o sangue não tipo A" e não será simples, pois consultará em três outros resultados possíveis {B, AB , O}


TIPOS DE PROBABILIDADE

A Probabilidade Clássica (ou teórica): é usada quando cada resultado no espaço amostral tem a mesma probabilidade de ocorrer. A probabilidade clássica para um evento E é dada por:


Nº resultado em E

P(E) = _________________

Nº total de resultados no espaço amostral


A Probabilidade Empírica (ou estatística): baseia-se em observações obtidas de experimentos probabilísticas. A probabilidade empírica de um evento E é a frequência relativa deste evento.


frequência do evento E f

P(E) = __________________ = ___________

frequência total n

A probabilidade subjetiva resulta de instituição, estimativa ou de um "palpite bem fundamentado"


Experimento Probabilístico:


Jogar um dado de seis faces

Espaço amostral:

{1,2,3,4,5,6}


Evento

Jogar um número par {2,4,6}


Resultado:

Jogar um 2 {2}


Espaço de Resultados ou Espaço Amostral: É o conjunto de todos os resultados possíveis de uma experiência aleatória.


EXPERIÊNCIA 1: Lançamento de um dado

Espaço Amostral = S = {1, 2, 3, 4, 5, 6 }


EXPERIÊNCIA 2: Jogo de futebol

Espaço Amostral = S = {Vitória, Empate, Derrota}


EXPERIÊNCIA 3: tirar uma bola de Toto loto

Espaço Amostral = S = {1, 2, 3,... ,47, 48, 49 }


Acontecimentos: Um acontecimento é um subconjunto do espaço amostral


EXPERIÊNCIA 1: Lançamento de um dado

Espaço Amostral = S = {1, 2, 3, 4, 5, 6}

Acontecimento A: “Sair um nº par”

A = {2, 4, 6 }

Acontecimento B: “Sair um nº maior que 2”

B = { 3, 4, 5, 6 }


EXPERIÊNCIA: Lançamento de um dado

Espaço Amostral = S = {1, 2, 3, 4, 5, 6 }

* ELEMENTAR

A: “ Sair o nº 3 ”

A={ 3 }

Só tem um elemento

* COMPOSTO

B: “ Sair o nº ímpar ”

B={ 1, 3, 5 }


Tem mais do que um elemento.


EXPERIÊNCIA: Lançamento de um rapa

Espaço Amostral = S = { R, T, D, P }


IMPOSSÍVEL

“ Sair a letra X ” ;

PROVÁVEL

“ Sair uma consoante ”

CERTO

“ Sair a letra T ”



ATRIBUIÇÃO DAS PROBABILIDADES

Uma importante questão é a atribuição das probabilidades aos elementos do espaço amostral. Duas abordagens são comuns: atribuição a priori e a posteriori.

A priori :Considere um espaço amostral com n eventos elementares

Ω = { A1,A2....An}

Caso não haja justificativas para atribuir maior probabilidade a um determinado ponto, é natural imaginar que as chances estão igualmente distribuídas nestes n eventos e, portanto:

P(A i) = 1/n

para i=1,2,…,n.

A atribuição de probabilidades a priori é feita quando se há conhecimento sobre as características físicas do experimento, como por exemplo, no lançamento da moeda e do dado. Por outro lado, se não há conhecimento sobre as chances dos eventos no espaço amostral, as probabilidades são atribuídas depois de repetidas observações do fenômeno aleatório.

Exemplo: Ao lançar um dado e observar o resultado obtido na face superior, as características físicas do experimento nos levam a atribuir probabilidades do seguinte modo:

Ω = { 1,2,3,4,5,6}

P(Ai) = P(A2) = P(A3) = P(A4) = P(A5) = P(A6) = 1/6

E nesta situação, as probabilidades são atribuídas a priori.

A posteriori: Quando não há conhecimento a priori das probabilidades, elas podem ser atribuídas através da experimentação.


Exemplo: Seja a inspeção de peças em um processo de fabricação e os seguintes eventos A={Peça Defeituosa} e B ={Peça Perfeita}. Após inspecionar 1000 peças, verificou-se que 450 eram defeituosas. A partir deste experimento, ao selecionar aleatoriamente uma peça, pode-se atribuir as seguintes probabilidades:

P(A) = 450/1000 = 0,45

P(B) = 550/1000 = 0,55


TÉCNICAS DE CONTAGEM

Para utilizar o método é preciso conhecer o numero total de resultados possíveis de um experimento.


Ex: um aluno está fazendo um teste de 20 questões do tipo “V” ou “F”, não tendo estudado nada, qual seria a probabilidade de ele responder corretamente todo o teste?

Todas as questões poderiam ser V, todas F, alternar V ou F, ou misturar aleatoriamente V e F.

As probabilidades então de V ou F, se houver duas questões serão: VV, VF, FV, FF. No caso de três questões seria: VVV, VVF, VFF, VFV, FVV, FFV, FFF.

Número de questões: 1 2 3 4

Numero de resultados: 2 4 8 16


REFERÊNCIAS:

LARSON, Ron & FARBER, Betsy. Estatística Aplicada. São Paulo. 2ª Ed., 2004.

STEVENSON, William J. Estatística aplicada à Administração. São Paulo1ª Ed. 1981.

Acesso ao site: http://pt.wikipedia.org/wiki/Probabilidade na data de 01/06/2009

Variáveis Aleatórias - Discreta e Contínua

Autores: Neide, Rosineide, Silvanilda, Melquisedec, Marcelo

INTRODUÇÃO


Na realização de um fenômeno aleatório, é comum termos interesse em uma ou mais quantidades. Essas quantidades são funções das ocorrências do fenômeno. Em certos casos, se o resultado é de interesse, a função identificada será utilizada. Note que, antes da realização de um fenômeno aleatório não sabemos seu resultado, exceto em casos especiais.
Com a realização do fenômeno, teremos uma observação conhecida que não será mais aleatória. Em muitas situações, os eventos que ocorrem são apenas uma ponte para o que realmente nos interessa. Podemos considerar que a observação conhecida de um fenômeno aleatório prediz um particular valor observado da variável aleatória. Assim, outra realização o fenômeno fornecerá um outro valor observado de variável, na maioria das vezes diferente do anterior. ( previa do livro PROBABILIDADE E VARIAÇÃO ALEATORIA – de Marcos Nascimento Magalhaes – 2ª edição + Ediusp.
Por outro lado, se admitirmos que os mesmos fatores atuam da mesma maneiras, ou de maneira análoga, em observações repetidas grande numero de vezes, constatamos que existe uma possibilidade de predição “ ao longo prazo”. Em outras palavras, certos resultados podem ser mais prováveis que outros, isso se tornaria visível num grande número de observações resultado ( Livro Estatística Aplicada a Administração – William J. Stevenson )

CONCEITOS BÁSICOS

Uma variável aleatória pode ser considerada como o resultado numérico de operar um mecanismo não determinístico ou de fazer uma experiência não determinística para gerar resultados aleatórios.
Matematicamente, uma variável aleatória é definida como uma função mensurável de um espaço probabilidade para um espaço mensurável (sigma-álgebra). Este espaço mensurável é o espaço de possíveis valores da variável, e é normalmente tomado como a sig,a-álgebra baseada na topologia usual dos números reais, e nós iremos geralmente assumir isto nos passos seguintes, excepto nos casos devidamente assinalados. (Origem: Wikipédia, a enciclopédia livre.

Uma Variável aleatória é uma descrição numérica do resultado do experimento. É a forma encontrada para narrarmos o que acontece.


VARIÁVEIS ALEATÓRIAS DISCRETA

Uma variável pode assumir duas classificações, Discreta ou Contínua.
Para melhor explicar o conceito associamos a algum exemplo real.


Um pequeno dado de seis lados, muito comum em jogos de tabuleiros, ele é o melhor exemplo para uma Variável Aleatória Discreta Finita. Pois todas as vezes em que lançarmos o dado, ele sempre nos dará um "valor" inteiro. Não existe a possibilidade que ele caia de "lado" nos dando um valor surpreendente como 2,5555.
O seu Espaço Amostral é {1,2,3,4,5,6} não havendo nenhum valor intermediário.
Outro exemplo de Variável Aleatória Discreta Infinita, seria o número de carros que chegam no pedágio, sabemos que virá infinitamente carros, no entanto, nunca chegará a metade de um carro, não haverá "frações" no numero de carros. O resultado a princípio não é completamente conhecido, mas sempre Descritível com facilidade.
Obtido em Oikibooks.org/oiki

VARIÁVEIS ALEATÓRIAS CONTÍNUAS


Uma Variável Aleatória que pode assumir QUALQUER VALOR NUMÉRICO em um DETERMINADO intervalo ou coleção de interválos é chamada de variável aleatória contínua.
Imagine uma olimíadas o lançamento do martelo (podendo ser o disco, lança ou outro), sabemos de ante-mão que os valores do lançamento de martelo atingem no máximo a distancia de 60 metros e a distancia mínima classificatória de 30. Ou seja, todos os lançamentos serão dentro desse intervalo podendo assumir uma infinidade de possibilidades, pois sempre existirá uma fração para medir as menor diferença possível entre um laçamento a outro, como 59 metros, 25 centimetros, 12milimetros e assim por diante.
Neste caso x seria uma variável aleatória contínua que assume qualquer valor no intervalo 30 (maior igual a) x (menor ou igual a) 60


Obtido em Oikibooks.org/oiki



MARTINS, Gilberto de Andrade. Estatística geral e aplicada- 3ª Edição-2008- São Paulo-Editora- Atlas.








Distribuição Hipergeométrica

Autores: Ana Paula, Adeildo, Márcia, Milene

CONCEITO

A Função Hipergeométrica de probabilidade é usada para calcular a probabilidade de que em uma amostra aleatória de n elementos, selecionados sem substituição , obtêm-se k elementos rotulados de sucesso e n-k elentos rotulados de fracasso.Para que isso ocorra, precisa-se obter k sucessos a partir dos r sucessos na população e n-k fracassos a partir dos N - r fracassos.
A Função Hipergeométrica de probabilidade fornece f(x), a probabilidade de se obter x sucessos em uma amostra de tamanho n, onde os ensaios não são independentes e a probabilidade de sucesso muda de ensaio para ensaio. (Anderson,David R.Estatística aplicada à Administração e Economia p.205).


Para ilustrar, considere uma população de N objetos, r dos quais têm o atributo A e N- r têm o atributo B. Um grupo de k elementos é escolhido ao acaso, sem reposição. Estamos interessados em calcular a probabilidade de que esse grupo contenha x elementos com o atributo A. Pode-se ver facilmente, utilizando o princípio multiplicativo, que essa probabilidade é dada por, onde 0 ≤ k ≤ min ( r,n).




Exemplo: Em problemas de controle de qualidade, lotes com N itens são examinados. O número de itens com defeito (atributo A), r, é desconhecido, colhemos uma amostra de n itens e determinamos k. Somente para ilustrar, suponha que num lote de N=100 peças, r=10 sejam defeituosas.
Escolhendo n=5 peças sem reposição, a probabilidade de não se obter peças defeituosas é:



Enquanto a probabilidade de se obter pelo menos uma defeituosa é,
P1 + p2+.......+p5= 1-p0 ≈ 0,426

Pode-se demonstrar que a variável aleatória X definida acima tem esperança ( valor esperado) e variância dadas por;










Respectivamente, onde p = r/N é a probabilidade de se obter uma peça defeituosa numa única extração. Se N for grande, quando comparado com n, então extrações com ou sem reposição serão praticamente equivalentes, de modo que as probabilidades dadas por:





serão aproximadamente iguais às dadas pela fórmula :


Do mesmo modo, os resultados E(x)= np e Var (x)= np (1-p) (N- n)/(N-1)

Consideremos agora o problema de se determinar a probabilidade de ocorrência de exatamente três cartas vermelhas em cinco extrações de um baralho comum, sem reposição.
Como a carta extraída não volta ao baralho, a probabilidade de aparecer carta vermelha se modifica de uma extração para outra. Para resolver o problema, basta notar que extrair cinco cartas de um baralho, uma após outra, sem reposição, equivale a extrair aleatoriamente as cinco cartas de uma vez.
Então, se um baralho comum tem 26 cartas vermelhas e 26 cartas pretas, a presença de três cartas vermelhas em cinco extrações exige que as outras duas cartas extraídas sejam pretas.
duas cartas pretas de um baralho comum. Essas possibilidades dão um total de (26/3)(26/2) casos favoráveis( princípio fundamental da contagem). Por outro lado, podemos extrair cinco cartas de um baralho de 52 cartas de (52/5)maneiras distintas ( casos possíveis).
Então, a probabilidade procurada é,



A distribuição hipergeométrica é usada na construção de planos de inspeção por amostragem, em que, de acordo com os resultados da análise de uma amostra de peças, fazemos inferências sobre a qualidade de todo o lote. (MORETTI, Pedro A. Estatística Básica. 5ª Ed.2006. Editora Saraiva)



Média e Variância

A média e a variância da distribuição hipergeométrica são:




Note-se a analogia com a média e a variância da binomial. Além disso, quando n é muito pequeno em relação a N, a fração (N – n / N – 1 ) tende para 1 e σ² tende para npq, variância da binomial.

EXEMPLO:

1. Deve-se construir um comitê de quatro pessoas escolhidas entre três químicos e cinco físicos. Determinar a distribuição de probabilidade do número de químicos no comitê.

Solução:
Seja X a variável aleatória “ número de químicos no comitê “: