Fórmula Outlier

A fórmula de outlier fornece uma ferramenta gráfica para calcular os dados que estão localizados fora de um determinado conjunto de distribuição que pode ser interno ou externo dependendo das variáveis.

Qual é a Fórmula Outlier?

Um outlier é o ponto de dados de determinada amostra ou observação ou em uma distribuição que deve estar fora do padrão geral. Uma regra comumente usada que diz que um ponto de dados será considerado um outlier se tiver mais de 1,5 IQR abaixo do primeiro quartil ou acima do terceiro quartil.

Dito de outra forma, os outliers baixos devem estar abaixo de Q1-1.5 IQR e os outliers altos devem estar Q3 + 1.5IQR

É necessário calcular a mediana, quartis incluindo IQR, Q1 e Q3.

A fórmula de outlier é representada da seguinte forma,

A Fórmula para Q1 = ¼ (n + 1) º termo A Fórmula para Q3 = ¾ (n + 1) º termo A Fórmula para Q2 = Q3 - Q1

Cálculo passo a passo de outlier

As etapas abaixo precisam ser seguidas para calcular o Outlier.

  • Etapa 1: primeiro calcule os quartis, ou seja, Q1, Q2 e interquartil
  • Etapa 2: Agora calcule o valor Q2 * 1,5
  • Etapa 3: agora subtraia o valor Q1 do valor calculado na Etapa 2
  • Etapa 4: Aqui, adicione Q3 com o valor calculado na etapa 2
  • Etapa 5: crie o intervalo dos valores calculados na Etapa 3 e na Etapa 4
  • Etapa 6: Organize os dados em ordem crescente
  • Etapa 7: Verifique se há algum valor abaixo ou acima do intervalo criado na Etapa 5

Exemplo

Considere um conjunto de dados com os seguintes números: 10, 2, 4, 7, 8, 5, 11, 3, 12. Você deve calcular todos os valores discrepantes.

Solução:

Primeiro, precisamos organizar os dados em ordem crescente para encontrar a mediana que será Q2 para nós.

2, 3, 4, 5, 7, 8, 10, 11, 12

Agora, como o número de observações é ímpar, que é 9, a mediana estaria em uma 5ª posição, que é 7 e mesmo será Q2 para este exemplo.

Portanto, o cálculo de Q1 é o seguinte -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 será - 

Q1 = 2,5 termo

Isso significa que Q1 é a média da 2ª e 3ª posição das observações, que é 3 e 4 aqui e uma média das mesmas é (3 + 4) / 2 = 3,5

Portanto, o cálculo do Q3 é o seguinte -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 será - 

Q3 = termo de 7,5

Isso significa que Q3 é a média da 7ª e 8ª posição das observações, que é 10 e 11 aqui e uma média das mesmas é (10 + 11) / 2 = 10,5

Agora, valores discrepantes baixos ficarão abaixo de Q1-1.5IQR e valores discrepantes altos deverão ficar em Q3 + 1.5IQR

Portanto, os valores são 3,5 - (1,5 * 7) = -7 e o intervalo superior é 10,5 + (1,5 * 7) = 110,25.

Como não há observações acima ou abaixo de 110,25 e -7, não temos nenhum valor discrepante nesta amostra.

Exemplo de fórmula atípica no Excel (com modelo do Excel)

Você pode baixar este modelo Excel de fórmula atípica aqui - Modelo Excel de fórmula atípica

As aulas de coaching criativo estão considerando recompensar os alunos que estão entre os 25% melhores. No entanto, eles querem evitar quaisquer discrepâncias. Os dados são para os 25 alunos. Use a equação outlier para determinar se há um outlier?

Solução:

Abaixo estão dados para calcular outlier

O número de observações aqui é 25 e nosso primeiro passo seria converter os dados brutos acima em ordem crescente.

A mediana será -

O valor médio = ½ (n + 1)

= ½ = ½ (26)

= 13º termo

O 2º trimestre ou mediana é 68,00

Que é 50% da população.

Q1 será -

Q1 = ¼ (n + 1) º termo

= ¼ (25 + 1)

= ¼ (26)

= 6,5º termo que é equivalente ao 7º termo

O Q1 é de 56,00, o que representa os 25% inferiores

Q3 será -

Finalmente, Q3 = ¾ (n + 1) º termo

= ¾ (26)

= 19,50 termo

Aqui, a média deve ser tomada, que é do 19º e 20º termos, que são 77 e 77, e a média dos mesmos é (77 + 77) / 2 = 77,00

 O terceiro trimestre é de 77, os 25% principais

Baixo alcance

Agora, valores discrepantes baixos ficarão abaixo de Q1-1.5IQR e valores discrepantes altos deverão ficar em Q3 + 1.5IQR

Grande alcance -

Portanto, os valores são 56 - (1,5 * 68) = -46 e o ​​intervalo superior é 77 ​​+ (1,5 * 68) = 179.

Não há outliers.

Relevância e usos

É muito importante saber a fórmula de outliers, pois pode haver dados que seriam distorcidos por esse valor. Tome um exemplo das observações 2, 4, 6, 101 e agora se alguém tirar uma média desses valores será 28,25, mas 75% das observações estão abaixo de 7 e, portanto, seria uma decisão incorreta em relação às observações desta amostra.

Pode-se notar aqui que 101 parece claramente delinear e se isso for removido, a média seria 4, o que diz sobre os valores ou observações que estão dentro da faixa de 4. Portanto, é muito importante realizar este cálculo para evitar qualquer uso indevido de informações importantes dos dados. Eles são amplamente utilizados por estatísticos em todo o mundo sempre que estão conduzindo qualquer pesquisa.