Diferença entre média e mediana
Média e mediana são dois termos comumente usados em matemática, média é como a média de um dado número e soma os números e os divide com a contagem de números que nos dá a média enquanto a mediana, por outro lado, retorna o número do meio do todo conjunto de dados e se o conjunto de dados for par, a mediana adiciona os dois números do meio e divide por 2, dando-nos a mediana.
Eles são a medida da tendência central e são freqüentemente usados na medição de grandes conjuntos de dados onde a análise precisa ser desenhada e os resultados interpretados. Média, mediana e moda são três medidas de médias que mostram a dispersão dos dados a partir da média ou da média. Esses métodos são amplamente usados em estatística, enquanto o valor médio dos dados é o método mais usado entre os três.
O que é meio?
A média é uma soma simples do número de observações em uma matriz dividida pelo número de observações. Por exemplo, se falamos sobre a altura média ou a altura média de um grupo de 5 pessoas. A altura média seria calculada somando a altura de 5 pessoas dividida pelo número de pessoas, ou seja, 5.
Fórmula
Fórmula média = (soma de todas as observações / número de observações)Qual é a mediana?
A mediana, por outro lado, é o número do meio no conjunto de matriz de dados que separa o conjunto superior de dados do inferior. Os dados precisam ser organizados em ordem crescente primeiro para calcular a mediana dos dados. Quando o conjunto de dados tem cardinalidade, a média dos dois números do meio no conjunto de dados precisa ser obtida. No entanto, esses dois métodos costumam ser usados alternadamente.
Fórmula
Fórmula mediana = (n + 1) / 2quando n é um número ímpar
Mediana = [(n / 2) + {(n / 2) +1}] / 2quando n é um número par
Infográficos médios vs medianos
Vamos ver as principais diferenças entre a média e a mediana.
Diferenças principais de média vs mediana
- A média é simples de usar e aplicar e pode ser aplicada a qualquer conjunto de matriz de dados par ou ímpar. A mediana, por outro lado, é um pouco complexa de usar e o conjunto de dados precisa ser organizado em ordem crescente ou decrescente antes do cálculo.
- A média é normalmente usada para distribuições normais, enquanto a mediana é usada para o conjunto de dados de distribuições enviesadas.
- A média é simples, mas não é robusta, pois pode conter outliers nas distribuições e às vezes pode não fornecer ao usuário os resultados corretos para interpretação. Por outro lado, o método da mediana é robusto e é mais adequado para uso, pois é usado para distribuições enviesadas para derivar a tendência central do conjunto de datas e fornecerá ao usuário muitos resultados precisos quando comparado à média
- Existe apenas uma fórmula de média que é a soma de todas as observações dividida pelo número de observações. Enquanto que a mediana tem duas fórmulas, uma das ímpares, onde apenas os números do meio do conjunto de dados se tornam a mediana. Mas quando temos um conjunto de dados pares, o meio dos dois valores é escolhido e dividido por 2, o que nos dá a mediana do conjunto de dados pares.
Tabela Comparativa Média vs Mediana
Significar | Mediana | |
A média é calculada somando todos os valores na matriz de dados que é então dividida pelo número de observações | A mediana é o valor médio exato do conjunto de dados. Pode ser calculado organizando o conjunto de dados em ordem crescente e, em seguida, encontrando ou escolhendo o valor médio do conjunto de dados | |
É mais amplamente utilizado na indústria devido a um cálculo fácil da média e nos dá um número rápido | Não é usado com frequência na indústria, mas é mais completo e preciso do que o normal, sendo apenas uma simples soma de números | |
É usado geralmente para conjunto de dados normalmente inclinado, ou seja, distribuição normal | É particularmente útil descrever o conjunto de dados com uma distorção significativa nos dados ou quando os dados têm uma cauda longa. É amplamente utilizado onde os outliners têm peso significativo nos dados, o que significa que não é um bom método de cálculo | |
Não é uma ferramenta robusta para um cálculo derivar a tendência central | É uma ferramenta muito robusta, pois determina o peso nos dados, que geralmente é de alto peso nas caudas mais longas | |
É muito sensível a outliers | É muito menos afetado pelos outliers | |
É simples de usar | É complexo por natureza | |
Não pode ser calculado para dados categóricos, pois os valores não podem ser somados | Não pode ser identificado para dados nominais categorizados, pois não pode ser ordenado logicamente. |
Conclusão
Além da média e da mediana, há mais um método frequentemente usado para medir a tendência central que é a moda. Um modo é um valor que ocorre com mais frequência no conjunto de dados; o modo tem uma vantagem sobre a média e a mediana, pois pode ser encontrado tanto para o conjunto de dados numéricos quanto para os categorizados.
Apesar da existência de moda e mediana, da superioridade de melhores resultados e análises sobre a média, a média ainda é a medida mais adequada de tendência central, especialmente se o conjunto de dados é uma distribuição normal e os dados são normalmente enviesados.
Como um bom analista, a tendência central deve ser medida com todos os três métodos de dados e a variância na análise deve ser ponderada e cuidadosamente analisada para produzir resultados melhores e mais precisos no conjunto de dados.