Box Plot no Excel

Excel Box Plot

Um box plot no Excel é uma representação pictórica ou um gráfico que é usado para representar a distribuição de números em um conjunto de dados. Indica como os valores no conjunto de dados estão espalhados. Em um boxplot, os dados numéricos são mostrados usando cinco números como um resumo: mínimo, máximo, primeiro quartil, segundo quartil (mediana), terceiro quartil.

Entre o primeiro e o terceiro quartis, uma caixa é desenhada junto com uma linha adicional que é desenhada ao longo do segundo quartil para marcar a mediana. Linhas estendidas são desenhadas fora do primeiro e terceiro quartis para representar o mínimo e o máximo. Essas linhas estendidas são chamadas de bigodes no boxplot.

A caixa do boxplot mostra do primeiro ao terceiro quartil com uma linha no segundo quartil, isto é, mediana. As pontas dos bigodes representam o mínimo e o máximo.

Os cinco números representados pelo boxplot:

  • Mínimo: menor / menor valor do conjunto de dados.
  • Primeiro quartil: Valor médio de mínimo e mediano.
  • Segundo quartil / mediana: valor médio do conjunto de dados.
  • Terceiro quartil: valor médio da mediana e máximo.
  • Máximo: o maior valor do conjunto de dados.

Como fazer o Box Plot no Excel? (com um exemplo)

Você pode baixar este Box Plot Excel Template aqui - Box Plot Excel Template

Digamos que temos um conjunto de dados de uma classe que contém notas totais de seus alunos em todas as disciplinas (de 500, notas máximas: 100 para cada disciplina), e desejamos criar um box plot no excel para a mesma.

Temos os seguintes dados de notas dos alunos em uma planilha do Excel:

Agora, as seguintes etapas podem ser usadas para criar um gráfico de caixa para os dados acima (basicamente no Excel 2013):

É muito simples criar um gráfico de caixa com o Excel 2016, pois ele tem um gráfico 'Box and Whisker' sob os gráficos estatísticos na seção de gráficos por padrão. No entanto, o Excel 2013 não tem um modelo de gráfico para box plot por padrão, portanto, temos que criá-lo seguindo as etapas abaixo:

Calcule as cinco estatísticas do conjunto de dados que são necessárias para o gráfico de caixa: mínimo, três quartis e máximo, usando as seguintes funções:

Agora calcule as estatísticas mínimas do conjunto de dados.

Agora calcule estatísticas quantile1 do conjunto de dados.

O cálculo de cinco estatísticas para o gráfico de caixa será -

Agora criaremos uma tabela final (digamos, tabela de diferenças) que usaremos para criar o gráfico de caixa no Excel. Nesta mesa final, copiaremos o valor mínimo e essa será a primeira entrada da nossa mesa final. O resto das entradas desta tabela final seriam as diferenças entre cada estatística conforme abaixo:

Agora vamos criar um gráfico de colunas empilhadas com esta tabela final e transformá-lo em um gráfico de caixa.

Então, vamos primeiro criar um gráfico de colunas empilhadas no Excel:

Selecione Diferenças e valores e clique em 'Inserir' -> Todos os gráficos -> Gráficos de colunas empilhadas:

Ao fazer isso, obtemos um gráfico empilhado como abaixo:

Podemos ver que isso não é semelhante a um gráfico de caixa porque, com este gráfico empilhado, o Excel desenha colunas empilhadas da horizontal por padrão e não de um conjunto de dados vertical. Portanto, teremos que inverter os eixos do gráfico.

Para fazer isso, clique com o botão direito no gráfico e clique em 'Selecionar dados'.

Agora clique em Switch Row / Column '.

Obtemos o gráfico empilhado como abaixo:

Vamos agora converter este tipo de gráfico empilhado em box plot da seguinte maneira:

Selecione a parte inferior da coluna (área azul) e clique em 'Formatar série de dados'.

No painel 'Formatar série de dados', expanda a opção 'Preencher' e selecione o botão 'Sem preenchimento' e, na lista suspensa 'borda', expanda-o e selecione o botão 'Sem linha':

Obtemos o seguinte gráfico de box plot como abaixo:

O próximo passo é criar bigodes substituindo o segmento superior e o segundo segmento inferior, ou seja, as regiões vermelha e laranja (já que excluímos o inferior) por linhas / bigodes.

Para desenhar o bigode superior, selecionamos a região / segmento superior (vermelho) e expandimos a guia 'Preencher'.

E selecione o botão 'Sem preenchimento'.

Agora clique em 'Design' -> 'Adicionar elementos do gráfico' -> 'Barras de erro' -> 'Desvio padrão':

Agora clicamos no botão Mais no canto superior direito do gráfico, e selecionamos e expandimos 'Barras de erro no Excel' e então selecionamos 'Mais opções'

Isso abrirá o painel 'Formatar barras de erro' e definirá o seguinte:

Definir: Direção para 'Mais'

Fim do estilo para 'Cap'

Porcentagem para '100%'

Portanto, agora teremos um bigode superior desenhado como abaixo:

Da mesma forma para desenhar o bigode inferior, selecionamos o segundo da região inferior (laranja que agora é visível como a última) e repetimos os mesmos passos acima. A única mudança seria que a 'direção' nas barras de erro 'seria definida como' menos '.

Portanto, agora teremos um bigode inferior desenhado como abaixo:

Portanto, podemos ver na imagem acima que o gráfico de colunas empilhadas agora se assemelha a um gráfico de caixa. Os box plot são geralmente da mesma cor, portanto, podemos usar uma cor de preenchimento com uma leve borda.

Agora vamos ver como um gráfico de caixa é interpretado ou visualizado:

Podemos ver na imagem acima que:

  • Pontos finais do bigode inferior em 300, que representa o valor mínimo.
  • Os pontos finais do bigode superior em algum lugar abaixo de 500, que é exatamente 492, que representa o máximo.
  • A linha superior da caixa verde representa o quartil3, que vemos pontos em 480,5.
  • A linha média da caixa verde representa a mediana / quartil2, que vemos pontos em 450.
  • A última linha da caixa verde representa o quartil 1, que vemos pontos em 392.

Portanto, o gráfico de caixa para o conjunto de dados fornecido é desenhado corretamente com as cinco estatísticas (mínimo, três quartis e máximo) calculadas como acima.

Coisas para lembrar

  • Um gráfico de caixa é uma representação pictórica de um conjunto de dados numérico que usa um resumo de cinco números para descrever a distribuição do conjunto de dados.
  • O box plot também é conhecido como box and whisker plot.
  • Geralmente é usado para análise de dados explicativos.
  • Eles geralmente são usados ​​quando precisamos comparar algumas amostras e testar se os dados estão distribuídos simetricamente.
  • Os gráficos de caixa ocupam menos espaço em comparação com os gráficos de densidade ou histogramas.
  • É usado para mostrar a forma de uma distribuição, valor central e sua variabilidade.
  • Não é necessário que a mediana fique no meio da caixa.
  • Os bigodes podem ter comprimentos diferentes.
  • O gráfico de caixa pode ser usado para detectar outliers.