Coeficiente de correlação de Pearson

Definição do coeficiente de correlação de Pearson

O coeficiente de correlação de Pearson, também conhecido como teste estatístico Pearson R, mede a força entre as diferentes variáveis ​​e suas relações. Sempre que qualquer teste estatístico é conduzido entre as duas variáveis, então é sempre uma boa ideia para a pessoa que está fazendo a análise calcular o valor do coeficiente de correlação para saber quão forte é a relação entre as duas variáveis.

O coeficiente de correlação de Pearson retorna um valor entre -1 e 1. A interpretação do coeficiente de correlação é a seguinte:

  • Se o coeficiente de correlação for -1, ele indica uma forte relação negativa. Implica uma relação negativa perfeita entre as variáveis.
  • Se o coeficiente de correlação for 0, isso indica que não há relacionamento.
  • Se o coeficiente de correlação for 1, indica uma forte relação positiva. Implica uma relação positiva perfeita entre as variáveis.

Um valor absoluto mais alto do coeficiente de correlação indica uma relação mais forte entre as variáveis. Assim, um coeficiente de correlação de 0,78 indica uma correlação positiva mais forte em comparação com um valor de, digamos, 0,36. Da mesma forma, um coeficiente de correlação de -0,87 indica uma correlação negativa mais forte em comparação com um coeficiente de correlação de digamos -0,40.

Em outras palavras, se o valor estiver na faixa positiva, então isso mostra que a relação entre as variáveis ​​está correlacionada positivamente e ambos os valores diminuem ou aumentam juntos. Por outro lado, se o valor estiver na faixa negativa, isso mostra que a relação entre as variáveis ​​está correlacionada negativamente, e ambos os valores irão na direção oposta.

Fórmula do coeficiente de correlação de Pearson

A fórmula do coeficiente de correlação de Pearson é a seguinte,

Onde,

  • r = coeficiente de Pearson
  • n = número de pares do estoque
  • ∑xy = soma dos produtos dos estoques pareados
  • ∑x = soma das pontuações x
  • ∑y = soma das pontuações y
  • ∑x2 = soma das pontuações x ao quadrado
  • ∑y2 = soma das pontuações de y ao quadrado

Explicação

Etapa 1: Descubra o número de pares de variáveis, que é denotado por n. Suponhamos que x consista em 3 variáveis ​​- 6, 8, 10. Suponhamos que y consista em 3 variáveis ​​correspondentes 12, 10, 20.

Etapa 2: Liste as variáveis ​​em duas colunas.

Etapa 3: Descubra o produto de xey na 3ª coluna.

Etapa 4: Descubra a soma dos valores de todas as variáveis ​​xe todas as variáveis ​​y. Escreva os resultados na parte inferior da 1ª e 2ª colunas. Escreva a soma de x * y na 3ª coluna.

Etapa 5: Descubra x2 e y2 na 4ª e 5ª colunas e sua soma na parte inferior das colunas.

Passo 6: Insira os valores encontrados acima na fórmula e resolva.

r = 3 * 352-24 * 42 / √ (3 * 200-242) * (3 * 644-422)

= 0,7559

Exemplo de coeficiente de correlação de Pearson R

Você pode baixar este modelo de coeficiente de correlação de Pearson aqui - modelo de coeficiente de correlação de Pearson em Excel

Exemplo 1

Neste exemplo, com a ajuda dos seguintes detalhes na tabela das 6 pessoas com uma idade diferente e pesos diferentes dados abaixo para o cálculo do valor de Pearson R

Solução:

Para o cálculo do coeficiente de correlação de Pearson, vamos primeiro calcular os seguintes valores,

Aqui, o número total de pessoas é 6, portanto, n = 6

Agora, o cálculo do Pearson R é o seguinte,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ [n ∑x2- (∑x) 2] [n ∑y2– (∑y) 2)
  • r = (6 * (13937) - (202) (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (6 * (13937) - (202) * (409)) / (√ [6 * 7280 - (202) 2] * [6 * 28365- (409) 2)
  • r = (83622- 82618) / (√ [43680 -40804] * [170190- 167281)
  • r = 1004 / (√ [2876] * [2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892.452938
  • r = 0,35

Assim, o valor do coeficiente de correlação de Pearson é 0,35

Exemplo # 2

Existem 2 ações - A e B. Os preços das ações em dias específicos são os seguintes:

Descubra o coeficiente de correlação de Pearson a partir dos dados acima.

Solução:

Primeiro, calcularemos os seguintes valores.

O cálculo do coeficiente de Pearson é o seguinte,

  • r =  (5 * 1935-266 * 37) / ((5 * 14298- (266) ^ 2) * (5 * 283- (37) ^ 2)) ^ 0,5
  • = -0,9088

Portanto, o coeficiente de correlação de Pearson entre as duas ações é -0,9088.

Vantagens

  • Ajuda a saber o quão forte é a relação entre as duas variáveis. Não apenas a presença ou ausência de correlação entre as duas variáveis ​​é indicada pelo coeficiente de correlação de Pearson, mas também determina a extensão exata em que essas variáveis ​​estão correlacionadas.
  • Usando este método, pode-se determinar a direção da correlação, ou seja, se a correlação entre duas variáveis ​​é negativa ou positiva.

Desvantagens

  • O coeficiente de correlação de Pearson R não é suficiente para dizer a diferença entre as variáveis ​​dependentes e as variáveis ​​independentes, pois o coeficiente de correlação entre as variáveis ​​é simétrico. Por exemplo, se uma pessoa está tentando saber a correlação entre o alto estresse e a pressão arterial, então pode-se encontrar o alto valor da correlação, que mostra que o alto estresse causa a pressão arterial. Agora, se a variável for alterada, o resultado, nesse caso, também será o mesmo, o que mostra que o estresse é causado pela pressão arterial, o que não faz sentido. Assim, o pesquisador deve estar ciente dos dados que está utilizando para realizar a análise.
  • Usando este método, não é possível obter informações sobre a inclinação da linha, pois ele apenas indica se existe ou não qualquer relação entre as duas variáveis.
  • É provável que o Coeficiente de Correlação de Pearson possa ser mal interpretado, especialmente no caso de dados homogêneos.
  • Quando comparado com os outros métodos de cálculo, este método leva muito tempo para chegar aos resultados.

Pontos importantes

  • Os valores podem variar do valor +1 ao valor -1, onde o +1 indica a relação positiva perfeita entre as variáveis ​​consideradas, o -1 indica a relação negativa perfeita entre as variáveis ​​consideradas e um valor 0 indica que não há relação existe entre as variáveis ​​consideradas.
  • É independente da unidade de medida das variáveis. Por exemplo, se a unidade de medida de uma variável é em anos enquanto a unidade de medida da segunda variável é em quilogramas, mesmo assim, o valor deste coeficiente não muda.
  • O coeficiente de correlação entre as variáveis ​​é simétrico, o que significa que o valor do coeficiente de correlação entre Y e X ou X e Y, permanecerá o mesmo.

Conclusão

O coeficiente de correlação de Pearson é o tipo de coeficiente de correlação que representa a relação entre as duas variáveis ​​que são medidas no mesmo intervalo ou na mesma escala de razão. Ele mede a força da relação entre as duas variáveis ​​contínuas.

Ele não apenas afirma a presença ou ausência de correlação entre as duas variáveis, mas também determina a extensão exata em que essas variáveis ​​estão correlacionadas. É independente da unidade de medida das variáveis ​​onde os valores do coeficiente de correlação podem variar do valor +1 ao valor -1. No entanto, não é suficiente dizer a diferença entre as variáveis ​​dependentes e as variáveis ​​independentes.