Fórmula R ao Quadrado

O que é R ao quadrado (R2) na regressão?

R-quadrado (R2) é uma medida estatística importante que é um modelo de regressão que representa a proporção da diferença ou variância em termos estatísticos para uma variável dependente que pode ser explicada por uma variável ou variáveis ​​independentes. Em suma, ele determina o quão bem os dados se ajustam ao modelo de regressão.

Fórmula R ao Quadrado

Para o cálculo de R ao quadrado, você precisa determinar o coeficiente de correlação e, em seguida, quadrar o resultado.

Fórmula R ao quadrado = r2

Onde r o coeficiente de correlação pode ser calculado conforme abaixo:

Onde,

  • r = O coeficiente de correlação
  • n = número no conjunto de dados fornecido
  • x = primeira variável no contexto
  • y = segunda variável

Explicação

Se houver qualquer relação ou correlação que pode ser linear ou não linear entre essas duas variáveis, deve indicar se há uma mudança no valor da variável independente, então a outra variável dependente provavelmente mudará no valor, digamos linearmente ou não linearmente.

A parte do numerador da fórmula realiza um teste se eles se movem juntos e remove seus movimentos individuais e a força relativa de ambos se movendo juntos e a parte do denominador da fórmula dimensiona o numerador tomando a raiz quadrada do produto das diferenças do variáveis ​​de suas variáveis ​​quadradas. E quando você eleva ao quadrado este resultado obtemos R ao quadrado, que nada mais é do que o coeficiente de determinação.

Exemplos

Você pode baixar este modelo de fórmula R quadrada em Excel aqui - modelo de fórmula R quadrada em Excel

Exemplo 1

Considere as seguintes duas variáveis ​​x e y, você deve calcular o R ​​ao quadrado na regressão.

Solução:

Usando a fórmula mencionada acima, precisamos primeiro calcular o coeficiente de correlação.

Temos todos os valores da tabela acima com n = 4.

Vamos agora inserir os valores na fórmula para chegar à figura.

r = (4 * 26.046,25) - (265,18 * 326,89) / √ [(4 * 21.274,94) - (326,89) 2] * [(4 * 31.901,89) - (326,89) 2]

r = 17.501,06 / 17.512,88

Coeficiente de correlação será-

r = 0,99932480

Portanto, o cálculo será o seguinte,

r2 = (0,99932480) 2

Fórmula R ao quadrado na regressão

r2 = 0,998650052

Exemplo # 2

A Índia, um país em desenvolvimento, deseja realizar uma análise independente se as mudanças nos preços do petróleo bruto afetaram seu valor em rúpias. A seguir está a história do preço do petróleo bruto Brent e a avaliação da Rúpia, ambos em relação ao dólar, que prevaleceu em uma média nesses anos por ano.

O RBI, o banco central da Índia, o abordou para fazer uma apresentação sobre o mesmo na próxima reunião. Determinar se os movimentos do petróleo bruto afetam os movimentos em Rúpia por dólar?

Solução:

Usando a fórmula para a correlação acima, podemos calcular o coeficiente de correlação primeiro. Tratar o preço médio do petróleo bruto como uma variável diga xe tratar a Rúpia por dólar como outra variável como y.

Temos todos os valores da tabela acima com n = 6.

Vamos agora inserir os valores na fórmula para chegar à figura.

r = (6 * 23592,83) - (356,70 * 398,59) / √ [(6 * 22829,36) - (356,70) 2] * [(6 * 26529,38) - (398,59) 2]

r = -620,06 / 1.715,95

Coeficiente de correlação será-

r = -0,3614

Portanto, o cálculo será o seguinte,

r2 = (-0,3614) 2

Fórmula R ao quadrado na regressão

r2 = 0,1306

Análise: Parece que há uma pequena relação entre as mudanças nos preços do petróleo bruto e as mudanças no preço da rupia indiana. À medida que o preço do petróleo aumenta, as mudanças na rupia indiana também afetam. Mas, como R ao quadrado é de apenas 13%, as mudanças no preço do petróleo bruto explicam muito menos as mudanças na rupia indiana, e a rupia indiana está sujeita a mudanças em outras variáveis ​​também que precisam ser contabilizadas.

Exemplo # 3

O laboratório XYZ está realizando pesquisas sobre altura e peso e tem interesse em saber se existe algum tipo de relação entre essas variáveis. Depois de reunir uma amostra de 5.000 pessoas para cada categoria, chegou-se a uma média de peso e altura média naquele grupo específico.

Abaixo estão os detalhes que eles reuniram.

Você deve calcular R quadrado e concluir se este modelo explica as variações na altura afetam as variações no peso.

Solução:

Usando a fórmula para a correlação acima, podemos calcular o coeficiente de correlação primeiro. Tratando a altura como uma variável diga x e tratando o peso como outra variável como y.

Temos todos os valores da tabela acima com n = 6.

Vamos agora inserir os valores na fórmula para chegar à figura.

r = (7 * 74.058,67) - (1031 * 496,44) / √ [(7 * 153595 - (1031) 2] * [(7 * 35793,59) - (496,44) 2]

r = 6.581,05 / 7.075,77

Coeficiente de correlação será-

Coeficiente de correlação (r) = 0,930

Portanto, o cálculo será o seguinte,

r2 = 0,865

Análise: A correlação é positiva e parece haver alguma relação entre altura e peso conforme a altura aumenta, o peso da pessoa também parece aumentar. Enquanto R2 sugere que 86% das mudanças nos atributos de altura para mudanças no peso e 14% são inexplicáveis.

Relevância e usos

A relevância de R ao quadrado na regressão é sua capacidade de encontrar a probabilidade de eventos futuros ocorrerem dentro dos resultados previstos ou dos resultados fornecidos. Se mais amostras forem adicionadas ao modelo, o coeficiente mostrará a probabilidade ou a probabilidade de um novo ponto ou do novo conjunto de dados cair na linha. Mesmo que ambas as variáveis ​​tenham uma forte conexão, a determinação não prova causalidade.

Alguns dos espaços onde R ao quadrado é mais usado são para rastrear o desempenho de fundos mútuos, para rastrear o risco em fundos de hedge, para determinar o quão bem as ações estão se movendo com o mercado, onde R2 sugeriria quanto dos movimentos nas ações podem ser explicados pelos movimentos do mercado.