Covariância vs Correlação

Diferença entre covariância e correlação

Covariância e Correlação são dois termos que são exatamente opostos um ao outro, ambos são usados ​​em estatísticas e análises de regressão, a covariância nos mostra como as duas variáveis ​​variam entre si, enquanto a correlação nos mostra a relação entre as duas variáveis ​​e como elas estão relacionadas .

Correlação e covariância são dois conceitos estatísticos usados ​​para determinar a relação entre duas variáveis ​​aleatórias. A correlação define como uma mudança em uma variável afetará a outra, enquanto a covariância define como dois itens variam juntos. Está confuso? Vamos mergulhar mais fundo para entender a diferença entre esses termos intimamente relacionados.

O que é covariância?

A covariância mede como duas variáveis ​​se movem em relação uma à outra e é uma extensão do conceito de variância (que mostra como uma única variável varia). Pode assumir qualquer valor de -∞ a + ∞.

  • Quanto maior esse valor, mais dependente é o relacionamento. Um número positivo significa covariância positiva e denota que existe uma relação direta. Efetivamente, isso significa que um aumento em uma variável também levaria a um aumento correspondente na outra variável, desde que outras condições permaneçam constantes.
  • Por outro lado, um número negativo significa covariância negativa que denota uma relação inversa entre as duas variáveis. Embora a covariância seja perfeita para definir o tipo de relacionamento, é ruim para interpretar sua magnitude.

O que é correlação?

A correlação está um passo à frente da covariância, pois quantifica a relação entre duas variáveis ​​aleatórias. Em termos simples, é uma medida unitária de como essas variáveis ​​mudam entre si (valor de covariância normalizado).

  • Ao contrário da covariância, a correlação tem um limite superior e inferior em um intervalo. Só pode assumir valores entre +1 e -1. Uma correlação de +1 indica que as variáveis ​​aleatórias têm uma relação direta e forte.
  • Por outro lado, a correlação de -1 indica que existe uma forte relação inversa e um aumento em uma variável levará a uma diminuição igual e oposta na outra variável. 0 indica que os dois números são independentes.

Fórmula para covariância e correlação

Vamos expressar esses dois conceitos matematicamente. Para duas variáveis ​​aleatórias A e B com valores médios como Ua e Ub e desvio padrão como Sa e Sb respectivamente:

Efetivamente, a relação entre os 2 pode ser definida como:

Ambas as correlações e covariâncias encontram aplicação nos campos da análise estatística e financeira. Visto que a correlação padroniza o relacionamento, é útil na comparação de quaisquer duas variáveis. Isso ajuda o analista a desenvolver estratégias como pair trade e hedging, não apenas para retornos eficientes da carteira, mas também para salvaguardar esses retornos em termos de movimentos adversos no mercado de ações.

Infográficos de correlação vs covariância

Vamos ver a principal diferença entre correlação e covariância.

Principais diferenças

  • A covariância é um indicador do grau em que duas variáveis ​​aleatórias mudam uma em relação à outra. A correlação, por outro lado, mede a força dessa relação. O valor da correlação é limitado na parte superior por +1 e na parte inferior por -1. Portanto, é um intervalo definido. No entanto, a faixa de covariância é indefinida. Pode assumir qualquer valor positivo ou negativo (teoricamente, o intervalo é de -∞ a + ∞). Você pode ter certeza de que uma correlação de .5 é maior do que .3 e o primeiro conjunto de números (com correlação de .5) são mais dependentes um do outro do que o segundo conjunto (com correlação de .3) A interpretação de tal resultado seria ser muito difícil de cálculos de covariância.
  • A mudança de escala afeta a covariância. Por exemplo, se o valor de duas variáveis ​​for multiplicado por constantes semelhantes ou diferentes, isso afetará a covariância calculada desses dois números. No entanto, aplicando o mesmo mecanismo de correlação, a multiplicação por constantes não altera o resultado anterior. Isso ocorre porque uma mudança de escala não afeta a correlação.
  • Ao contrário da covariância, a correlação é uma medida livre de unidade da interdependência de duas variáveis. Isso torna mais fácil para os valores de correlação calculados serem comparados em quaisquer 2 variáveis, independentemente de suas unidades e dimensões.
  • A covariância pode ser calculada para apenas 2 variáveis. A correlação, por outro lado, pode ser calculada para vários conjuntos de números. Outro fator que torna a correlação desejável para analistas em relação à covariância.

Covariância vs Tabela Comparativa de Correlação

BaseCovariânciaCorrelação
SignificadoA covariância é um indicador da extensão em que 2 variáveis ​​aleatórias são dependentes uma da outra. Um número maior denota dependência maior.A correlação é um indicador de quão fortemente essas 2 variáveis ​​estão relacionadas, desde que outras condições sejam constantes. O valor máximo é +1 denotando um relacionamento dependente perfeito.
RelaçãoA correlação pode ser deduzida da covariânciaA correlação fornece uma medida de covariância em uma escala padrão. É deduzido dividindo a covariância calculada com o desvio padrão.
ValoresO valor da covariância está na faixa de -∞ e + ∞.A correlação é limitada a valores entre -1 e +1.
EscalabilidadeAfeta a covariânciaA correlação não é afetada por uma mudança nas escalas ou multiplicação por uma constante.
UnidadesA covariância tem uma unidade definida, pois é deduzida pela multiplicação de dois números e suas unidades.A correlação é um número absoluto sem unidade entre -1 e +1, incluindo valores decimais.

Conclusão

A correlação e a covariância estão intimamente relacionadas entre si e, no entanto, diferem muito. A covariância define o tipo de interação, mas a correlação define não apenas o tipo, mas também a força dessa relação. Devido a esta razão, a correlação é freqüentemente denominada como o caso especial de covariância. No entanto, se for necessário escolher entre os dois, a maioria dos analistas prefere a correlação, pois ela não é afetada pelas mudanças nas dimensões, locais e escala. Além disso, como é limitado a um intervalo de -1 a +1, é útil fazer comparações entre as variáveis ​​entre os domínios. No entanto, uma limitação importante é que ambos os conceitos medem a única relação linear.