Multicolinearidade

O que é multicolinearidade?

Multicolinearidade é um fenômeno estatístico no qual duas ou mais variáveis ​​em um modelo de regressão são dependentes das outras variáveis ​​de tal forma que uma pode ser prevista linearmente a partir da outra com um alto grau de precisão. É geralmente usado em estudos observacionais e menos popular em estudos experimentais.

Tipos de multicolinearidade

Existem quatro tipos de multicolinearidade

  • # 1 - Multicolinearidade perfeita - Existe quando as variáveis ​​independentes na equação predizem a relação linear perfeita.
  • # 2 - Alta Multicolinearidade - Refere-se à relação linear entre duas ou mais variáveis ​​independentes que não estão perfeitamente correlacionadas entre si.
  • # 3 - Multicolinearidade estrutural - é causada pelo próprio pesquisador ao inserir diferentes variáveis ​​independentes na equação.
  • # 4 - Multicolinearidade baseada em dados - É causada por experimentos mal elaborados pelo pesquisador.

Causas da multicolinearidade

Variáveis ​​independentes, mudança nos parâmetros das variáveis ​​fazem que uma pequena mudança nas variáveis ​​haja um impacto significativo no resultado e as coletas de dados referem-se à amostra da população selecionada sendo tomada.

Exemplos de multicolinearidade

Exemplo 1

Vamos supor que a ABC Ltd a KPO foi contratada por uma empresa farmacêutica para fornecer serviços de pesquisa e análise estatística sobre as doenças na Índia. Para isso, o ABC ltd selecionou idade, peso, profissão, altura e saúde como os parâmetros prima facie.

  • No exemplo acima, há uma situação de multicolinearidade, pois as variáveis ​​independentes selecionadas para o estudo estão diretamente correlacionadas aos resultados. portanto, seria aconselhável para o pesquisador ajustar as variáveis ​​primeiro antes de iniciar qualquer projeto, uma vez que os resultados serão diretamente impactados por causa das variáveis ​​selecionadas aqui.

Exemplo # 2

Vamos supor que a ABC Ltd foi nomeada pela Tata Motors para entender que o volume de vendas dos motores tata será alto em qual categoria no mercado.

  • No exemplo acima, primeiramente as variáveis ​​independentes serão finalizadas com base nas quais a pesquisa precisa ser concluída. pode ser renda mensal, idade. marca, a classe baixa. Significa apenas que serão selecionados os dados que cabem em todas essas guias, a fim de descobrir quantas pessoas podem comprar este carro (tata nano) sem nem mesmo olhar para nenhum outro carro.

Exemplo # 3

Vamos supor que a ABC Ltd foi contratada para enviar um relatório para saber quantas pessoas com menos de 50 anos são propensas a ataques cardíacos. para isso, os parâmetros são idade, sexo, histórico médico

  • No exemplo acima, há multicolinearidade que surgiu porque a variável independente “idade” precisa ser ajustada para idade abaixo de 50 para convidar inscrições do público para que as pessoas com mais de 50 anos sejam automaticamente filtradas.

Vantagens

Abaixo estão algumas das vantagens

  • Relação linear entre as variáveis ​​independentes na equação.
  • Muito útil em modelos estatísticos e relatórios de pesquisa preparados por empresas baseadas em pesquisas.
  • Impacto direto no resultado desejado.

Desvantagens

Abaixo estão algumas das desvantagens

  • Em algumas das situações, esse problema seria resolvido coletando mais dados sobre as variáveis.
  • Uso incorreto de variáveis ​​dummy, ou seja, o pesquisador pode esquecer de usar as variáveis ​​dummy sempre que necessário.
  • Inserindo 2 variáveis ​​iguais ou idênticas na equação, como kg e lbs em pesos.
  • Inserindo uma variável na equação que é uma combinação de 2.
  • É complicado realizar cálculos, pois é a técnica estatística e requer calculadoras estatísticas para fazer a execução.

Conclusão

A multicolinearidade é uma das ferramentas estatísticas mais favorecidas, frequentemente usadas em análises de regressão e análises estatísticas para grandes bancos de dados e a saída desejada. Todas as grandes empresas possuem um departamento estatístico separado na empresa para realizar análises de regressão estatística sobre produtos ou pessoas, a fim de fornecer uma visão estratégica do mercado para a gestão e também ajudá-los a traçar suas estratégias de longo prazo tendo essa mente. A apresentação gráfica da análise dá ao leitor uma imagem clara da relação direta, precisão e desempenho.

  • Se o objetivo do pesquisador é entender as variáveis ​​independentes da equação, a multicolinearidade será um grande problema para ele.
  • O próprio pesquisador precisa fazer as mudanças necessárias nas variáveis ​​no estágio 0, ou então pode ter um impacto enorme nos resultados.
  • A multicolinearidade pode ser feita examinando a matriz de correlação.
  • As medidas corretivas desempenham um papel significativo na solução dos problemas de multicolinearidade.