[MÚSICA] Olá!
Dando continuidade ao módulo
"Inferindo Propriedades e Características de uma População",
a lição de hoje será sobre análise de regressão.
No inicio desse módulo nós
aprendemos como realizar teste de hipótese e interpretar
coeficientes no nível de significância desses coeficientes estimados.
Na sequência nós aprendemos também como
funciona a correlação, a associação entre variáveis.
Nessa videoaula nós vamos endereçar a questão da causalidade.
O quanto que uma variável leva a outra,
por exemplo o quanto que promoção no ponto de
venda leva a aumento de vendas verdadeira.
Para a gente conseguir aprofundar em análise de regressão,
eu chamo a atenção para essa representação gráfica.
Nós temos ali uma ação no ponto de vendas no eixo x e vendas no eixo y.
Essa ação no ponto de vendas pode ser display,
pode ser uma ilha ou uma ponta de gôndola que por ventura uma determinada marca
você venha a comprar e vendas é o quanto de produto
que foi alvo daquela ação foi vendido naquele período.
Então pensando nos consumidores será que existe
alguma relação causal entre ação no ponto de venda
e vendas e como a gente viu na aula de correlação
aqui a dispersão dos dados nesse
diagrama ele nos indica que existe uma relação positiva.
Se a gente fosse apenas concentrar em
correlação eu diria para vocês que nós temos aqui uma correlação positiva.
Se a gente quer aprofundar e testar a hipótese de que a ação no ponto
de venda afeta vendas eu tenho que utilizar a análise de regressão.
Eu poderia inclusive ter aí uma curva que, de tendência,
que iria na direção ali do canto inferior esquerdo para o canto superior direito,
mostrando que a minha ação foi deveras de sucesso,
ou seja afetou positivamente vendas.
Na análise de regressão
existem 2 elementos bastante importantes de serem considerados logo no início:
o primeiro deles é a variável dependente e o segundo deles é a variável independente.
A variável dependente é aquela que é a resposta a algum determinado efeito,
é aquela que a gente quer explicar o comportamento dela.
A variável independente é a variável que explica
essa variável de resposta,
que pode ser qualquer tipo de fator ou ação que eu coloque
no mercado a fim de afetar essa variável de resposta.
Então de lado eu tenho a variável independente e do outro eu tenho
a variável dependente.
O quanto que essa variável afeta essa outra basicamente é isso que a gente faz
com a análise de regressão.
Eu tenho y e eu tenho x e o que eu quero é cruzar e saber se
essa variável x afeta a variável y.
Como é que a gente ajusta a reta?
A gente viu lá que na dispersão dos dados eventualmente
a gente é capaz de traçar uma curva de tendência.
Como é que a gente chega nessa curva de tendência?
Basicamente nós vamos buscar construir uma equação
onde y é igual ao a mais b x.
Muito bem, eu sei o que é y, eu já sei, eu sei o que é y e eu sei o que é x,
agora o que seriam a e b?
a e b são parâmetros que são estimados dada a variação,
o comportamento, que existe entre essas duas variáveis.
Onde a nada mais é do que o intercepto onde essa
curva de tendência toca o eixo y e b é o coeficiente que
nos informa a inclinação dessa curva.
Então eu vou a campo,
coleto os dados de y, coleto os dados de x com base
nesses dados eu volto para o escritório e
eu estimo esses parâmetros a e b.
Muito bem, se a gente pegasse exemplo
básico de investimento em comunicação,
o efeito de investimento em comunicação como a nossa variável independente
afetando a receita em vendas,
uma variável de resposta ou seja dependente, eu posso coletar
os dados e encontrar uma equação com os
seguintes coeficientes: nós temos lá parâmetro,
ou seja coeficiente estimado que é onde a curva toca o intercepto,
que nesse caso aqui é 60,05
e nós temos também uma ideia de inclinação dessa
curva com base no coeficiente 1,36.
Coeficiente este que é positivo,
isso significa que a tendência desta curva é uma
tendência positiva: comunicação, os investimentos que
eu faço em comunicação afetam a minha receita em vendas.
O interessante é que a análise de regressão nos permite também inferir
sobre o poder de explicação do conjunto de variáveis que eu coloco no modelo.
Então no caso nós estamos considerando apenas investimento em
comunicação como variável x, eu poderia ter outras variáveis
que eu gostaria de testar ao mesmo tempo se afetam vendas.
A medida conhecida como R quadrado
é uma medida que nos informa sobre o poder
de explicação daquele conjunto de variáveis que eu utilizei no modelo.
Significa que quanto mais variáveis,
ou seja fatores que afetam vendas, forem considerados na
minha análise de regressão, é esperado que o R quadrado,
ou seja o poder de explicação desse conjunto de variáveis aumente.
De posse da equação e os coeficientes estimados
eu consigo já de cara fazer já algumas inferências.
Por exemplo, quanto seria a venda se eu
não gastasse tostão com ação de comunicação?
Dada a amostra, os dados que eu coletei,
eu posso afirmar que as vendas seriam na casa de 60,05.
Ou seja se eu não gastar dinheiro com promoção existem
outros fatores que estão afetando vendas e haveriam vendas, muito bem,
que nada mais é do que o nosso coeficiente estimado a naquela
equação onde y é igual a a mais b x.
Muito bem, uma outra inferência que eu sou capaz de fazer é que se eu variar
uma unidade de investimento em comunicação, seja lá qual for
essa unidade, eu terei uma variação média de receitas de 1,36.
1,36 nada mais é, como você pode bem observar,
o nosso parâmetro estimado b.
Então se eu variar uma unidade de
comunicação eu consigo variar receita em 1,36.
Essas são inferências importantes
de serem feitas logo no início porque já nos
dá alguma ideia de como o mercado se comporta dada essas duas variáveis,
se eu fizer alguma ação de comunicação quanto é que eu vou conseguir vender.
Muito bem, quanto seria as vendas se
o financeiro nos abordasse e pedisse para gastar menos?
Eu convido vocês a pegar essa equação estimada
e calcular a venda se o nosso
investimento fosse na casa de 600 reais, 600 mil reais.
Muito bem, vocês tiveram a oportunidade de fazer a conta de
qual seria a receita prevista dada a restrição de orçamento.
A restrição de orçamento foi imposta em 600 reais.
O que a gente vai fazer agora é utilizar a equação que foi estimada com base
na pesquisa que nos informa que o y que é a nossa variável de resposta é igual ao a,
que é o parâmetro 60,05 mais o b,
que é o parâmetro do x, que é 1,36,
o que a gente precisa fazer é justamente substituir o x por 600.
Multiplica por 1,36, soma de 60,05 e aí
a gente tem uma receita prevista de 876,05.
Com base nessa informação a gente pode voltar para o financeiro e eventualmente
até pleitear orçamento mais elevado uma vez que o mercado,
a gente realizou a pesquisa, o mercado nos permite aí receber uma receita
talvez até maior do que aquela prevista pelo pessoal da área financeira.
Eu convido vocês agora a olhar a próxima videoaula onde nós faremos
uma aplicação prática dessa análise, onde levaremos em consideração não apenas uma
variável mas conjunto de variáveis que podem explicar, por exemplo vendas.
Incluindo por exemplo a, o preço ou a promoção que concorrente
pode realizar ao mesmo tempo que nós estamos fazendo a nossa ação.
[SEM ÁUDIO]