Analisando usuários de site de venda

Experimento:

Observar o comportamento do usuários em um site de venda online, comparar os usuários  Mobile x Desktop.
Método: Retirar 2 amostras independentes de usuários que entraram no site. 
Período de coleta de dados : 24 hs

Variáveis acompanhadas:
VALOR DA VENDA = O valor vendido para aquele usuário
TEMPO DE NAVEGAÇÃO (min) = os minutos que o usuário esteve em nosso site nas ultimas 24h
CLIQUES  NA PAGINA= Todos os cliques na pagina, seja para login, pesquisa de produto ou efetuar a compra
RETORNO = Quantas vezes o IP(computador) deixou nosso servidor(site) e retornou para nosso dominio. 

Valores médios esperados pela loja:
VALOR DA VENDA = R$420
TEMPO DE NAVEGAÇÃO (min) = 22min
CLIKS NA PAGINA= 30
RETORNO = 4

Segue o relatório abaixo:

O Algorítimo mais comum para que vai analisar estes dados e:
1: Separar por dispositivos;
Como todas as variáveis depois de Dispositivo são quantitativas 
2: Efetuamos a soma das colunas 3,4,5,6;
3:Tirarmos a media das colunas 3,4,5,6;
4: Gerar gráfico comparativo;.
5:Fazer a analise;

Vamos executar estes passos:

Analise:
 O dispositivo moveis são maioria em nossas conexões, mas os dispositivos fixos como notebooks e computadores de mesa são preferido por eles na hora da compra..

Para muitos o trabalho fica por aqui, ai e onde entra o cientista de dados, pois ele tem a consciência de que dados possuem uma história por traz, perceba que não analisamos o cruzamento de informações, comparamos cliques com cliques e valor da compra com valor da compra  
Vamos usar o gráfico de Dispersão, se você ainda não sabe ler um gráfico de dispersão clique  aqui para aprender em poucos minutos e depois volte para o exercício.. 

Vamos analisar a dispersão dos dados, cruzando 2 variáveis, Valor da venda x tempo no Site, as retas laranja representam as medias para cada variável o eixo Y(vertical) representa a variável que queremos saber se e influenciada pela do eixo X(horizontal) neste caso quero saber se o tempo que o usuário fica no site(eixo x) influencia no valor da sua compra(eixo y)


Após um pouco de treino e possível tirar algumas conclusões desta dispersão, mas antes vamos inserir as retas amarelas representando as medias esperadas pelos responsáveis do site.

Valores médios esperados Linhas amarelas:
VALOR DA VENDA = R$420
TEMPO DE NAVEGAÇÃO (min) = 22min



Analise Comparativa Tempo no site x Valor da venda :

1°-Usuário em geral, não são influenciados a comprar pelo tempo que passam no site,
 porém aqueles que comprem valores maiores tendem a passar mais tempo no site. 

2°-A taxa de usuários que simplesmente navega mas não compra nada e aparentemente a
mesma nos 2 tipos de dispositivos cerca de 30%

3°- Nossa meta de tempo de navegação de 22 min e insuficiente para as 2 plataformas, 

4°-Mobiles em sua  maioria ficam entre 20 e 60 min no site, desktop não e possível visualizar uma concentração em alguma faixa de tempo

5° - compras por impulso ou compras rápidas tempo <= 20 min são mapeadas em desktop e para produtos com o preço menor que 400
    
Vamos dar uma olhada na correlação entre tempo de site e valor gastos, se você ainda não entende a correlação clique aqui

Desktop = 0,14
Mobile = 0,40

Estes números significam que a compra não e influenciada pelo tempo de navegação, 
Hipótese: as pessoas já entram nesta loja virtual  decididas a comprar e gastam o seu tempo apenas na pequisa pelo produto.

Viram quantas informações conseguimos retirar analisando apenas a relação entre tempo logado no site e o valor da compra, o caminho agora e fazer isso com outras variáveis e testar sua leitura do gráfico de dispersão.

Lembrando : nossa analise busca encontrar variáveis que influenciam no nosso lucro, logo
como só tenho uma variável ligada ao lucro ( Valor da venda) indico deixá-la sempre no eixo Y Vertical, e colocamos a variável que achamos influenciar no lucro no eixo x = horizontal.

Vamos ver agora se a quantidade de vezes que os usuários retornam ao nosso site influenciam na venda

Valor da venda x Retorno ao site
Lembrando que as retas amarelas são a nossa expectativa, e as vermelhas são as medias da amostra.




Analise Inicial
-Pessoas que compram valores mais alto tendem a antrar e sair mais do site
-Elas  retornam mais nos dispositivos moveis
   hipótese do desenvolvedor do site: acredito que no desktop seja mais fácil trabalhar com abas
-Atenção nos pontos que entraram varias vezes e não compraram nada, pois podem ser possíveis compradores de produtos caros.

As correlações de 0,71 e 0,73 nos informam que existe sim uma ligação moderada entre o retorno de usuários e a comprar, o que pode indicar que nossos preços estão atrativos.

Reparou que a analise de dados quantitativos usando sua dispersão se torna muito mais rica, pois com um pouco de treino e entendendo das regras no qual os testes são feitos
e positivável inferir hipóteses realmente interessante, lembrando que estas hipóteses também precisam ser testadas,  pois a amostra e de apenas 1 dia de comportamento do site, e preciso uma amostra muito mais ampla para tirar conclusões, mas a técnica permanece a mesma.

para criar os gráficos de dispersão indico o R ou o Excel, neste tutorial usei o Excel.

indico este tutorial para rapidamente criar seus graficos e sair treinando
https://www.youtube.com/watch?v=Z7NkxhbE1TI