códigos da analise:
https://github.com/MarcoAurello/Estudo-DataSets/blob/master/analise%20curso%20UEP%20site%20senac%202018.ipynb
Sabemos que para compor o preço de um produto ou serviço devemos levantar algumas variáveis. Custo com insumos, deslocamento, energia elétrica, aluguel, em fim, são varias coisas que temos que analisar para decidir qual será o preço aplicado em determinado produto ou serviço.
Podemos usar a ciência de dados para pular esta etapa e buscar através de um levantamento de mercado gerar formulas para prever preços para novos produtos ou serviços.
Desejo compor o preço para um novo curso, para isso uso uma ferramenta para extrair todos os cursos cadastrados na pagina abaixo.
http://www.pe.senac.br/unidades/recife/unidade-de-educacao-profissional-do-recife/
Minha intenção e capturar as áreas em vermelho.
Colocamos estas informações em uma planilha do Excel e salvo em formato csv.
Abaixo os passos para abrir o arquivo no jupyter notebook.
Como mostra o método len() acima, temos 59 cursos na base de dados.Com o método corr() vemos uma correlação dos dados quantitativos para saber se as variaveis tem influências entre si.
Vemos uma correlação de 0.961 entre o preço e a carga horária, isso significa que 96% do preço e influenciado pela carga horária, vamos dar uma olhada no comportamento destas 2 variáveis.Como as colunas que quero mostrar são as colunas 3 e 7, uso a função drop() para excluir as outras colunas que não me interessam
Não e segredo que quanto maior a carga horária maior será o preço do curso, esta informação e muito importante, pois significa que temos uma relação linear positiva, podemos então gerar uma dispersão e assim prever novos valores. Para gerar uma formula de ajuste do preço do seu produto ou serviço, você deve gerar uma dispersão entre as 2 colunas quantitativas com a correlação mais alta.
Vamos então gerar um gráfico de dispersão entre a carga h e o preço:
https://github.com/MarcoAurello/Estudo-DataSets/blob/master/analise%20curso%20UEP%20site%20senac%202018.ipynb
Sabemos que para compor o preço de um produto ou serviço devemos levantar algumas variáveis. Custo com insumos, deslocamento, energia elétrica, aluguel, em fim, são varias coisas que temos que analisar para decidir qual será o preço aplicado em determinado produto ou serviço.
Podemos usar a ciência de dados para pular esta etapa e buscar através de um levantamento de mercado gerar formulas para prever preços para novos produtos ou serviços.
Desejo compor o preço para um novo curso, para isso uso uma ferramenta para extrair todos os cursos cadastrados na pagina abaixo.
http://www.pe.senac.br/unidades/recife/unidade-de-educacao-profissional-do-recife/
Minha intenção e capturar as áreas em vermelho.
Colocamos estas informações em uma planilha do Excel e salvo em formato csv.
Abaixo os passos para abrir o arquivo no jupyter notebook.
Como mostra o método len() acima, temos 59 cursos na base de dados.Com o método corr() vemos uma correlação dos dados quantitativos para saber se as variaveis tem influências entre si.
Vemos uma correlação de 0.961 entre o preço e a carga horária, isso significa que 96% do preço e influenciado pela carga horária, vamos dar uma olhada no comportamento destas 2 variáveis.Como as colunas que quero mostrar são as colunas 3 e 7, uso a função drop() para excluir as outras colunas que não me interessam
Não e segredo que quanto maior a carga horária maior será o preço do curso, esta informação e muito importante, pois significa que temos uma relação linear positiva, podemos então gerar uma dispersão e assim prever novos valores. Para gerar uma formula de ajuste do preço do seu produto ou serviço, você deve gerar uma dispersão entre as 2 colunas quantitativas com a correlação mais alta.
Vamos então gerar um gráfico de dispersão entre a carga h e o preço:
Vemos que a maioria dos cursos estão concentrados na área em vermelho, mapeando uma tendência de cursos de ate 250 horas com preço de ate 1200 reais.
Comprovando que existe um relacionamento linear entre as 2 variáveis podemos então gerar uma linha de melhor ajuste usando a regressão linear, usarei aqui o Excel para gerar esta regressão linear.
Encontramos então a formula para descobrir o preço de um novo curso. Y =3,833 * X +228,69
onde Y = preço e X = carga h Meu curso terá 83 horas, vamos aplicar a formula?
preço =( 3,833*83) +228,69 = R$546
Vemos la em cima que a carga horária explica 96% do preço do curso, mas e os outro 4%?
O turno, o tipo de curso, a área também influenciam do preço.
Vamos dar uma olhada nas áreas destes cursos.
Um item que pode deixar o curso mais caro são os insumos, Um curso na área de Saúde demanda vários materiais, já um curso de Gestão quase não demanda compra de materiais, podemos então melhorar nossa formula do preço se aplicarmos a regressão linear separando os cursos por áreas.
Vamos filtrar os cursos de Gestão e Saúde.
Vamos olhar as colunas preço e carga h nos 2 conjuntos:
Vamos gerar no Excel a regressão linear separadamente para os cursos de saúde e gestão
Em vermelho temos os espaços que devem ser selecionados para gerar a linha de ajuste e gerar a formula para o calculo do preço.
formulas:
Curso Saúde: preço = (3,662 * carga h) + 178,87
Curso Gestão: preço = (3,3598 * carga h) + 161,24
Vamos aplicar a formula ao nosso novo curso de 83 hs
Curso Saúde: preço = (3,662 * 83) + 178,87 = R$482,81
Curso Gestão: preço = (3,3598 * 83) + 161,24 = R$440,37
Temos então as formulas que podem basear os preços para novos cursos.
Qual e o beneficio desta técnica?
Esta técnica e infinitamente mais rápida que um estudo de preço tradicional, alem de que temos uma formula que pode ser usada para calcular o preço de vários cursos, basta saber quais variáveis devemos correlacionar.