Analisando dados do PROUNI
site dos dados : http://dados.gov.br/dataset/mec-prouni
Apos carregas nossas bibliotecas importamos os arquivos do site dados.gov.br
Lista das 5 primeiras bolsas de 2016
Exibimos a quantidade de amostras de cada arquivo com o metodo len():
Plotamos o gráfico para visualizar estes dados:
temos então um aumento gradual em bolsas do Prouni, no decorrer do período, nosso próximo passo e olhar os títulos das colunas destes dados, lembrando sempre que nossa meta e a busca por Tendências Futuras.
Olhando as colunas dos dataSets já percebemos alguns dados qualitativos bem interessantes para analisar tendências:
temos uma coluna que fala sobre vagas para deficientes, este dado e uma entrada booleana onde foi respondido verdadeiro ou falso, o sistemas retorna em OUT as quantidades, vamos ver sua proporção em relação aos conjuntos de dados, sempre e bom exibirmos o primeiro e o ultimo elemento das mostras, neste caso 2005 e 2016. O metodo value_counts() faz a contagem de quantas vezes cada escolha aparece na coluna 'BENEFICIARIO_DEFICIENTE_FISICO'
para uma analise mais ampla, é sembre recomendado sua apresentação em porcentagem, uso este algoritimo simples, ele recebe como parâmetro o valor total e o valor de cada extração e retorna a porcentagem da extração referente ao valor total veja seu funcionamento em out[16]:
Usamos esta função pare apresentar as porcentagens de bolsas para deficientes físicos:
em in[24] temos os dados de 2016, 0,73% de vagas são para deficientes, tentei verificar estes dados na internet, encontrei alguns sites falando da falta de clareza do edital Prouni para vagas destinadas a deficientes. o argumento .plot() chama o gráfico do tipo 'barh' e o argumento rcParams['figure.figsize'] =(5,2) configura o tamanho de exibição do gráfico.
Vamos Agora dar uma olhada nas vagas de ensino a distância, diversos estudos informam que a modalidade EAD e uma tendência para os próximos anos, vamos ver se esta tendência esta sendo seguida nas solicitações de bolsas pelos alunos.
vemos um aumento bem significativo de bolsas EAD entre as amostras do Prouni 2005 e 2016
Agora vamos dar uma olhada nos 5 cursos com mais solicitações de bolsas, será que tivemos mudanças nas preferências dos cursos durante o período?
Não vemos mudanças significativas nas preferências dos alunos durante o período, já entre os 50 primeiros cursos escolhidos entre 2005 e 2016 tivemos um aumento de 18% nas buscas por cursos de Saude e 15% de aumento nos cursos de TI e Engenharias.
Temos outro estudo que falam que as mulheres estão estudando mais que os homens, vamos dar uma olhada no sexo dos estudantes que solicitaram bolsas do Prouni neste período.
Apesar da distância está diminuindo, vemos que as mulheres ainda estão solicitando mais bolsas que os homens.
Esta próxima me surpreendeu, ao fazer a solicitação de bolsa e perguntado a raça, vamos ver as respostas de 2005 e 2016
A 1ª observação e sobre aqueles que não informaram sua raça, veja que em 2005 quase 25.000 não informarão sua raça ja em 2016 este numero foi proximo de 0, outra observação que me chamou a atenção foi que em 2005 a maioria se declarou branca, já em 2016 a maioria se declarou parda, isso me parece uma tendência de que estamos aceitando mais nossa miscigenação.
Vamos dar uma olhada no agrupamento de raças por Região no ano de 2016
Vamos agora olhar as solicitações por Região.
Entre 2005 e 2016 vemos apenas uma alternância entre o 2° e o 3° lugar, onde o Nordeste substitui o Sul.
site dos dados : http://dados.gov.br/dataset/mec-prouni
O Programa Universidade para Todos - Prouni tem como finalidade a concessão de bolsas de estudo integrais e parciais em cursos de graduação e sequenciais de formação específica, em instituições de ensino superior privadas que oferece, em contrapartida, isenção de tributos as instituições parceiras do Programa.
Como podemos ver no site dados.gov.br, eles disponibilizam dados entre 2005 e 2016.
Busco sempre iniciar com um objetivo especifico, isso evita perca de tempo, neste caso nosso objetivo e bem simples, Buscar as tendências, ou seja no decorrer destes 11 anos houveram mudanças?, caso sim, quais foram?
Dentro do universo de anos apresentado escolhemos aleatoriamente 5 amostras para nossa analise de tendências:
Anos escolhidos 2005 -2008-2010-2013- 20016
Apos carregas nossas bibliotecas importamos os arquivos do site dados.gov.br
Lista das 5 primeiras bolsas de 2016
Plotamos o gráfico para visualizar estes dados:
temos então um aumento gradual em bolsas do Prouni, no decorrer do período, nosso próximo passo e olhar os títulos das colunas destes dados, lembrando sempre que nossa meta e a busca por Tendências Futuras.
Olhando as colunas dos dataSets já percebemos alguns dados qualitativos bem interessantes para analisar tendências:
temos uma coluna que fala sobre vagas para deficientes, este dado e uma entrada booleana onde foi respondido verdadeiro ou falso, o sistemas retorna em OUT as quantidades, vamos ver sua proporção em relação aos conjuntos de dados, sempre e bom exibirmos o primeiro e o ultimo elemento das mostras, neste caso 2005 e 2016. O metodo value_counts() faz a contagem de quantas vezes cada escolha aparece na coluna 'BENEFICIARIO_DEFICIENTE_FISICO'
para uma analise mais ampla, é sembre recomendado sua apresentação em porcentagem, uso este algoritimo simples, ele recebe como parâmetro o valor total e o valor de cada extração e retorna a porcentagem da extração referente ao valor total veja seu funcionamento em out[16]:
Usamos esta função pare apresentar as porcentagens de bolsas para deficientes físicos:
em in[24] temos os dados de 2016, 0,73% de vagas são para deficientes, tentei verificar estes dados na internet, encontrei alguns sites falando da falta de clareza do edital Prouni para vagas destinadas a deficientes. o argumento .plot() chama o gráfico do tipo 'barh' e o argumento rcParams['figure.figsize'] =(5,2) configura o tamanho de exibição do gráfico.
Vamos Agora dar uma olhada nas vagas de ensino a distância, diversos estudos informam que a modalidade EAD e uma tendência para os próximos anos, vamos ver se esta tendência esta sendo seguida nas solicitações de bolsas pelos alunos.
vemos um aumento bem significativo de bolsas EAD entre as amostras do Prouni 2005 e 2016
Agora vamos dar uma olhada nos 5 cursos com mais solicitações de bolsas, será que tivemos mudanças nas preferências dos cursos durante o período?
Não vemos mudanças significativas nas preferências dos alunos durante o período, já entre os 50 primeiros cursos escolhidos entre 2005 e 2016 tivemos um aumento de 18% nas buscas por cursos de Saude e 15% de aumento nos cursos de TI e Engenharias.
Temos outro estudo que falam que as mulheres estão estudando mais que os homens, vamos dar uma olhada no sexo dos estudantes que solicitaram bolsas do Prouni neste período.
Apesar da distância está diminuindo, vemos que as mulheres ainda estão solicitando mais bolsas que os homens.
Esta próxima me surpreendeu, ao fazer a solicitação de bolsa e perguntado a raça, vamos ver as respostas de 2005 e 2016
A 1ª observação e sobre aqueles que não informaram sua raça, veja que em 2005 quase 25.000 não informarão sua raça ja em 2016 este numero foi proximo de 0, outra observação que me chamou a atenção foi que em 2005 a maioria se declarou branca, já em 2016 a maioria se declarou parda, isso me parece uma tendência de que estamos aceitando mais nossa miscigenação.
Vamos dar uma olhada no agrupamento de raças por Região no ano de 2016
Vamos agora olhar as solicitações por Região.
Entre 2005 e 2016 vemos apenas uma alternância entre o 2° e o 3° lugar, onde o Nordeste substitui o Sul.