ELABORAÇÃO DE MODELO DE PREVISÃO DA EVASÃO UNIVERSITÁRIA NA UNIVERSIDADE FEDERAL FLUMINENSE ATRAVÉS DE MÉTODOS DE APRENDIZADO DE MÁQUINA
Aprendizado de máquina
Evasão universitária
Ensino superior
Aprendizado de máquina
Evasão escolar
Universidade Federal Fluminense
Data science
Machine learning
Random fores
University dropout
Higher education
Gomes, Lucca Bevilacqua | Posted on:
2021
Abstract
A evasão universitária é um tema importante para a educação, sobretudo pública. Ela impacta
diversos grupos da sociedade. Entre os principais afetados é possível pensar nos discentes, na
instituição de ensino, o mercado de trabalho e os corpos de pesquisa acadêmica. A evasão é
uma questão multifacetada e complexa. Estas características dificultam abordagens práticas pra
auxiliar a tomada de decisão de instituições para evitar que alunos evadam. No entanto, os
avanços na tecnologia e nos campo da Ciência de Dados e Aprendizado de Máquina habilitaram
pesquisadores ao redor do mundo a considerar algumas das variáveis relacionadas à questão em
modelos preditivos. Estes modelos capacitam decisores com mais informações para tomarem
melhores decisões. No Brasil, no entanto, esta prática ainda não é extensivamente explorada,
principalmente com dados abertos ao invés de dados internos das Instituições de Ensino
Superior (IES). Nesse sentido, o presente trabalho tem como objetivo de explorar a
possibilidade de prever a evasão de alunos da graduação da Universidade Federal Fluminense
(UFF), uma IES pública, a a partir de métodos de Aprendizado de Máquina. Além disso,
verificou-se a viabilidade de se usar dados públicos abertos ao invés de dados administrativos
dos sistemas internos da instituição. Para isso, foram utilizados os dados e microdados do Censo
do Ensino Superior, divulgado todo ano pelo INEP, associado ao Ministério de Educação e
Cultura do Brasil. Os dados foram processados e explorados com a linguagem de programação
Python. A abordagem de previsão central foi a partir de árvores de decisão onde se comparam
uma árvore que utilizava o algoritmo CART, e os métodos agregadores (ensembles) de árvores
AdaBoost e Random Forest. O Método de Random Forest trouxe os melhores resultados,
apresentando um AUC Score da curva PR de 0,853 contra um AUC de 0,353 de um modelo
dummy. Seu Recall foi de 69,8% e acurácia (accuracy) foi de 84%. Este valor de acurácia foi
considerado satisfatório quando comparado com resultados de outros trabalhos e considerando
a natureza e o escopo dos dados utilizados. Também é possível concluir que este tipo de
modelagem poderia ser extendida para outras IES no censo, uma vez que foram utilizados dados
comuns a todas as instituições do censo
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoSource
GOMES, Lucca Bevilacqua. Elaboração de modelo de previsão da evasão universitária na Universidade Federal Fluminense através de métodos de aprendizado de máquina. 2021. 94 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Produção) - Universidade Federal Fluminense, Niterói, 2021.Subject(s)
Ciência de dadosAprendizado de máquina
Evasão universitária
Ensino superior
Aprendizado de máquina
Evasão escolar
Universidade Federal Fluminense
Data science
Machine learning
Random fores
University dropout
Higher education
License Term
CC-BY-SAThe following license files are associated with this item: