GRADIENT BOOSTING PARA PREDIÇÃO DA NOTA DO ENEM ATRAVÉS DE INDICADORES SOCIOECONÔMICOS
Árvore de decisão
Aprendizado de máquina
Modelo estatístico
Abstract
Neste trabalho, utilizamos o método de Gradient Boosting, uma técnica que melhora o desempenho de modelos de Árvores de Decisão, para estimar as notas dos estudantes no Exame Nacional do Ensino Médio (ENEM) através de variáveis socioeconômicas. Um dos objetivos é identificar as variáveis mais influentes na predição das notas, além de compreender o impacto de diferentes fatores no desempenho dos alunos. Nos modelos de regressão, destinados a estimarem as notas para cada uma das áreas, observamos que o modelo de Gradient Boosting não apresentou resultados satisfatórios. Os coeficientes de determinação para Ciências da Natureza, Ciências Humanas, Linguagens e Códigos, Matemática e Redação foram, respectivamente, 0.29, 0.23, 0.29, 0.35 e 0.29. Contudo, os modelos de classificação, destinados a prever a aprovação ou reprovação em cursos específicos da UFF e UFRJ, os resultados indicam que os modelos desenvolvidos para cada área apresentaram um bom ajuste aos dados. Para o curso de Estatística na UFF, alcançamos uma acurácia de 0.72, uma sensitividade de 0.70 e uma especificidade de 0.79. Já para o modelo de Estatística na UFRJ, os resultados foram uma acurácia de 0.74, uma sensitividade de 0.74 e uma especificidade de 0.77. O modelo de regressão não apresentou boas estimativas com modelo de Gradient Boosting, sugerindo que somente dados socioeconômicos não são suficientes para predizer as notas. No entanto, no modelo de classificação os resultados sugerem que os modelos de Gradient Boosting foram capazes de fornecer boas estimativas a aprovação ou não em diferentes cursos.
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoSource
BARREIROS, Victória Medeiros. Gradient Boosting para predição da nota do Enem através de indicadores socioeconômicos. 2023. 67 f. Trabalho de Conclusão de Curso (graduação em Estatística) - Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2023.Subject(s)
Árvores de decisão. Gradient boosting. ENEM. Aprendizado de máquinasÁrvore de decisão
Aprendizado de máquina
Modelo estatístico