IDENTIFICAÇÃO DO DISCURSO DE ÓDIO DE CUNHO HOMOFÓBICO A PARTIR DE MÉTODOS DE APRENDIZADOS DE MÁQUINAS
Aprendizado de máquina
Mineração de texto
Twitter (Rede social on-line)
Discurso de ódio
Homofobia
Abstract
O objetivo deste estudo é definir, por técnicas de Aprendizado de Máquinas, um classificador de discurso de ódio de cunho homofóbico para postagens na rede social Twitter. A base de dados utilizada é composta por tweets relacionados ao tema e foi utilizado técnicas de mineração de texto e e de pré-processamento para preparar esses dados para realizar classificações. Serão utilizadas técnicas de balanceamento da base dados como undersampling, oversampling e SMOTEENN. Dois tipos de vetorização serão analisadas: Matriz Termo Documento e TF-IDF. Para a classificação serão realizados modelos de Floresta Aleatória e Extreme Gradient Boosting (XGBoost). Ao todo, foram realizados 24 modelos no trabalho, e os modelos que obtiveram um melhor resultado foram os modelos que foram treinados com um balanceamento pela técnica de undersampling. Dentre esses modelos, os modelos de Floresta Aleatória realizados com vetorização de Matriz Termo Documento tiveram melhores resultados de sensibilidade, com uma média de 84,14%. Já os modelos de XGBoost apresentaram uma média na sensibilidade de 75,96%.
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoSource
AUGUSTO, João Pedro Cigliato. Identificação do discurso de ódio de cunho homofóbico a partir de métodos de Aprendizados de Máquinas. 2023. 44 f. Trabalho de Conclusão de Curso (graduação em ) - Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2023.Subject(s)
Aprendizado de máquina. Mineração de texto. Discurso de ódio. HomofobiaAprendizado de máquina
Mineração de texto
Twitter (Rede social on-line)
Discurso de ódio
Homofobia