Aviso de cookies

Neste site utilizamos cookies analíticos. Os cookies analíticos são utilizados para compreender como os visitantes interagem com o site. Eles ajudam a fornecer informações sobre métricas como número de visitantes, taxa de rejeição, origem do tráfego, etc.

  • Portal do Governo Brasileiro
    • português (Brasil)
    • English
    • español
  • English 
    • Português (Brasil)
    • English
    • Español
  • Login
          AJUDA
Pesquisa
avançada
     
View Item 
  •   RIUFF
  • Produção Científica
  • Instituto de Matemática e Estatística - IME
  • GGV - Curso de Graduação em Estatística - Bacharelado - Niterói
  • GGV - Trabalhos de Conclusão de Curso - Niterói
  • View Item
  •   RIUFF
  • Produção Científica
  • Instituto de Matemática e Estatística - IME
  • GGV - Curso de Graduação em Estatística - Bacharelado - Niterói
  • GGV - Trabalhos de Conclusão de Curso - Niterói
  • View Item
JavaScript está desabilitado no seu navegador. Algumas funcionalidades deste site podem não funcionar.

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsAdvisorsTitlesSubjectsDepartmentProgramTypeType of AccessThis CollectionBy Issue DateAuthorsAdvisorsTitlesSubjectsDepartmentProgramTypeType of Access

Statistics

View Usage Statistics
application/pdf

View/Open
217054081BIB-Joao-Pedro-Ciglia... (410.8Kb)

Collections
  • GGV - Trabalhos de Conclusão de Curso - Niterói

Statistics
Metadata
Show full item record
IDENTIFICAÇÃO DO DISCURSO DE ÓDIO DE CUNHO HOMOFÓBICO A PARTIR DE MÉTODOS DE APRENDIZADOS DE MÁQUINAS
Augusto, João Pedro Cigliato
Abstract
O objetivo deste estudo é definir, por técnicas de Aprendizado de Máquinas, um classificador de discurso de ódio de cunho homofóbico para postagens na rede social Twitter. A base de dados utilizada é composta por tweets relacionados ao tema e foi utilizado técnicas de mineração de texto e e de pré-processamento para preparar esses dados para realizar classificações. Serão utilizadas técnicas de balanceamento da base dados como undersampling, oversampling e SMOTEENN. Dois tipos de vetorização serão analisadas: Matriz Termo Documento e TF-IDF. Para a classificação serão realizados modelos de Floresta Aleatória e Extreme Gradient Boosting (XGBoost). Ao todo, foram realizados 24 modelos no trabalho, e os modelos que obtiveram um melhor resultado foram os modelos que foram treinados com um balanceamento pela técnica de undersampling. Dentre esses modelos, os modelos de Floresta Aleatória realizados com vetorização de Matriz Termo Documento tiveram melhores resultados de sensibilidade, com uma média de 84,14%. Já os modelos de XGBoost apresentaram uma média na sensibilidade de 75,96%.
[Texto sem Formatação]
Document type
Trabalho de conclusão de curso
Source
AUGUSTO, João Pedro Cigliato. Identificação do discurso de ódio de cunho homofóbico a partir de métodos de Aprendizados de Máquinas. 2023. 44 f. Trabalho de Conclusão de Curso (graduação em ) - Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2023.
Subject(s)
Aprendizado de máquina. Mineração de texto. Discurso de ódio. Homofobia
Aprendizado de máquina
Mineração de texto
Twitter (Rede social on-line)
Discurso de ódio
Homofobia
 
URI
https://app.uff.br/riuff/handle/1/35470
License Term
CC-BY-SA
DSpace
DSpace
DSpace
DSpace
DSpace
DSpace

  Contact Us

 Fale com um bibliotecário

DSpace  Siga-nos no Instagram