Aviso de cookies

Neste site utilizamos cookies analíticos. Os cookies analíticos são utilizados para compreender como os visitantes interagem com o site. Eles ajudam a fornecer informações sobre métricas como número de visitantes, taxa de rejeição, origem do tráfego, etc.

  • Portal do Governo Brasileiro
    • português (Brasil)
    • English
    • español
  • Español 
    • Português (Brasil)
    • English
    • Español
  • Login
          AJUDA
Pesquisa
avançada
     
Ver ítem 
  •   RIUFF
  • Produção Científica
  • Instituto de Matemática e Estatística - IME
  • GGV - Curso de Graduação em Estatística - Bacharelado - Niterói
  • GGV - Trabalhos de Conclusão de Curso - Niterói
  • Ver ítem
  •   RIUFF
  • Produção Científica
  • Instituto de Matemática e Estatística - IME
  • GGV - Curso de Graduação em Estatística - Bacharelado - Niterói
  • GGV - Trabalhos de Conclusão de Curso - Niterói
  • Ver ítem
JavaScript está desabilitado no seu navegador. Algumas funcionalidades deste site podem não funcionar.

Listar

Todo DSpaceComunidades & ColeccionesPor fecha de publicaciónAutoresAsesor (es)TítulosMateriasDepartamentoProgramaTipoTipo (s) de accesoEsta colecciónPor fecha de publicaciónAutoresAsesor (es)TítulosMateriasDepartamentoProgramaTipoTipo (s) de acceso

Estadísticas

Ver Estadísticas de uso
application/pdf

Ver/
217054081BIB-Joao-Pedro-Ciglia... (410.8Kb)

Colecciones
  • GGV - Trabalhos de Conclusão de Curso - Niterói

Estadísticas
Metadatos
Mostrar el registro completo del ítem
IDENTIFICAÇÃO DO DISCURSO DE ÓDIO DE CUNHO HOMOFÓBICO A PARTIR DE MÉTODOS DE APRENDIZADOS DE MÁQUINAS
Augusto, João Pedro Cigliato
Resumen
O objetivo deste estudo é definir, por técnicas de Aprendizado de Máquinas, um classificador de discurso de ódio de cunho homofóbico para postagens na rede social Twitter. A base de dados utilizada é composta por tweets relacionados ao tema e foi utilizado técnicas de mineração de texto e e de pré-processamento para preparar esses dados para realizar classificações. Serão utilizadas técnicas de balanceamento da base dados como undersampling, oversampling e SMOTEENN. Dois tipos de vetorização serão analisadas: Matriz Termo Documento e TF-IDF. Para a classificação serão realizados modelos de Floresta Aleatória e Extreme Gradient Boosting (XGBoost). Ao todo, foram realizados 24 modelos no trabalho, e os modelos que obtiveram um melhor resultado foram os modelos que foram treinados com um balanceamento pela técnica de undersampling. Dentre esses modelos, os modelos de Floresta Aleatória realizados com vetorização de Matriz Termo Documento tiveram melhores resultados de sensibilidade, com uma média de 84,14%. Já os modelos de XGBoost apresentaram uma média na sensibilidade de 75,96%.
[Texto sem Formatação]
Tipo de documento
Trabalho de conclusão de curso
Fuente
AUGUSTO, João Pedro Cigliato. Identificação do discurso de ódio de cunho homofóbico a partir de métodos de Aprendizados de Máquinas. 2023. 44 f. Trabalho de Conclusão de Curso (graduação em ) - Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2023.
Sujeta/Sujeto(s)
Aprendizado de máquina. Mineração de texto. Discurso de ódio. Homofobia
Aprendizado de máquina
Mineração de texto
Twitter (Rede social on-line)
Discurso de ódio
Homofobia
 
URI
https://app.uff.br/riuff/handle/1/35470
Término de licencia
CC-BY-SA
DSpace
DSpace
DSpace
DSpace
DSpace
DSpace

  Contacto

 Fale com um bibliotecário

DSpace  Siga-nos no Instagram