Please use this identifier to cite or link to this item: https://app.uff.br/riuff/handle/1/5753
Title: Detecção automática de discursos de ódio em comentários de jornais online
Authors: Camelo, Fábio Assunção Berlim
metadata.dc.contributor.advisor: Carvalho, Aline Marins Paes
metadata.dc.contributor.members: Carvalho, Alexandre Plastino de
Bernardini, Flávia Cristina
Issue Date: 19-Feb-2018
Abstract: As mídias sociais estão cada vez mais interativas, incluindo ferramentas que permitem que o usuário colabore com a criação do conteúdo nela exposto. Muitos usuários se aproveitam dessa funcionalidade para divulgar conteúdo ilícito ou criminoso. No Brasil, nota-se uma dificuldade por parte das mídias sociais e das políticas públicas na remoção, e até mesmo na identificação, efetiva deste conteúdo. Caso não seja removido, este conteúdo será visto por cada vez mais pessoas e poderá ser propagado pela internet, atingindo um número maior de vítimas, e incentívando a ocorrência de outros crimes. Objetivando ajudar na redução da popularização de tal prática, esse trabalho se propõe a criar uma ferramenta implementada com técnicas de Aprendizado de Máquina, para detectar automaticamente um dos crimes mais comuns nessas mídias, o discurso de ódio. Esse tipo de crime geralmente é voltado aos grupos mais vulneráveis e marginalizados da sociedade, e seus efeitos nocivos incluem o aumento da exclusão social e da violência praticada contra esses grupos. A avaliação da ferramenta teve como foco a detecção de discursos de ódio inseridos em comentários de um jornal online, direcionados a pessoas que pertençam à comunidade Lésbicas, Gays, Bissexuais, Travestis, Transexuais e Transgêneros (LGBT). Resultados preliminares demonstraram que o detector conseguiu aprender os padrões de textos de algumas formas de discurso de ódio a ele apresentados. Porém, após testes com notícias atuais, com outros padrões de discursos de ódio, o comportamento da ferramenta se deteriora, o que indica a necessidade de atualização contínua do modelo. Contudo, foi possível concluir que a metodologia implementada funciona, e que pode servir de base para a criação de outros detectores de discursos de ódio em mídias digitais em geral.
metadata.dc.description.abstractother: Social media is increasingly interactive, including tools that allow the user to collaborate and create content exposed in it. Many users take advantage of this feature to spread illicit or criminal content. In Brazil, we notice a difficulty on the part of social media and public policies in the removal, and even in the effective identification of this content. If not removed, this content will be seen by more and more people, and can be spread by the internet, reaching a greater number of victims, and encouraging the occurrence of other related crimes. Aiming at helping on the reduction of the popularization of such crimes, this work proposes a tool embedded with Machine Learning techniques to automatically detect one of the most common crimes in these media, the hate speech. This type of crime is generally targeted at the most vulnerable and marginalized groups in society, and its harmful effects include increasing social exclusion and violence against such groups. The evaluation of the tool was focused on the detection of hate speech in comments from an online newspaper, aimed at the people belonging to the lesbian, gay, bisexual, transvestite, transsexual and transgender (LGBT) community. Preliminary results showed that the detector was able to learn the text patterns of some forms of hate speech. However, after additional tests with new types of hate speech, the behavior of the tool deteriorates, which indicates the need for continuously updating the model. Nevertheless, it was possible to conclude that the implemented methodology is useful to detect some forms of hate speech and that it can serve as a basis for the development of other hate speech detectors in digital media in general.
URI: https://app.uff.br/riuff/handle/1/5753
Appears in Collections:TGI - Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
tcc-fabio-assuncao-berlim-camelo.pdf2.12 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.