USO DE APRENDIZADO DE MÁQUINAS PARA CLASSIFICAÇÃO DE TEXTOS
Classificação de Texto
Análise Discriminante
Máquinas de Vetor de Suporte
Etiquetagem Morfológica
TreeTagger
Colonia Corpus
Estatística
Aprendizado de máquina
Mineração de dados (Computação)
Inteligência artificial
Almeida, Isabelly da Silva | Posted on:
2020
Abstract
Com o crescimento do acesso a internet, um grande volume de dados textuais migraram do papel impresso para o meio eletrônico. E-mails, notícias, livros, artigos científicos e outros tipos de texto são produzidos diariamente. Por vezes surge a necessidade de classificar essas informações. A técnica de classificação de texto pode ser aplicada em várias áreas da mineração de texto. O uso de Aprendizado de Máquinas para resolver problemas desse tipo torna-se uma ferramenta bastante útil por dispor de vários algoritmos capazes de reconhecer padrões e criar regras de associação de forma automática. Este trabalho tem como objetivo verificar a eficiência de dois algoritmos de Aprendizado de Máquinas Supervisionado: Análise Discriminante e Máquinas de Vetor de Suporte, na resolução do problema de classificação de texto. Para isso, foram usados livros que passaram por um processo de etiquetagem morfológica. As etiquetas de cada palavra do livro serviram para criar as variáveis usadas nas análises. Desta maneira, pretendemos verificar se os algortimos são capazes de classificar, a partir de uma base de treinamento com livros de dois autores distintos, se um novo livro pertence a um determinado autor.
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoPublisher
Nenhum
Source
ALMEIDA, Isabelly da Silva. Uso de Aprendizado de Máquinas para classificação de textos. 2020. 70 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2020.Subject(s)
Aprendizado de MáquinasClassificação de Texto
Análise Discriminante
Máquinas de Vetor de Suporte
Etiquetagem Morfológica
TreeTagger
Colonia Corpus
Estatística
Aprendizado de máquina
Mineração de dados (Computação)
Inteligência artificial
License Term
CC-BY-SAThe following license files are associated with this item: