ANÁLISE ESTATÍSTICA DE TEXTOS
Alocação latente de Dirichlet
Análise semântica latente
Processamento de linguagem natural (Computação)
Semântica
Mineração de dados (Computação)
Lopes, Evandro Dalbem | Posted on:
2013
Abstract
Desde a popularização da internet existiu um crescimento acelerado de serviços disponíveis à população. Sites de notícias tornaram-se muito populares devido à velocidade de informação fornecida. Este trabalho tem como objetivo propor duas metodologias que possam ser aplicadas à análise de um conjunto de documentos, geralmente chamado de corpus. As duas metodologias propostas são a Análise Semântica Latente e a Alocação Latente de Dirichlet. A primeira tem como objetivo criar um campo semântico a fim de representar as palavras, sendo possível assim a categorização em grupos. A segunda parte do pressuposto que, ao redigir um texto, o autor possui tópicos em mente e escreve um texto alternando as diferentes palavras pertencente a cada um destes tópicos, sendo possível a modelagem do texto baseando-se em distribuições de probabilidades, na qual cada tópico é uma distribuição de probabilidade sobre as palavras do corpus
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoSource
LOPES, Evandro Dalbem. Análise estatística de textos. 2012. 45 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2012.Subject(s)
Processamento de linguagem naturalAlocação latente de Dirichlet
Análise semântica latente
Processamento de linguagem natural (Computação)
Semântica
Mineração de dados (Computação)
License Term
CC-BY-SAThe following license files are associated with this item: