MÉTODOS DE CLUSTERING EM APRENDIZADO DE MÁQUINAS NÃO SUPERVISIONADO
Cluster
Método k-means
Método complete linkage
Aprendizado de máquina
Análise de agrupamento
ARAÚJO, MARLON VINÍCIUS ALVES DE | Posted on:
2021
Abstract
Atualmente, conforme a tecnologia avança, a quantidade de dados cresce exponencialmente, com milhões de terabytes de dados sendo gerados diariamente. Para obter informações a partir de um conjunto de dados, métodos de machine learning, ou aprendizado de máquinas, são utilizados para análises, previsões, resolução de problemas, de acordo com o que se busca extrair, automatizando o desenvolvimento de modelos analíticos. Porém, por mais que seja “fácil” o acesso há diversas bases de dados, em alguns casos, as bases não conterão todas as informações almejadas, como dados rotulados, ou categorizados. Isso acontece porque coletar dados anotados pode ser extremamente caro, custar muito tempo, e em certas situações, até mesmo impossível. Para lidar com essa ausência de informações desejadas, são utilizadas técnicas de aprendizado de máquinas não supervisionado, que auxiliam na detecção de padrões e percepções ocultas nos dados analisados. Entre diversos métodos, um dos mais importantes dentro de aprendizagem não supervisionada é o clustering, ou agrupamento, em que seus algoritmos processarão os dados, permitindo encontrar clusters (grupos) caso existam, de forma que os elementos dentro do mesmo cluster sejam o mais semelhante possível, e tenham menos ou nenhuma semelhança com os elementos de outro grupo. O objetivo deste trabalho é estudar e aplicar algoritmos de clustering em um conjunto de dados não rotulado, utilizando suas respectivas ferramentas na linguagem de programação R, verificando se os algoritmos são capazes de fornecer resultados eficientes e confiáveis.
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoSource
ARAÚJO, Marlon Vinícius Alves de. Métodos de Clustering em Aprendizado de Máquinas Não Supervisionado. 2021. 89 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.Subject(s)
ClusteringCluster
Método k-means
Método complete linkage
Aprendizado de máquina
Análise de agrupamento