SISTEMA DE RECOMENDAÇÃO BASEADO EM FILTRAGEM COLABORATIVA UTILIZANDO DADOS BINÁRIOS DO SPOTIFY
Sistemas de Recomendação
Dados Binários
Base de dados
Método estatístico
Música
Abstract
A industria musical é responsável por uma imensidão de cantores, gêneros e ritmos que produzem uma infinidade de músicas, dificultando muitas vezes ao processo de selecionar, filtrar e organizar estes dados conforme as preferências do consumidor. Os Sistemas de Recomendação buscam sugerir itens baseados na semelhança de outros itens ou baseados nas preferências de outros consumidores com gostos semelhantes para resolver este probelma. Dado o grande volume de dados encontrado nas plataformas de \textit{streamings} de músicas como o \textit{Spotify}, estes Sistemas de Recomendação são uma ferramenta essencial para garantir de forma automatizada e personalizada a indicação de músicas para melhorar a experiência do cliente e garantir uma maior satisfação. Este estudo desenvolveu um Sistema de Recomendação por Filtragem Colaborativa em uma base de dados binários que representa o consumo de músicas em \textit{playlists} do Spotify. Diversas metodologias foram exploradas, destacando a Similaridade entre Usuários (\textit{playlists)} por meio de medidas como \textit{Jaccard}, \textit{3W-Jaccard}, \textit{Sorensen-Dice}, \textit{Ochai}, \textit{Sokal \& Sneath}, e \textit{Sokal \& Michener}, junto com diferentes valores de \(k\) para identificar as \textit{playlists} similares e em seguida recomendar músicas a elas. O \(k\) é definido como o número de \textit{playlists} similares que será utilizado ao longo dos cálculos de similaridades. A base de dados contém 869 \textit{playlists} distintas e 34443 músicas únicas. A comparação das medidas de similaridade, feita através do método \textit{Leave-one-out}, envolveu um cenário de simulação, destacando a eficácia da Similaridade de \textit{3W-Jaccard} com \(k = 5\). Após a definição da medida e vizinhos mais próximos, foram realizadas recomendações para três playlists, evidenciando um desempenho promissor ao sugerir músicas com gêneros semelhantes ou idênticos. A conclusão destaca a significância de levar em conta as peculiaridades associadas às entradas de valor zero, que podem ser interpretadas como a irrelevância de uma música para a \textit{playlist} ou simplesmente o desconhecimento da mesma. Além disso, ressalta-se a importância de uma escolha criteriosa da medida de similaridade e do número \(k\) de vizinhos para garantir resultados satisfatórios.
[Texto sem Formatação]
[Texto sem Formatação]
Document type
Trabalho de conclusão de cursoSource
FERREIRA, Julia Hellen Franco. Sistema de recomendação baseado em filtragem colaborativa utilizando dados binários do Spotify. 2023. 49 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, 2023.Subject(s)
Filtragem ColaborativaSistemas de Recomendação
Dados Binários
Base de dados
Método estatístico
Música