Please use this identifier to cite or link to this item: https://app.uff.br/riuff/handle/1/5810
Title: Detecção de instrumentos musicais com redes neurais profundas
Authors: Silva, Marcos Pedro Ferreira Leal
metadata.dc.contributor.advisor: Carvalho, Aline Marins Paes
metadata.dc.contributor.members: Kowada, Luis Antonio Brasil
Ferreira, Marcos de Oliveira Lage
Issue Date: 20-Feb-2018
Abstract: Abordamos nesse trabalho sobre como classificar um instrumento dominante em um trecho de música usando redes neurais convolucionais. Introduzimos alguns conceitos de processamento de sinais digitais, abordamos o funcionamento da Transformada de Fourier e sua utilização para geração de espectrogramas que são a entrada do nosso algoritmo. Introduzimos o conceito de aprendizado de máquina e discutimos sobre a evolução das redes neurais e algumas construções famosas utilizadas no trabalho. Apresentamos três redes famosas utilizadas para a classificação (LeNet, AlexNet e GoogLeNet) e suas devidas arquiteturas e tarefas originais. Confrontamos as redes treinadas com diferentes conjuntos de dados gerados a partir de espectrogramas variando os parâmetros de tempo (100ms e 500ms) e escala de cor da potência do espectrograma (escala de cinza e escala de cores). Apresentamos os testes mais relevantes e comentamos o comportamento de cada rede e exibimos alguns de seus resultados. Comentamos sobre as escolhas de outros trabalhos da literatura e por fim resumimos nossas conclusões e apontamos trabalhos futuros para melhoria dos resultados.
metadata.dc.description.abstractother: We will approach this work on how to classify a dominant instrument in a piece of music using convolutional neural networks. We introduce some digital signal proces- sing concepts, we discuss the operation of the Fourier Transform and its use to generate spectrograms that are input to our algorithm. We introduce the concept of machine lear- ning and discuss the evolution of neural networks and some famous architectures used in the work. We present three famous networks used for classification (LeNet, AlexNet and GoogLeNet) and their original architectures and tasks. We compare the trained networks with different data sets generated from spectrograms by varying the time scale (100ms and 500ms) and color spectrogram power scale (gray scale and color scale). We present the most relevant tests and comment on the behavior of each network and show some of its results. We commented on the choices of other papers in the literature and finally summarized our conclusions and pointed out future work to improve results.
URI: https://app.uff.br/riuff/handle/1/5810
Appears in Collections:TGI - Trabalhos de Conclusão de Curso - Niterói



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.