Please use this identifier to cite or link to this item: https://app.uff.br/riuff/handle/1/5445
Title: Desenvolvimento de um sistema de verificação de locutor, usando modelos ocultos de Markov, unindo a técnica MFCC com parâmetros extraídos do sinal glotal
Authors: Schueler, Carla Floretino
Silveira, Filipe Moreira da
metadata.dc.contributor.advisor: Ferreira, Edson Luiz Cataldo
metadata.dc.contributor.members: Silva, João Marcos Meirelles da
Matos, Leni Joaquim de
Pestre Filho, René
Ferreira, Tadeu Nagashima
Issue Date: 9-Jan-2018
Abstract: A voz é um fenômeno físico resultante da propagação do fluxo de ar, proveniente dos pulmões, através da glote e do trato vocal, com posterior irradiação pela boca. A particularidade dos órgãos envolvidos no processo de geração da voz torna a fala um sinal biométrico, permitindo seu uso para verificação de locutor e, consequentemente, uma chave de acesso em ambientes restritos ou de dados privados, por exemplo. Este trabalho de conclusão de curso apresenta o desenvolvimento de uma ferramenta para verificação de locutor, unindo duas diferentes técnicas para extrair características de sinais de voz: os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients - MFCCs) e os parâmetros calculados a partir do sinal glotal, que é um sinal de pressão obtido imediatamente após a passagem do ar pelas cordas vocais. O uso de características extraídas do sinal glotal é a grande novidade e a principal contribuição deste trabalho. O sinal glotal foi obtido por um processo de filtragem inversa. Todos os parâmetros extraídos são usados como entradas de Modelos Ocultos de Markov (HMMs), que é uma ferramenta matemática para construir o modelo estocástico associado ao locutor. Os resultados mostram significativas melhoras na verificação de locutor quando comparados com os obtidos considerando apenas MFCCs, levando à conclusão de que os parâmetros extraídos do sinal glotal fornecem importantes informações sobre a identidade da voz
metadata.dc.description.abstractother: Voice is a physical phenomenon resulting from the airflow propagation, coming from the lungs, through the glottis and the vocal tract, with posterior radiation by the mouth. The uniqueness of the organs involved in the voice generation process makes the speech a biometrical signal allowing its use to speaker verification and, consequently, as an access key to restrict environment or private data, for example. This undergraduate final work presents the development of a tool for speaker verification, by joining two different techniques to extract features from the voice signals: the Mel Frequency Cepstrum Coefficients (MFCCs) and the parameters calculated from the glottal signal, which is an acoustic pressure signal quasi-periodic obtained immediately after the air passing through the vocal folds. The use of the features extracted from the glottal signal is the great novelty and also the main contribution of this work. The glottal signal was obtained by an inverse filtering process and all the parameters extracted are used as entries of Hidden Markov Models (HMMs), which is a mathematical tool used to develop the stochastic model associated to the speaker. The results show significant improvement on the performance of the speaker verification system when compared with the ones obtained when only MFCCs are considered, leading to the conclusion that the features extracted from the glottal signal provide important information about the voice identity
URI: https://app.uff.br/riuff/handle/1/5445
Appears in Collections:TGT - Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
TCC_Carla_Filipe_2017.pdf3.59 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.