Please use this identifier to cite or link to this item: https://app.uff.br/riuff/handle/1/8059
Title: Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraı́dos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados
Authors: Santos, Raiane Lima dos
d’Oliveira, Renato Ramos
metadata.dc.contributor.advisor: Ferreira, Edson Luiz Cataldo
metadata.dc.contributor.members: Carvalho, Murilo Bresciani de
Ferreira, Tadeu Nagashima
Issue Date: 2018
Publisher: Universidade Federal Fluminense
Citation: Santos, Raine Lima dos; d'Oliveira, Renato Ramos. Desenvolvimento de um programa de verificação de locutor usando como entrada para HMMs parâmetros extraÍdos do sinal de voz e do sinal glotal na emissão de palavras contendo conjuntamente sons vozeados e não-vozeados. 2018. 113 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações-Departamento de Engenharia de Telecomunicações, Universidade Federal Fluminense, 2018.
Abstract: Pode-se dizer que a fala é o principal meio de comunicação do ser humano, e cada indivı́duo apresenta caracterı́sticas únicas no seu sinal de voz, tornando-a uma assinatura. Dessa forma, a voz pode ser usada como meio de autenticação, por exemplo, para acesso a sistemas de segurança. Neste trabalho, será apresentado o aperfeiçoamento de um programa de verificação de locutor que usa parâmetros do sinal de voz, como os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients, MFCCs) e, também, parâmetros de tempo e de frequência do sinal glotal (sinal obtido imediatamente após a passagem do ar pelas cordas vocais). Esses parâmetros são entradas para HMMs (Modelos Ocultos de Markov-Hidden Markov Models) permitindo a construção de um modelo estocástico para a voz do locutor. Duas grandes contribuições são obtidas com esse trabalho: a adição de novos parâmetros de tempo extraı́dos do sinal glotal e, principalmente, a utilização de palavras completas, considerando sons vozeados e não vozeados na mesma palavra. Os resultados obtidos com a adição dos novos parâmetros de tempo mostraram melhora no sistema de verificação e a adaptação do programa para palavras completas mostram ser possı́vel a consideração dos parâmetros do sinal glotal para a melhora do sistema de verificação, não apenas para sons vozeados, como anteriormente, mas também para sons não-vozeados, considerado como o grande diferencial do trabalho
metadata.dc.description.abstractother: One can say that speech is the main means of communication of human beings and the voice of each person has particular characteristics which turns it into a signature. Consequently, voice signals can be used as authentication, for example, to access security systems. In this work, the improvement of a speaker verification system is presented using parameters extracted from the voice signal, as the MFCCs (Mel Frequency Cepstrum Coefficients) and also time and frequency parameters extracted from the glottal signal (signal obtained immediately after airflow passing through the vocal folds). These parameters are inputs for HMMs (Hidden Markov Models) allowing the construction of a stochastic model of the speaker voice. Two great contributions are obtained with this work: the additon of new time parameters extracted from the glottal signal and, mainly, the use of complete words, considering voiced and unvoiced sounds in the same word. The results obtained with the adding of the new parameters showed improvement in the verification system. The adaptation of the program for complete words showed it is possible to consider the glottal signal parameters to improve the system, not only voiced sounds, as previously done, but also unvoiced sounds, considered the greater differential of the work
URI: https://app.uff.br/riuff/handle/1/8059
Appears in Collections:TGT - Trabalhos de Conclusão de Curso

Files in This Item:
File Description SizeFormat 
TCC_Raiane_Renato_2018.pdf2.42 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons