Por favor, use este identificador para citar o enlazar este ítem:
http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3546
Título : | Identificación de parlantes independientemente del texto utilizando los formantes de las vocales |
Autor : | Castro Coria, Monserrat Aranzazu |
Asesor: | Camarena Ibarrola, José Antonio |
Palabras clave : | info:eu-repo/classification/cti/7 FIE-M-2019-1231 Identificación de individuos Texto independiente LPC |
Fecha de publicación : | ago-2019 |
Editorial : | Universidad Michoacana de San Nicolás de Hidalgo |
Resumen : | The identification of speakers regardless of the text-independent is the way to recognize an individual by his/her voice without the speaker pronouncing one or several specific words. This form of identification is usually used for forensic recognition or legal proceedings, where the individual to be identified does not have to be present or does not want to collaborate, just by having a recording of their voice it is possible to identify it as long as they have characteristics of his/her voice in a data dictionary. There are many ways to extract different characteristics of the voice signal, this thesis implements the detection of the first three vowel formants, from the linear prediction coefficients, to form a vector of characteristics of size n by 3, where n is the number of vowels pronounced in a sentence and 3 the formants that are obtained by each vowel, so that a vector of characteristics is obtained for each individual of the databases. To identify an individual, the similarity between vectors of an unknown individual is measured with vectors belonging to known individuals. Tests were carried out with two databases in Spanish and two databases in English of different numbers of individuals as well as with different numbers of pronounced vowels, achieving favorable results. In addition, a test was conducted looking for the differences between the voice of a real person and an imitator, finding differences between them. This achieved a robustness in the algorithm to leave open possibilities for future work. La identificación de parlantes independientemente del texto es la forma de reconocer a un individuo por su voz sin que el locutor pronuncie una o varias palabras en específico. Esta forma de identificación suele ser utilizada para reconocimiento forense o procesos judiciales, donde el individuo a identificar no tiene que estar presente o no quiera colaborar, con solo tener una grabación de su voz es posible identificarlo siempre y cuando se tengan características de su voz en un diccionario de datos. Existen muchas formas para extraer diferentes características de la señal de voz, esta tesis implementa la detección de los primeros tres formantes de las vocales a partir de los coeficientes de predicción lineal para formar un vector de características de tamaño n por 3, donde n es el número de vocales pronunciadas en una frase y 3 los formantes que se obtienen por cada vocal, por lo que se obtiene un vector de características para cada individuo de las bases de datos. Para identificar a un individuo, se mide la similitud entre vectores de un individuo desconocido con los vectores que pertenecen a los individuos conocidos. Se realizaron pruebas con dos bases de datos en español y dos bases de datos en ingles de diferente número de individuos, así como con diferente número de vocales pronunciadas, logrando resultados favorecedores. Además, se realizó una prueba buscando las diferencias entre la voz de una persona real y un imitador encontrando incluso diferencias entre estos. Con ello se logró una robustez en el algoritmo para dejar abierto posibilidades a futuros trabajos. |
Descripción : | Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica |
URI : | http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3546 |
Aparece en las colecciones: | Maestría |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
FIE-M-2019-1231.pdf | 8.96 MB | Adobe PDF | ![]() Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.