Por favor, use este identificador para citar o enlazar este ítem: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3424
Título : Sistema automático de reconocimiento de voz
Autor : Chávez Álvarez, Ismael
Asesor: Camarena Ibarrola, José Antonio
Palabras clave : info:eu-repo/classification/cti/7
FIE-M-2009-0043
Indentificador de voz
Señales acústicas
Detección de señales
Fecha de publicación : may-2009
Editorial : Universidad Michoacana de San Nicolás de Hidalgo
Resumen : Speech recognition is a field in which technical computing keeps steady development aimed to survey even better solutions to the man-machine communication problem than the ones available to date. The mixture of different knowledge fields involved in this problem widens the horizon of possibilites as each one of the implied sub-problems is revised, and enriches the quality of the proposals to solve the problem. This project performs automatic isolated word recognition paying much attention in developing the component specialized on discovering the features contained in acoustic signals, as for them to be manipulated by later stages in a complete voice recognition system. This document describes the use of Wavelet coefficients obtained by applying the Discrete Wavelet Transform on a voice signal, as part of an automatic word classifying system. The Discrete Wavelet Transform used in this research embodies as mother Wavelets the Haar function and members of the Daubechies Wavelet functions orders 2 thru 10, and implements the piramidal algorithms proposed by Stéphane Mallat. All the different stages implied in the construction of a simple isolated pronounced words recognition system are shown, among which, characteristics extraction from human voice signal becomes paramount, being this stage the one that implements the aforementioned transform. The performance of the system is shown with the use of Signal Detection Theory which is widely represented graphically using ROC (Receiver Operating Characteristic) curves, as a means to choose between a possibly optimal model and discard possibly suboptimal ones.
El reconocimiento de voz constituye uno de los campos en que la computación técnica mantiene un desarrollo constante con el propósito de explorar soluciones cada vez más útiles al problema de la comunicación hombre-máquina. La combinación de las diversas áreas del conocimiento que esta dificultad abarca, expande el horizonte de posibilidades a medida que se explora cada uno de los sub-problemas implicados, y con ello se enriquece la calidad de las propuestas de resolución del problema. Este proyecto efectúa el reconocimiento automático de palabras aisladas, enfatizando en el componente que se especializa en la caracterización de las señales acústicas para que estas puedan ser manipuladas por otros módulos que integran un sistema de reconocimiento de voz completo. Se describe el uso de los coeficientes Wavelet obtenidos al aplicar la Transformada Wavelet Discreta a una señal de voz, como parte de un sistema automático de clasificación de palabras. La Transformada Wavelet Discreta que se emplea en esta investigación incorpora como Wavelets madre a la función de Haar y las funciones miembros de la familia de Wavelets de Daubechies de ordenes 2 a 10, e implementa los algoritmos piramidales propuestos por Stéphane Mallat. Se detallan las distintas fases de la construcción de un sistema simple de reconocimiento de palabras pronunciadas aisladamente, entre las que destaca la etapa de extracción de características de la señal de la voz humana, etapa en la cual se implanta la transformación antes mencionada. Se presenta la evaluación del rendimiento del sistema haciendo uso de la Teoría de Detección de Señales, que tiene como su expresión grafica más conocida a las curvas ROC (Receiver Operating Characteristic) como un medio para la elección de un modelo posiblemente ´optimo y descartar otros posiblemente sub-óptimos.
Descripción : Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica
URI : http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3424
Aparece en las colecciones: Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
FIE-M-2009-0043.pdf1.3 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.