Repositorio UMSNH

Sistema automático de reconocimiento de voz

Mostrar el registro sencillo del ítem

dc.rights.license http://creativecommons.org/licenses/by-nc-nd/4.0
dc.contributor.advisor Camarena Ibarrola, José Antonio
dc.contributor.author Chávez Álvarez, Ismael
dc.date.accessioned 2021-06-03T14:04:29Z
dc.date.available 2021-06-03T14:04:29Z
dc.date.issued 2009-05
dc.identifier.uri http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3424
dc.description Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica
dc.description.abstract Speech recognition is a field in which technical computing keeps steady development aimed to survey even better solutions to the man-machine communication problem than the ones available to date. The mixture of different knowledge fields involved in this problem widens the horizon of possibilites as each one of the implied sub-problems is revised, and enriches the quality of the proposals to solve the problem. This project performs automatic isolated word recognition paying much attention in developing the component specialized on discovering the features contained in acoustic signals, as for them to be manipulated by later stages in a complete voice recognition system. This document describes the use of Wavelet coefficients obtained by applying the Discrete Wavelet Transform on a voice signal, as part of an automatic word classifying system. The Discrete Wavelet Transform used in this research embodies as mother Wavelets the Haar function and members of the Daubechies Wavelet functions orders 2 thru 10, and implements the piramidal algorithms proposed by Stéphane Mallat. All the different stages implied in the construction of a simple isolated pronounced words recognition system are shown, among which, characteristics extraction from human voice signal becomes paramount, being this stage the one that implements the aforementioned transform. The performance of the system is shown with the use of Signal Detection Theory which is widely represented graphically using ROC (Receiver Operating Characteristic) curves, as a means to choose between a possibly optimal model and discard possibly suboptimal ones. en
dc.description.abstract El reconocimiento de voz constituye uno de los campos en que la computación técnica mantiene un desarrollo constante con el propósito de explorar soluciones cada vez más útiles al problema de la comunicación hombre-máquina. La combinación de las diversas áreas del conocimiento que esta dificultad abarca, expande el horizonte de posibilidades a medida que se explora cada uno de los sub-problemas implicados, y con ello se enriquece la calidad de las propuestas de resolución del problema. Este proyecto efectúa el reconocimiento automático de palabras aisladas, enfatizando en el componente que se especializa en la caracterización de las señales acústicas para que estas puedan ser manipuladas por otros módulos que integran un sistema de reconocimiento de voz completo. Se describe el uso de los coeficientes Wavelet obtenidos al aplicar la Transformada Wavelet Discreta a una señal de voz, como parte de un sistema automático de clasificación de palabras. La Transformada Wavelet Discreta que se emplea en esta investigación incorpora como Wavelets madre a la función de Haar y las funciones miembros de la familia de Wavelets de Daubechies de ordenes 2 a 10, e implementa los algoritmos piramidales propuestos por Stéphane Mallat. Se detallan las distintas fases de la construcción de un sistema simple de reconocimiento de palabras pronunciadas aisladamente, entre las que destaca la etapa de extracción de características de la señal de la voz humana, etapa en la cual se implanta la transformación antes mencionada. Se presenta la evaluación del rendimiento del sistema haciendo uso de la Teoría de Detección de Señales, que tiene como su expresión grafica más conocida a las curvas ROC (Receiver Operating Characteristic) como un medio para la elección de un modelo posiblemente ´optimo y descartar otros posiblemente sub-óptimos. es_MX
dc.language.iso spa es_MX
dc.publisher Universidad Michoacana de San Nicolás de Hidalgo es_MX
dc.rights info:eu-repo/semantics/openAccess
dc.subject info:eu-repo/classification/cti/7
dc.subject FIE-M-2009-0043 es_MX
dc.subject Indentificador de voz es_MX
dc.subject Señales acústicas es_MX
dc.subject Detección de señales es_MX
dc.title Sistema automático de reconocimiento de voz es_MX
dc.type info:eu-repo/semantics/masterThesis es_MX
dc.creator.id 0
dc.advisor.id CAIA640711HMNMBN11
dc.advisor.role asesorTesis


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta

Estadísticas