Por favor, use este identificador para citar o enlazar este ítem: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3420
Título : Procesamiento de voz en español mexicano aplicado a robótica móvil utilizando herramientas de software libre
Autor : García Fragoso, Margarita
Asesor: Romero Muñoz, Leonardo
Palabras clave : info:eu-repo/classification/cti/7
FIE-M-2008-0039
Reconocimiento de voz
Robot
Desarrollo abierto
Fecha de publicación : ago-2008
Editorial : Universidad Michoacana de San Nicolás de Hidalgo
Resumen : This master thesis research provides a global insight on the state of the art on the speech recognition technology and robot movil software. To get to know the complexity of the needed tools in order to build this sort of system gives us an idea of recent progress in the natural language processing field and justifies their usage. This research explains how to use the following GPL tools: CMSphinx3 by Carnegie Mellon University; DIMEX30 acoustic models by Universidad Nacional Autonoma de Mexico; Festival Text-to-Speech tool by Edinburg University; and Player/Stage Platform by South California University. In its more general sense, Automatic Speech Recognition can be defined as the transcription of voice into text. From this concept, the steps needed in order to perform speech recognition using CMUSphinx3 and DIMEx30 acoustic models are being described. In order to prove if the speech recognition process was successful PERL and Festival Text-to-Speech tool are being used. Player/Stage platform is being installed in order to create five robot movement applications simulated in a 2D environment guided by the spoken commands obtained during the speech recognition process given by CMUSphinx3. Finally, the LSC robot is commanded using PERL. By means of this research and the obtained results, this work is an attempt to increase the interest in this technology in order to be able to create in the future a complete locally developed system capable of understanding with higher precision any oral Spanish message.
Este trabajo de investigación de tesis de maestría proporciona un panorama global del estado del arte involucrado en la tecnología del reconocimiento del habla y del software de robots móviles. El conocer lo complejo de las herramientas que se utilizan para la construcción de este tipo de sistemas brinda una idea de los avances que se han hecho hasta el momento en el campo del procesamiento del lenguaje natural y justifica el hecho de utilizarlas. La investigación realizada explica cómo utilizar las herramientas de software libre CMUSphinx3 proporcionado por la Universidad Carnegie Mellon, los modelos acústicos Dimex30 proporcionados por la Universidad Autónoma de México, el sintetizador de voz Festival proporcionado por la Universidad de Edimburgo y la plataforma de desarrollo abierta Player/Stage proporcionada por la Universidad del Sur de California. El reconocimiento automático del habla consiste, en su acepción más general, en la transcripción de voz a texto. A partir de este concepto se describen los pasos necesarios para realizar reconocimiento de voz a partir de CMUSphix3 y los modelos acústicos DIMEx30. Se hace uso del lenguaje de programación PERL y del sintetizador de voz Festival para indicar si el proceso de reconocimiento de voz realizado fue exitoso. Se utiliza la plataforma de desarrollo abierta Player/Stage para crear cinco aplicaciones de movimiento para un robot simulado en un ambiente de dos dimensiones dirigido mediante las órdenes verbales obtenidas en el proceso de reconocimiento de voz realizado por medio de CMUSphinx3. Finalmente, se aprovecha la clasificación de patrones proporcionado por PERL, para dirigir el robot creado en el laboratorio de sistemas computacionales del posgrado de ingeniería eléctrica.
Descripción : Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica
URI : http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3420
Aparece en las colecciones: Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
FIE-M-2008-0039.pdf288.23 kBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.