Por favor, use este identificador para citar o enlazar este ítem: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/15946
Título : Reducción de pre-eco mediante el uso de bloques de tamaño variable en un códec de audio perceptual
Autor : Rodríguez Cárdenas, Paulina
Asesor: Gamboa Guzmán, Luis Eduardo
Palabras clave : info:eu-repo/classification/cti/7
FIE-L-2014-0044
Reducción
Uso
Bloques
Códec
Fecha de publicación : ene-2014
Editorial : Universidad Michoacana de San Nicolás de Hidalgo
Resumen : The present thesis deals with the audio compression issue, which is part of a future work described on [Gamboa05], in which was created an encoder/decoder perceptual sound, this study was able to compress the sound giving as a result a high quality profile; the author recommends making a dynamic change of block size to deal with the pre-echo, based on the presence of transients in audio. Nevertheless, to make this happen it is necessary to implement a dynamic change in block size, using 4 different sizes of block, in the following form: a 2048 block samples for steady state, a 128 block samples for transient states and 2 blocks each one of 1568 samples for transition states “steady-transients” and “transient-steady”. The use of blocks will depend on whether there is a transient state or not, to detect transient states will depend on the perceptual entropy levels on each block, so it will determine what block might be use. As an input, it takes an uncompressed file sampled at 44100Hz, quantized to 16- bit stereo and the Modified Discrete Cosine Transform is used to work on the frequency domain. The way in which the coefficients are quantized and packed, is exactly the same used in [Gamboa05] his thesis, in which is added more information to the packages to know the type of block that the codec will in use. Besides, the encoder’s changes were added to detect the type of block it is working with and can decode the necessary information, the output of the codec is a WAV file.
El presente trabajo aborda el tema de la compresión de audio, cuyo seguimiento parte de un trabajo a futuro descrito en [Gamboa05], en el cual se creó un codificador-decodificador perceptual de sonido, en cuyo estudio logró comprimir el sonido dando como resultado un perfil de alta calidad; en uno de sus estudios, el autor recomienda hacer un cambio dinámico de tamaño de bloque para lidiar con el pre-eco, tomando como base la presencia de transitorios en el audio. Para materializar la encomienda, este proyecto lleva a cabo la implementación de un cambio dinámico de tamaño de bloque, utilizando cuatro tipos de bloque de distintos tamaños, en la forma siguiente: un bloque de 2048 muestras para estado estable, 128 mues- tras para estados transitorios y dos bloques cada uno de 1568 muestras para estados de “transición” estable-transitorio y transitorio-estable. La utilización de los bloques depender ́a s ́ı se encuentra o no un estado transitorio, para esto se detectan los estados transitorios dependiendo del nivel de entropía perceptual que presente cada bloque, de esta manera se va a determinar cuál es el bloque que conviene usar. Como entrada, se sigue tomando un archivo sin comprimir muestreado a 44100Hz, cuantificado a 16-bits estéreo y se utiliza la Transformada Discreta del Coseno Modificada para trabajar en el dominio de la frecuencia. La forma en que se cuantifican los coeficientes y se empaquetan, es exactamente la misma, es decir, la utilizada en [Gamboa05], a la cual se agregó más información a los paquetes para saber el tipo de bloque que utiliza el códec. De igual manera, al codificador se añadieron cambios para detectar el tipo de bloque con el que trabaja y pueda decodificar la información necesaria, la salida del códec es un archivo WAV.
Descripción : Facultad de Ingeniería Eléctrica. Licenciatura en Ingeniería en Computación
URI : http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/15946
Aparece en las colecciones: Licenciatura

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
FIE-L-2014-0044.pdf6.02 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.