Please use this identifier to cite or link to this item: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3552
Title: Modelado del error de predicción en series de tiempo basado en la calidad de sus datos
Authors: Téllez Velázquez, Víctor Manuel
Adviser: Flores Romero, Juan José
Keywords: info:eu-repo/classification/cti/7
FIE-M-2019-1304
Aprendizaje de máquina
Ruido
Regresión
Issue Date: Aug-2019
Publisher: Universidad Michoacana de San Nicolás de Hidalgo
Abstract: This thesis is about evaluating the quality of data from a time series before forecasting. The purpose of the quality evaluation is to determine the approximate accuracy that we would obtain in the forecast with the time series. To attend this topic, we propose the extraction of four characteristics of the time series, which are: percentage of missing data, percentage of outliers, noise level and magnitude of chaos. For this we worked with synthetic time series, of which nine are chaotic and a time series of the sinusoidal function, used as a reference. The ten-time series were disturbed with the removal of missing data, inclusion of outliers and inclusion of noise; In total 2,160 synthetic time series were analyzed. After having generated the time series, the characteristics were obtained, which are an estimate of the perturbation levels that were injected into the synthetic series. The disturbed series were modeled using artificial neural networks; the forecast was made and the absolute percentage average symmetric error smape was obtained. With the estimates of the characteristics and the error obtained, a regressor was trained to determine the percentage of error that the forecast of a certain time series may have without making a forecast modeling. An effectiveness level of this 85% regressor was obtained, which is considered satisfactory accuracy.
En esta tesis, se aborda el problema de evaluar la calidad de los datos de una serie de tiempo antes de pronosticar. El propósito de la evaluación de la calidad es determinar la precisión aproximada que obtendríamos en el pronóstico con los datos de la serie de tiempo. Para abordar este tema se propone la extracción de cuatro características de la serie de tiempo, las cuales son: porcentaje de datos faltantes, porcentaje de valores atípicos, nivel de ruido y magnitud del caos. Para esto se trabajó con series de tiempo sintéticas, de las cuales nueve son caóticas y una serie de tiempo de la función sinusoidal, usada como referencia. Las diez series de tiempo fueron perturbadas con la remoción de datos faltantes, inclusión de valores atípicos e inclusión de ruido; en total se analizaron 2,160 series de tiempo sintéticas. Después de haber generado las series de tiempo, se obtuvieron las características las cuales son una estimación de los niveles de perturbación que fueron inyectados a las series sintéticas. Las series perturbadas fueron modeladas mediante redes neuronales artificiales; se realizó el pronóstico y se obtuvo el error simétrico medio porcentual absoluto (SMAPE). Con las estimaciones de las características y el error obtenido se entrenó un regresor para determinar el porcentaje de error que puede llegar a tener el pronóstico de una determinada serie de tiempo, sin hacer un modelado de pronóstico. Se obtuvo un nivel de efectividad de este regresor del 85%, lo cual se considera una precisión satisfactoria.
Description: Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica
URI: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3552
Appears in Collections:Maestría

Files in This Item:
File Description SizeFormat 
FIE-M-2019-1304.pdf3.36 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.