Por favor, use este identificador para citar o enlazar este ítem: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3552
Título : Modelado del error de predicción en series de tiempo basado en la calidad de sus datos
Autor : Téllez Velázquez, Víctor Manuel
Asesor: Flores Romero, Juan José
Palabras clave : info:eu-repo/classification/cti/7
FIE-M-2019-1304
Aprendizaje de máquina
Ruido
Regresión
Fecha de publicación : ago-2019
Editorial : Universidad Michoacana de San Nicolás de Hidalgo
Resumen : This thesis is about evaluating the quality of data from a time series before forecasting. The purpose of the quality evaluation is to determine the approximate accuracy that we would obtain in the forecast with the time series. To attend this topic, we propose the extraction of four characteristics of the time series, which are: percentage of missing data, percentage of outliers, noise level and magnitude of chaos. For this we worked with synthetic time series, of which nine are chaotic and a time series of the sinusoidal function, used as a reference. The ten-time series were disturbed with the removal of missing data, inclusion of outliers and inclusion of noise; In total 2,160 synthetic time series were analyzed. After having generated the time series, the characteristics were obtained, which are an estimate of the perturbation levels that were injected into the synthetic series. The disturbed series were modeled using artificial neural networks; the forecast was made and the absolute percentage average symmetric error smape was obtained. With the estimates of the characteristics and the error obtained, a regressor was trained to determine the percentage of error that the forecast of a certain time series may have without making a forecast modeling. An effectiveness level of this 85% regressor was obtained, which is considered satisfactory accuracy.
En esta tesis, se aborda el problema de evaluar la calidad de los datos de una serie de tiempo antes de pronosticar. El propósito de la evaluación de la calidad es determinar la precisión aproximada que obtendríamos en el pronóstico con los datos de la serie de tiempo. Para abordar este tema se propone la extracción de cuatro características de la serie de tiempo, las cuales son: porcentaje de datos faltantes, porcentaje de valores atípicos, nivel de ruido y magnitud del caos. Para esto se trabajó con series de tiempo sintéticas, de las cuales nueve son caóticas y una serie de tiempo de la función sinusoidal, usada como referencia. Las diez series de tiempo fueron perturbadas con la remoción de datos faltantes, inclusión de valores atípicos e inclusión de ruido; en total se analizaron 2,160 series de tiempo sintéticas. Después de haber generado las series de tiempo, se obtuvieron las características las cuales son una estimación de los niveles de perturbación que fueron inyectados a las series sintéticas. Las series perturbadas fueron modeladas mediante redes neuronales artificiales; se realizó el pronóstico y se obtuvo el error simétrico medio porcentual absoluto (SMAPE). Con las estimaciones de las características y el error obtenido se entrenó un regresor para determinar el porcentaje de error que puede llegar a tener el pronóstico de una determinada serie de tiempo, sin hacer un modelado de pronóstico. Se obtuvo un nivel de efectividad de este regresor del 85%, lo cual se considera una precisión satisfactoria.
Descripción : Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica
URI : http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3552
Aparece en las colecciones: Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
FIE-M-2019-1304.pdf3.36 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.