Please use this identifier to cite or link to this item: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3434
Title: Herramienta de minería de datos basada en el algoritmo C4.5 y su aplicación al inventario multifásico de la personalidad Minnesota 2
Authors: Loaeza Valerio, Joel
Adviser: Flores Romero, Juan José
Keywords: info:eu-repo/classification/cti/7
FIE-M-2009-0053
Software
Generación masiva
Datos
Issue Date: Sep-2009
Publisher: Universidad Michoacana de San Nicolás de Hidalgo
Abstract: At present there is a massive generation of data and the speed with which they are stored far exceeds the speed with which they are analyzed. Therefore is need a data analysis that is fast and efficient, i.e., automated knowledge discovery in databases, which is to interpret large amounts of data in an iterative and interactive process, to find relationships or patterns that can make new and useful knowledge. Then, as a low cost alternative that enables automated knowledge discovery in databases, this paper proposes the implementation of an Intelligent Agent Discoverknowledge comprises human intelligence agents and an Intelligent Agent Software. Furthermore, if the Intelligent Agent Discoverknowledge succeed in his task, in this study also developed an algorithm that shows how you reference the automated knowledge discovery in databases and applying computational Discoverknowledge Environment called for the algorithm C4.5Web (ADC4.5Web). The baseline algorithm to discover knowledge, was developed based on the algorithm proposed by Fayyad et al (1996) for the process of knowledge discovery in databases (Knowledge Discovery in Databases: KDD) and the Reference Model Standard Industrial Process hybrid data mining (Cross-Industry Standard Process for Data Mining: CRISP-DM). the data mining tool ADC4.5Web includes a fitness for web C4.5 algorithm (algorithm that generates decision trees from examples), developed by Ph. Dr. J. Ross Quinlan.
En la actualidad se lleva a cabo una generación masiva de datos y la velocidad con la que éstos se almacenan es muy superior a la velocidad con la que se analizan. En consecuencia se necesita un análisis de los datos que sea rápido y eficiente, es decir, el descubrimiento automatizado de conocimiento en bases de datos, que consiste en interpretar grandes cantidades de datos en un proceso iterativo e interactivo, para buscar relaciones o patrones que se puedan convertir en conocimiento útil y novedoso. Entonces, como una alternativa de bajo costo que haga posible el descubrimiento automatizado de conocimiento en bases de datos, en el presente trabajo se propone la implementación de un Agente Inteligente Descubre conocimiento conformado por Agentes Inteligentes Humanos y un Agente Inteligente de Software. Además, para que el Agente Inteligente Descubre conocimiento tenga éxito en su tarea, en el presente trabajo se desarrollaron también, un algoritmo de referencia que muestra como realizar el descubrimiento automatizado de conocimiento en bases de datos y la aplicación computacional correspondiente denominada Ambiente Descubre conocimiento con el algoritmo C4.5Web (ADC4.5Web). El algoritmo de referencia para descubrir conocimiento, se desarrolló tomando como base el algoritmo propuesto por Fayyad et al (1996) para el proceso de descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases: KDD) y el modelo de referencia Proceso Estándar Industrial Híbrido para minería de datos (CRoss-Industry Standard Process for Data Mining: CRISP-DM). La herramienta de minería de datos ADC4.5Web, incluye una adecuación para web del algoritmo C4.5 (algoritmo que genera árboles de decisión a partir de ejemplos) desarrollado por el Dr. J. Ross Quinlan.
Description: Facultad de Ingeniería Eléctrica. Maestría en Ciencias en Ingeniería Eléctrica
URI: http://bibliotecavirtual.dgb.umich.mx:8083/xmlui/handle/DGB_UMICH/3434
Appears in Collections:Maestría

Files in This Item:
File Description SizeFormat 
FIE-M-2009-0053.pdf955.26 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.