DigitalUM :: Browsing by Subject "Minería de datos"

Browsing by Subject "Minería de datos"

Now showing 1 - 4 of 4

Open Access
Algoritmos de clasificación y redes neuronales en la observación automatizada de registros
(Murcia: Servicio de Publicaciones de la Universidad de Murcia, 2015) González Ruiz, Sergio Luis; Gómez-Gallego, I.; Pastrana Brincones, José Luis; Hernández-Mendo, Antonio
El objetivo del presente estudio es analizar los datos obtenidos a través de una plataforma on-line, mediante diferentes técnicas de clasificación y aprendizaje orientadas al descubrimiento del conocimiento. Se aplican técnicas de minería de datos para obtener relaciones de fiabilidad que informen del interés de los usuarios por cumplimentar de manera rigurosa el cuestionario on-line atendiendo al modo de realizar el mismo. Aunque existen técnicas que nos permiten observar el comportamiento de los usuarios mientras realizan el cuestionario, en este caso se emplean Redes Neuronales Artificiales para predecir el comportamiento de aquellos, atendiendo a variables obtenidas al realizar el cuestionario. La muestra consta de 1.636 participantes de diferentes zonas geográficas y rangos de edad, obtenida al contestar de manera anónima o identificada al cuestionario Inventario Psicológico para el Seguimiento de Talentos Deportivos (IPSETA). Los resultados obtenidos mediante las diferentes técnicas de análisis informan que el género femenino pre#ere realizar el registro en la plataforma para cumplimentar el cuestionario, alcanzando un alto porcentaje de fiabilidad (70%).
Open Access
Metodologías basadas en minería de datos para el diseño y optimización de técnicas de clasificación automática
(2015-01-26) Martínez España, Raquel; Cadenas Figueredo, José Manuel; Garrido Carrera, María del Carmen; Facultad de Informática
La motivación para el desarrollo de esta tesis doctoral se centra en la problemática de la escasez de técnicas de Análisis Inteligente de Datos que trabajen de forma directa con datos imperfectos. Esto ha estado provocado debido al avance de las nuevas tecnologías las cuales han permitido el almacenamiento de grandes volúmenes de información compuestos de diferentes tipos de datos no siempre tan precisos y perfectos como sería deseable. El objetivo global, y por tanto, los objetivos parciales, se encuentran centrados en el desarrollo de técnicas del Análisis Inteligente de Datos que hagan uso de las metodologías que ofrece el Softcomputing para trabajar con datos imperfectos (datos de baja calidad) de forma directa, sin necesidad de una transformación previa. Específicamente, la tesis se centra en las fases de Preprocesamiento de Datos y de Minería de Datos del Análisis Inteligente de Datos. Por una parte, en la fase de Minería de Datos, se proponen las extensiones de tres técnicas. Concretamente, un árbol de decisión fuzzy, un ensamble de árboles de decisión fuzzy y una técnica basada en vecindad. Para la extensión del árbol de decisión fuzzy y del ensamble se ha definido una medida de similitud para calcular el grado de pertenencia de un valor de baja calidad a cada uno de los descendientes de un nodo N dado. Para la extensión de la técnica basada en vecindad (regla k-NN) se ha definido una serie de medidas distancia para calcular la distancia entre los ejemplos y sus vecinos teniendo presente que estos pueden contener datos de baja calidad. Por otra parte, en la fase de Preprocesamiento se propone el diseño e implementación de un conjunto de técnicas que soporten datos de baja calidad. Concretamente, las técnicas presentadas abarcan los procesos de discretización de atributos numéricos, la selección de atributos, la selección de ejemplos y la imputación de valores missing. En la discretización de atributos se ha diseñado una técnica híbrida compuesta por un árbol de decisión fuzzy y un algoritmo genético. La técnica de selección de atributos propuesta es un algoritmo híbrido compuesto por una técnica de filtrado y una técnica wrapper. Por otro lado la técnica de imputación se basa en el diseño de una nueva regla para la técnica de K-NN y para el proceso de selección de ejemplos se ha utilizado la idea básica de una técnica de condensación de ejemplos, con el fin de seleccionar los más representativos. Además se ha desarrollado una herramienta software que recoge parte de las técnicas de preprocesamiento de datos propuestas y desarrolladas a lo largo de la tesis. El objetivo de esta herramienta software, llamada “NIP imperfection processor” (NIPip), es proporcionar un marco de trabajo común donde los investigadores puedan llevar a cabo un preprocesamiento sobre conjuntos de datos bien para añadirles datos de baja calidad o bien para transformar dicho datos de baja calidad en otros tipos de datos. Como conclusión final debemos comentar que las técnicas propuestas y extendidas, y tras realizar un conjunto de experimentos validados estadísticamente, han mostrado un comportamiento robusto, estable, muy satisfactorio y optimista tanto cuando trabajan con datos de baja calidad como datos crisp. Además la herramienta software propuesta aporta un nuevo marco de trabajo, y una mayor flexibilidad y rapidez a la hora de preprocesar datos tanto de baja calidad como crisp, lo cual es muy importante para el diseño de experimentos a gran escala. The motivation for the development of this doctoral thesis is focused on the problem of the shortage of techniques of Intelligent Data Analysis, working directly with imperfect data. This has been caused by the advance of new technologies which have allowed the storage of large volumes of information of different types composed of data that are not always as precise and perfect as desired. The global aims, and therefore partial objectives, are focused on the development of techniques of Intelligent Data Analysis making use of methodologies provided by Softcomputing to work directly with imperfect data (low quality), without a need for previous transformation. Specifically, the thesis is focused on the Intelligent Data Analysis phases of data preprocessing and data mining. On the one hand, in the phase of data mining, the extensions of three techniques have been proposed. Specifically, a fuzzy decision tree, an ensemble of fuzzy decision trees and a technique based on neighborhood. For the extension of the fuzzy decision tree and the ensemble techniques a similarity measure has been defined. This measure is used to calculate the membership degree of a low quality value to each of the descendants of a given node N. For the extension of the technique based on neighborhood (k-NN rule) a set of distance measures to calculate the distance between the examples and their neighbors has been defined, bearing in mind that the examples may contain low quality data. On the other hand, the design and implementation of a set of techniques, that support low quality data, is proposed in the preprocessing phase. In particular, the techniques presented include the processes of discretization of numerical attributes, of attribute selection, of example selection and of missing value imputation. In the discretization of attributes, a hybrid technique has been designed. This technique is composed of a fuzzy decision tree and a genetic algorithm. The attribute selection technique proposed consists of a hybrid algorithm composed of a filtering technique and a wrapper technique. In addition, the imputation technique is based on the design of a new rule for the technique K-NN. For the process of example selection, the basic idea of a condensation technique of examples has been used, in order to select the most representative examples. Also, a software tool has been developed. This tool includes part of the data preprocessing techniques proposed and developed in this doctoral thesis. The aim of this software tool, called "NIP imperfection processor" (NIPip) is to provide a common framework where researchers can perform preprocessing on datasets either to add low quality data to them or to transform this low quality data into other types of data. As a final conclusion, it must be emphasized that the proposed and extended techniques, after performing a set of statistically validated experiments, have shown robust, stable, very satisfactory and optimistic behavior both when working with low quality data and when working with crisp data. Also, the software tool proposed provides a new framework, and greater flexibility and speed in the data preprocessing both low quality and crisp, which is very important for the design of large-scale experiments.
Open Access
Un modelo para estimar las acciones a aplicar a los alumnos de E.S.O.
(Universidad de Murcia. Servicio de Publicaciones, 2008-07-01) Muñoz Ledesma, Antonio; Cadenas Figueredo, José Manuel
We propose a complement to the information provided by the first grades the pupils obtain in Spanish and Mathematics (logical-mathematical and linguistics intelligences). It can be seen that certain parameters related to these abilities have a big impact when determining the decisions that the Guidance, Spanish and Mathematics Departments should take as regards the pupils who have just arrived to school. These decisions can be classified as follows: — to give Spanish and Mathematics support lessons, — to give Spanish and Mathematics reinforcement lessons, — absence of decision, — to question performance according to pupils ability. Using Knowledge Discovery Techniques in Data Bases, it has been proved and confirmed that those parameters are good predictors of the actions to be taken with each as they give results of over 80% of conformity. Thus, we endeavoured, through the values obtained in these parameters, to predict which actions should be adopted in order to improve from the beginning performance in Spanish and Mathematics.
Open Access
Modelos para la mejora del rendimiento académico de alumnos de la E.S.O. mediante técnicas de minería de datos
(2016-01-22) Muñoz Ledesma, Antonio; Cadenas Figueredo, José Manuel; Departamento de Ingeniería de la Información y las Comunicaciones
El objetivo principal de este trabajo es la búsqueda de la mejora del Rendimiento Académico (RA) de los estudiantes de la E.S.O. utilizando como herramienta de análisis la Minería de Datos (a partir de la información tanto académica, personal como la de los tests psicométricos) y siguiendo las pautas que nos marca la Didáctica desde un punto de vista que proporciona el Enfoque Onto-Semiótico (EOS). Este enfoque nos viene dado desde la Didáctica de las Matemáticas, pero puede ser adaptado a cualquier otra área (y así ha sido planteado). La idea que se pretende transmitir es la de proporcionar un sistema que detecte determinados elementos que sirvan a los departamentos didácticos para la mejora del proceso de instrucción y así del RA del alumno. Se busca una mejora en el rendimiento de aquellos objetos (matemáticos o lingüísticos) usados por los alumnos en sus asignaturas a lo largo de la E.S.O., y que puedan afectar de forma colateral a su aprendizaje futuro en otras asignaturas de bachillerato o de la universidad. De manera adicional y complementaria, se ha hecho uso de la Minería de Datos para la cual se ha necesitado un conjunto de datos que represente el campo de estudio. Además, y mediante el uso de estas técnicas (árboles de clasificación, cluster y reglas) se ha caracterizado el proceso de aplicación por los departamentos didácticos de determinadas acciones a los estudiantes. Para dichas acciones se han obtenido buenos predictores que han sido validados, apreciándose la influencia de lengua y matemáticas sobre el resto de asignaturas. Como parte final, se ha procedido a construir un sistema de predicción que nos sirve como protocolo de asignación de una acción a un alumno por los departamentos Didácticos. Se han obtenido unas consecuencias de la aplicación del sistema predictivo haciendo uso de la noción de idoneidad didáctica según EOS sobre las reglas obtenidas, aportando una serie de indicadores. Estos indicadores nos dan información de las trayectorias didácticas del alumno, nos muestran si existe una dispersión en las trayectorias y si se hace necesario, reorientar las acciones realizadas por los Departamentos Didácticos, en el caso de que ésta sea alta para alguna de las Trayectorias Didácticas valoradas. La principal aportación de esta tesis es la introducción del aprendizaje computacional para trabajar sobre la experiencia acumulada y obtener modelos con las técnicas de Minería de Datos. Estos modelos nos muestran el comportamiento de los estudiantes, permitiendo al profesor redirigir las aptitudes del alumno, tratando de evitar un posible fracaso. Asimismo, el uso de estas técnicas nos han proporcionado modelos descriptivos que permiten a los departamentos didácticos, explorar y comprender los datos iniciales e identificar patrones, relaciones y dependencias que impactan en los resultados finales de las evaluaciones. En definitiva, ayudarán en la toma de decisiones tácticas y estratégicas, proporcionando una herramienta de predicción interpretable para el profesor. The main objective of this study is to find ways to improve the Academic Performance (AP) of students at ESO (Secondary Education) through Data Mining (by drawing on the students’ personal and academic information as well as the results of psychometric tests) and in accordance with the didactic guidelines provided by the Onto-Semiotic Approach (OSA). While this approach is typically applied to research in Mathematics, it can be adapted to any other area of knowledge, as is suggested here. The idea behind this approach is to provide the different school departments with a set of tools to improve instruction and, in turn, the students’ AP. The aim is to improve the performance in the mathematical and linguistic objects that are used by students for all subjects throughout ESO and that may have a side effect on their learning at post-compulsory stages of their education, including college and university. To complement our analysis, we used Data Mining, which requires a set of data representing the scope of our study. Moreover, the use of these techniques (classification trees, cluster and rules) helped us to characterise the process of implementation of certain actions by the different school departments. For these actions have had good predictors that have been validated, appreciating the influence of language and mathematics on the other subjects. The final part of this study focuses on the development of a predictive system that enables the different school departments to establish an intervention protocol for each case. The effects of implementing this predictive system have been analysed in terms of didactic suitability as defined by the OSA, which has resulted in a number of indicators. These indicators provide information about the students’ academic progress and, as stated above, allow the different school departments to redirect their actions, if necessary, to address a specific deviation. The main contribution of this thesis would be the introduction of computational learning to make use of our expertise and Data Mining techniques to develop models that allow instructors to monitor the behaviour of their students and redirect their aptitudes to avoid a potential failure. Similarly, these techniques we have proporcionate descriptive models that enable the different school departments to explore and understand the initial data and to identify patterns, relationships and dependencies that have an impact on the students’ final results at the end of each term. In short, they will assist in tactical and strategic decision-making and provide teachers with an interpretable predictive tool

Browsing by Subject "Minería de datos"

Results Per Page

Sort Options