Ingeniería

Permanent URI for this collection

https://hdl.handle.net/10201/63

Bienvenido a la colección de Tesis Doctorales de Ingeniería de la Universidad de Murcia. Este portal está dirigido a los investigadores y profesores de la Universidad de Murcia con la finalidad de aumentar la visibilidad de sus tesis doctorales pertenecientes al ámbito de la Ingeniería.

News

Si es Ud. Investigador o Profesor de la UMU y desea que se integre su Tesis Doctoral en esta colección contacte con la siguiente dirección archivum@um.es

Browse

Now showing 1 - 5 of 167

Restricted
Retroalimentación enriquecida de la dinámica del aula utilizando IA
(Universidad de Murcia, 2026-05-19) Pardo García, Federico; Cánovas Reverte, Óscar; García Clemente, Félix Jesús; Sin departamento asociado; Escuela Internacional de Doctorado
Tradicionalmente, la evaluación y mejora de la práctica docente se ha basado en la observación humana directa, un enfoque que, pese a ser el estándar de oro, conlleva altos costes logísticos y una inherente subjetividad. El campo de las Analíticas de Aprendizaje Multimodal (MMLA) ha experimentado un avance significativo en la capacidad de monitorizar y modelar entornos educativos. Sin embargo, existe una tendencia predominante en la literatura a perfeccionar las técnicas algorítmicas sin proporcionar mecanismos efectivos de retroalimentación hacia el docente, dejando un vacío crítico en la aplicación práctica de estos avances. Esta tesis doctoral aborda dicha desconexión, proponiendo una arquitectura computacional diseñada para el análisis de clases síncronas, con mecanismos de retroalimentación docente. La investigación se estructura en cuatro fases metodológicas incrementales. En primer lugar, se realizó una revisión sistemática de la literatura (2014-2024) que permitió taxonomizar el uso de las características de audio y analizar tendencias en el campo de investigación. Esto llevo a la detección de una ausencia de sistemas de retroalimentación docente. En segundo lugar, se modeló la práctica docente utilizando exclusivamente características paralingüísticas derivadas de la diarización de hablantes (como la gestión de turnos y los silencios), capaces de clasificar metodologías (clase magistral, trabajo en grupo y uso de sistemas de respuesta de estudiantes (SRS)) con alta precisión. En tercer lugar, se implementó una fusión multimodal que integra características paralingüísticas con el análisis semántico de transcripciones mediante modelos de lenguaje, aplicando técnicas de Inteligencia Artificial Explicable (XAI) para desambiguar intervenciones docentes complejas en entornos SRS. Finalmente, los hallazgos se integraron en una plataforma web que permite a los docentes visualizar las métricas extraídas. Los resultados demuestran que el audio contiene niveles estratificados de información pedagógica, donde elementos habitualmente descartados, como el ruido ambiental y el solapamiento de voces, actúan como indicadores válidos de colaboración en el aula. Asimismo, se confirma que la fusión de conocimiento experto (ingeniería de características) con modelos de aprendizaje profundo supera el rendimiento de enfoques puramente textuales en tareas de clasificación de intervenciones. Finalmente, el desarrollo de la plataforma proporciona indicios prometedores de que la entrega de métricas objetivas y transparentes tiene el potencial de activar procesos de reflexión docente.
Open Access
Multimodal analysis of emotion and hate speech in online communication
(Universidad de Murcia, 2026-05-12) Pan, Ronghao; Valencia García, Rafael; García Díaz, José Antonio; Sin departamento asociado; Escuela Internacional de Doctorado
En los últimos años, la comunicación en línea se ha consolidado como uno de los principales espacios de intercambio de información, opinión y debate público. Plataformas digitales como redes sociales, medios en línea o servicios de vídeo han transformado profundamente la manera en que las personas acceden a la información y participan en la construcción del discurso social. Este nuevo ecosistema comunicativo se caracteriza por su alcance global, su inmediatez y la participación activa de los usuarios. No obstante, también ha generado desafíos importantes relacionados con la calidad de la información, la difusión de contenido emocionalmente polarizado y la presencia creciente de lenguaje dañino o discurso de odio dirigido a individuos o colectivos. Las emociones desempeñan un papel fundamental en la forma en que los usuarios interpretan, evalúan y comparten la información en entornos digitales. Numerosos estudios han demostrado que los mensajes que apelan a emociones intensas, como la ira, el miedo o la indignación, tienden a generar mayores niveles de interacción y difusión. De forma paralela, el discurso de odio contribuye a la radicalización del debate público y a la creación de entornos comunicativos tóxicos. Comprender cómo se manifiestan e interactúan estos fenómenos resulta, por tanto, esencial para el análisis del discurso en línea. Tradicionalmente, el análisis automático del contenido digital se ha centrado principalmente en el texto mediante técnicas de Procesamiento de Lenguaje Natural. Sin embargo, gran parte del contenido que circula en Internet es de naturaleza multimodal, combinando texto, audio e imágenes. En este contexto, el análisis exclusivo del texto puede resultar limitado para capturar todos los matices emocionales o contextuales presentes en la comunicación digital. Los avances recientes en Inteligencia Artificial, especialmente en modelos de lenguaje de gran tamaño, ofrecen nuevas oportunidades para abordar el análisis del discurso desde una perspectiva más integrada. El objetivo principal de esta tesis doctoral es desarrollar y evaluar enfoques automáticos para el reconocimiento de emociones y la detección de lenguaje dañino en contenidos de comunicación en línea, prestando especial atención al idioma español. En particular, esta investigación analiza el valor añadido de los enfoques multimodales frente a los modelos unimodales tradicionales, así como el potencial de los modelos de lenguaje de gran tamaño para mejorar el análisis automático del discurso en diferentes contextos. Para alcanzar estos objetivos se adopta una metodología experimental estructurada en varias fases. En primer lugar, se desarrollan y publican nuevos recursos lingüísticos multimodales en español, entre los que destacan los corpus Spanish MEACorpus 2023 y Spanish MTLHateCorpus 2023, diseñados para el análisis de emociones y del discurso de odio respectivamente. Posteriormente, se implementan y evalúan distintos modelos automáticos para el reconocimiento de emociones y la detección de lenguaje dañino, incluyendo enfoques unimodales, multimodales y estrategias de aprendizaje multitarea. Asimismo, se analizan diferentes paradigmas de aprendizaje con modelos de lenguaje de gran tamaño, tales como zero-shot, few-shot y fine-tuning, con el fin de evaluar su capacidad de generalización y su eficacia en tareas complejas de análisis del discurso. Los resultados obtenidos muestran que la integración de múltiples modalidades mejora significativamente el rendimiento de los sistemas de reconocimiento de emociones en comparación con los enfoques basados únicamente en texto o audio. Asimismo, el aprendizaje multitarea permite modelar de forma más completa las diferentes dimensiones del discurso de odio, capturando relaciones semánticas y pragmáticas entre ellas. En cuanto al uso de modelos de lenguaje de gran tamaño, los experimentos evidencian que las estrategias de few-shot learning pueden ofrecer resultados competitivos en determinados escenarios, especialmente cuando se emplean métodos optimizados de selección de ejemplos
Open Access
Securing Healthcare Domains and Empowering Patients Through Decentralized and Self-Sovereign Identity Technologies
(Universidad de Murcia, 2026-04-16) López Martínez, Antonio; Gil Pérez, Manuel; Ruiz Martínez, Antonio; Sin departamento asociado; Escuela Internacional de Doctorado
El sector sanitario, se encuentra actualmente en una encrucijada entre la innovación y la vulnerabilidad. Gestionar datos personales sensibles y proteger vidas humanas lo convierte en un objetivo para los ciberataques, enfrentando costes por incidente de seguridad más altos que en otros sectores. Al mismo tiempo, se están estudiando nuevas tecnologías como Machine Learning y Blockchain para mejorar la atención al paciente y optimizar procesos. Sin embargo, la transición hacia un sistema sanitario impulsado digitalmente sigue obstaculizada por desafíos persistentes: resistencia al cambio, marcos regulatorios estrictos y limitaciones presupuestarias. Además, la falta de mapeos estandarizados para el diverso ecosistema de actores genera ambigüedad y deja expuestas brechas en las defensas de seguridad. Los paradigmas actuales, como la centralización, amplifican estos riesgos al crear puntos únicos de fallo. Mientras tanto, los intentos de descentralización en ciertos países han dado lugar a registros fragmentados y a una accesibilidad comprometida del paciente entre regiones o proveedores. Como respuesta, el modelo de Identidad Autosoberana (SSI) surge como un enfoque prometedor, que empodera a los pacientes para controlar sus datos mediante identificadores descentralizados y credenciales criptográficamente seguras, con el potencial de mejorar la seguridad de los datos en el ámbito sanitario. Bajo la modalidad de compendio, los cuatro capítulos que componen esta tesis doctoral (tres publicados y uno en revisión) abordan el objetivo de analizar la seguridad y la privacidad en el dominio sanitario y proponen un marco de gestión de datos centrado en el paciente. Para ello, en primer lugar, se realizó una revisión de la literatura sobre problemas de seguridad y privacidad en el sector, abordando los actores y componentes del sistema de salud, los principales ciberataques con una propuesta de taxonomía, las líneas de investigación actuales sobre mecanismos de seguridad, los conjuntos de datasets y los retos que orientan el desarrollo de esta tesis. En segundo lugar, se definió un caso de uso clínico, analizando los protocolos, componentes, tipos de datos y el desarrollo de requisitos de seguridad y privacidad para protegerlo. Además, se propusieron mecanismos seguros en función de la criticidad de los datos gestionados en cada requisito. El tercer capítulo definió un framework SSI para los datos del paciente, implementando una wallet en el dispositivo del paciente y tecnología blockchain como fuente de confianza y registro verificable de datos, permitiendo el intercambio seguro de datos clínicos gracias a las Credenciales Verificables (VCs). En cuarto lugar, el framework SSI inicial se amplió para proponer un modelo de control de acceso. A partir del análisis de los participantes del sistema sanitario y tres casos de uso distintos, se definió la composición de una Historia Clínica Electrónica (EHR). Uniendo participantes sanitarios con EHR, se presenta el modelo de control de acceso, aprovechando la tecnología de Smart Contracts (SCs). En este caso, se realizó una evaluación para obtener resultados sobre la viabilidad de la propuesta a nivel nacional. Extrayendo los datos de España sobre la frecuencia de visitas al sistema sanitario y considerando la cantidad de interacciones con nuestro framework, concluimos que podría implementarse para satisfacer las necesidades de gestión de datos sanitarios de un país. No obstante, algunos aspectos de esta investigación permanecen sin resolver. Entre ellos destaca la inclusión de un agente de privacidad impulsado por IA en el framework SSI, integrado en la wallet del paciente para actuar como recomendador en el intercambio de datos con distintos actores del sistema de salud, así como asistente personal en el día a día.
Restricted
Framework for quality assurance of semantic resources and repositories
(Universidad de Murcia, 2026-03-06) Abad Navarro, Francisco; Fernández Breis, Jesualdo Tomás; Martínez Costa, Catalina; Sin departamento asociado; Escuela Internacional de Doctorado
Esta tesis aborda el desafío de evaluar la calidad de los artefactos semánticos, centrándose en las ontologías como un mecanismo fundamental para representar conocimiento en la Web Semántica. Las ontologías codifican conocimiento estructurado que puede ser reutilizado y ampliado por otros usuarios; por ello, garantizar su calidad es esencial para asegurar la coherencia del contenido que albergan y del conocimiento que se genera a partir de ellas. El lenguaje recomendado por el W3C para describir ontologías es OWL, un lenguaje formal basado en lógica descriptiva que permite representar conocimiento mediante axiomas lógicos. Además, OWL admite la incorporación de contenido legible por humanos, como etiquetas, nombres o descripciones, lo que mejora la legibilidad y facilita la reutilización de las ontologías. Sin embargo, este componente léxico, clave para la comprensión humana, ha recibido tradicionalmente menos atención en los procesos de evaluación de calidad. El objetivo principal de esta tesis es aprovechar el contenido legible por humanos presente en ontologías para desarrollar nuevos métodos que permitan medir y mejorar su calidad. Para ello, se plantearon cinco objetivos específicos: OB1: Desarrollar modelos de representación en grafo que exploten los aspectos estructurales de las ontologías. OB2: Diseñar métodos de enriquecimiento basados en la información léxica. OB3: Definir un proceso para evaluar la calidad desde la perspectiva del contenido legible por humanos. OB4: Proponer métricas cuantitativas derivadas de dicha información. OB5: Evaluar las metodologías desarrolladas en escenarios reales. La metodología seguida en esta tesis integra análisis estructural, evaluación léxica y técnicas basadas en modelos de lenguaje. En primer lugar, se desarrolló la librería Graphlib, que permite representar ontologías como grafos y calcular propiedades estructurales relevantes, como rutas mínimas y relaciones jerárquicas entre entidades. Esto sirvió como base para los análisis posteriores. En segundo lugar, las técnicas de enriquecimiento se basaron en identificar la semántica oculta presente en los nombres de las entidades, bajo la idea de que la información léxica refleja patrones semánticos que no siempre están formalizados mediante axiomas lógicos en la ontología. Estos métodos permiten detectar conceptos relacionados léxicamente pero no conectados semánticamente, lo que facilita identificar axiomas faltantes o inconsistencias en la nomenclatura. Las principales contribuciones metodológicas son los marcos de evaluación HURON y OCALM. HURON proporciona un proceso sistemático para evaluar la legibilidad humana, definiendo buenas prácticas al incluir contenido legible por humanos en ontologías y métricas cuantitativas que miden hasta qué punto las buenas prácticas propuestas están siendo adoptadas. Con ello, se aborda un aspecto crítico pero habitualmente subestimado del diseño de ontologías. OCALM evalúa la cobertura de dominio mediante modelos de lenguaje como FastText, BERT u OWL2VEC*, midiendo la alineación entre los conceptos de una ontología y la terminología de un corpus específico del dominio. Ambos marcos se aplicaron a ontologías ampliamente utilizadas, como SNOMED CT o Gene Ontology, demostrando su robustez y aplicabilidad. Los resultados muestran que los métodos propuestos detectan aspectos de calidad de las ontologías estudiadas. HURON reveló problemas de inconsistencias de nombres, etiquetas ambiguas y falta de contenido legible en ontologías de OBO Foundry. A su vez, OCALM permitió seleccionar de forma fiable la ontología más adecuada para dominios definidos mediante texto en lenguaje natural. En conjunto, esta tesis contribuye al objetivo de hacer que la Web Semántica sea no solo interpretable por máquinas, sino también más comprensible y utilizable por personas, mejorando la fiabilidad y usabilidad de las ontologías mediante evaluaciones centradas en legibilidad, coherencia y cobertura de dominio.
Open Access
Accurate context sensitive prediction for speculative techniques in processors
(Universidad de Murcia, 2026-02-20) Kim, Sebastián Sumin; Ros Bardisa, Alberto; Sin departamento asociado; Escuela Internacional de Doctorado
Con cada nueva generación, los procesadores de alto rendimiento adoptan técnicas cada vez más agresivas para extraer más rendimiento. La ejecución fuera de orden, los mecanismos avanzados de comunicación de memoria y la fusión de instrucciones aportan mejoras significativas, pero dependen en gran medida de la especulación. A medida que los diseños se amplían, estos mecanismos especulativos se vuelven más vulnerables a los fallos de predicción, lo que puede costar hasta un 15% del rendimiento potencial. En este contexto, la predicción de dependencias de memoria es esencial para garantizar que los loads no pasen por alto los stores más antiguos a la misma dirección. Asimismo, la fusión de instrucciones se ha utilizado para reducir la presión sobre el pipeline, aunque las implementaciones industriales se centran casi exclusivamente en patrones consecutivos simples. Solo una propuesta previa exploró la fusión especulativa de instrucciones de memoria no consecutivas basada en predicción. Sin embargo, los enfoques actuales para la predicción de dependencias de memoria y la fusión especulativa siguen siendo limitados. La mayoría adoptan ideas procedentes de predictores de saltos, pese a que, como defendemos en esta tesis, no son adecuadas para estos dominios y suelen producir ineficiencias. Sostenemos que la información contextual utilizada para las predicciones debe seleccionarse con mayor cuidado. El uso de historias de longitud fija, o la búsqueda por fuerza bruta de la mejor longitud, puede generar rutas demasiado largas que introducen ruido o demasiado cortas que producen aliasing. Defendemos que cada predicción debe entrenarse únicamente con la información situada entre las instrucciones implicadas. Si el camino entre dos instrucciones se repite, también es probable que se repita su interacción. Bajo esta premisa, el objetivo de la tesis es revisar mecanismos especulativos desde la perspectiva de la sensibilidad al contexto. La hipótesis es que la precisión y la eficiencia pueden mejorar significativamente si los mecanismos se adaptan al contexto dinámico específico de cada interacción, en lugar de basarse en historias estáticas o genéricas. Para validar esta hipótesis, diseñamos y evaluamos nuevos predictores capaces de aprovechar el contexto relevante para ampliar la especulación y reducir sus riesgos. La primera parte de la tesis estudia al Store Sets, predictor que continúa utilizándose como referencia en la predicción de dependencias de memoria. Nuestro análisis identifica cinco limitaciones fundamentales, en su mayoría relacionadas con la serialización innecesaria de instrucciones de memoria. Basándonos en estas observaciones, presentamos PHAST, un nuevo predictor de dependencias que abandona los enfoques de distancia fija y de conjuntos. PHAST aprende de la ruta real de ejecución entre un store conflictivo y el load dependiente, permitiéndole identificar qué store debe proporcionar el valor al load con gran precisión. Este entrenamiento elimina numerosas falsas dependencias y reduce los squashes del pipeline. Con solo 14,5KB de presupuesto hardware, PHAST reduce el MPKI un 62% de media y obtiene un speedup del 1,29% respecto al estado del arte, con mejoras de hasta el 22%, acortando la distancia hasta un predictor ideal en apenas un 1,5%. La última parte aborda la predicción de fusión de instrucciones. La única propuesta previa de fusión no consecutiva se fundamenta en un predictor Tournament, diseño que consideramos inadecuado para esta tarea. Para resolver sus limitaciones, presentamos FLIP, un predictor de fusión basado en el mismo principio de sensibilidad al contexto que PHAST. FLIP identifica oportunidades de fusión no consecutiva entre loads y stores, e introduce un conjunto de optimizaciones destinadas a relajar restricciones innecesarias y reducir los casos perjudiciales. Nuestros experimentos muestran que FLIP mejora el rendimiento en un 2,44% en SPEC CPU 2017 y en un 2,94% en MiBench, mientras reduce el MPKI en un 83%.

Browse

Recent Submissions