Titulación DCC

Guia
Áreas Ciencia e Ingeniería de datos, Inteligencia artificial, Teoría de la computación
Sub Áreas Minería de datos, Procesamiento de lenguaje natural, Análisis y diseño de algoritmos y estructuras de datos
Estado Disponible
Descripción

Extender métricas de complejidad estructural para grafos (basado en un trabajo reciente nuestro: Measuring the Predictability of Recommender Systems using Structural Complexity Metrics) hacia el dominio del procesamiento de lenguaje natural, modelando el corpus como una matriz documento-término y usando su geometría espectral para identificar documentos redundantes o poco informativos. El objetivo es guiar la selección de subconjuntos de entrenamiento que reduzcan el volumen de datos necesarios para fine-tuning manteniendo el rendimiento en tareas de nlp .