| Guia | |
|---|---|
| Áreas | Ciencia e Ingeniería de datos, Inteligencia artificial, Teoría de la computación |
| Sub Áreas | Minería de datos, Procesamiento de lenguaje natural, Análisis y diseño de algoritmos y estructuras de datos |
| Estado | Disponible |
Extender métricas de complejidad estructural para grafos (basado en un trabajo reciente nuestro: Measuring the Predictability of Recommender Systems using Structural Complexity Metrics) hacia el dominio del procesamiento de lenguaje natural, modelando el corpus como una matriz documento-término y usando su geometría espectral para identificar documentos redundantes o poco informativos. El objetivo es guiar la selección de subconjuntos de entrenamiento que reduzcan el volumen de datos necesarios para fine-tuning manteniendo el rendimiento en tareas de nlp .