Titulación DCC

Guia
Áreas Inteligencia artificial
Sub Áreas Visión computacional
Estado Disponible
Descripción

La estimación de pose 6D es un problema central en visión computacional con aplicaciones directas en robótica, realidad aumentada y control de calidad industrial. Un desafío fundamental es que muchos objetos presentan ambigüedades de pose: múltiples configuraciones de posición y orientación son igualmente consistentes con la imagen observada. Estas ambigüedades pueden originarse en simetrías intrínsecas del objeto, oclusiones externas, o la combinación de ambas.

El estado del arte aborda este problema desde dos ángulos complementarios pero desconectados:

  • BOP-Distrib propone anotar distribuciones de pose por imagen considerando visibilidad, pero usa únicamente criterios geométricos para determinar ambigüedad
  • SelfSym demuestra que features de DINOv2 back-projected capturan simetrías 3D de forma auto-supervisada, sin necesidad de datos de entrenamiento

La brecha entre ambos trabajos es precisamente el problema que este tema propone atacar: ¿cómo usar features visual-semánticas para determinar de forma más precisa cuándo dos poses son realmente indistinguibles desde una imagen dada?