Guia | |
---|---|
Áreas | Ciencia e Ingeniería de datos, Inteligencia artificial |
Sub Áreas | Recuperación de información, Visión computacional |
Estado | Disponible |
Los modelos atencionales representan una componente natural en arquitecturas de reconocimiento visual (visión por computadora). Estos modelos tratan de generar representaciones relacionando información de diferentes campos receptivos. Así, estos modelos atencionales se relaciona directamente con "Perceptual Grouping", una característica básica de los sistemas de percepción visual.
Los modelos atencionales incorporan información de la ubicación de los campos receptivos a través de "Positional Encoding". Sin embargo, no existe un estudio sobre las diversas formar en que podemos codificar esta información y su impacto en tares de reconocimiento visual. Por lo tanto, en este trabajo ese revisarán un cojunto acotado de técnicas de "positional encoding", evaluando su impacto en recuperación de imágenes basada en contenido.