Introducción al Trabajo de Título
Entrar

Librería C++ de alto rendimiento para procesamiento de datos geoestadísticos Memoria Computación para ciencia e ingeniería

Profesor Guia
Profesor Coguia
Sub Áreas Aplicaciones en ciencia e ingeniería, Computación de alto desempeño

Descripción


La geoestadistica es un área que busca encontrar correlaciones entre variables espacio-temporales a partir de diversas fuentes de datos y con una gran variedad de aplicaciones. Para poder ejecutar algoritmos geoestadisticos sobre grandes volúmenes de datos, se han desarrollado implementaciones en C++ con capacidades de alto rendimiento, como paralelismo en CPU y GPU. Los datos de entrada pueden ser de gran volumen y pueden variar en el formato de almacenamiento y la forma de procesarlos según su origen. El resultado de un algoritmo geoestadístico también puede ser de tamaño considerable, y el formato de salida puede variar de acuerdo a la naturaleza del problema tratado. Ya que estos algoritmos pueden aplicarse en distintas áreas, es deseable contar con un estándar de procesamiento de datos aplicable a implementaciones ya existentes.

El objetivo consiste en desarrollar una librería en C++ para el procesamiento de datos geoestadísticos. Al ser utilizada para algoritmos de alto rendimiento, debe estar orientada a optimizar las velocidades de lectura y escritura de los datos procesados, así como su tamaño en RAM y disco. La solución propuesta debe permitir el procesamiento de I/O con los formatos de archivo más comunes utilizados en geoestadística (CSV, GSLIB, HDF5). Se espera que la solución sea capaz de procesar un conjunto de datos de manera parcial o total (por ejemplo, solo algunas columnas o variables), además de soportar casos en que el tamaño en disco del conjunto de datos sea mayor a la RAM disponible.