Guia | Coguia Externo | ||
---|---|---|---|
Áreas | Computación para ciencia e ingeniería | ||
Sub Áreas | Aplicaciones en ciencia e ingeniería, Computación de alto desempeño | ||
Estado | Disponible |
La geoestadistica es un área que busca encontrar correlaciones entre variables espacio-temporales a partir de diversas fuentes de datos y con una gran variedad de aplicaciones. Para poder ejecutar algoritmos geoestadisticos sobre grandes volúmenes de datos, se han desarrollado implementaciones en C++ con capacidades de alto rendimiento, como paralelismo en CPU y GPU. Los datos de entrada pueden ser de gran volumen y pueden variar en el formato de almacenamiento y la forma de procesarlos según su origen. El resultado de un algoritmo geoestadístico también puede ser de tamaño considerable, y el formato de salida puede variar de acuerdo a la naturaleza del problema tratado. Ya que estos algoritmos pueden aplicarse en distintas áreas, es deseable contar con un estándar de procesamiento de datos aplicable a implementaciones ya existentes.
El objetivo consiste en desarrollar una librería en C++ para el procesamiento de datos geoestadísticos. Al ser utilizada para algoritmos de alto rendimiento, debe estar orientada a optimizar las velocidades de lectura y escritura de los datos procesados, así como su tamaño en RAM y disco. La solución propuesta debe permitir el procesamiento de I/O con los formatos de archivo más comunes utilizados en geoestadística (CSV, GSLIB, HDF5). Se espera que la solución sea capaz de procesar un conjunto de datos de manera parcial o total (por ejemplo, solo algunas columnas o variables), además de soportar casos en que el tamaño en disco del conjunto de datos sea mayor a la RAM disponible.