Desafíos de las bases de datos analíticas: seguridad y escalabilidad

Una de las principales preocupaciones en el ámbito del tratamiento y análisis de la información es la mejora de la estructuración y gestión de grandes volúmenes de datos con el objetivo de facilitar y acelerar el acceso a los mismos, de modo que se simplifique su posterior procesamiento mediante técnicas de análisis inteligente.

Este tipo de información, que se puede obtener de fuentes de diversa naturaleza, se recoge tradicionalmente en datacenters, y se almacena en forma de bases de datos clásicas de tipo relacional. Dado que el acceso a los datos y las operaciones sobre los mismos es lento en este tipo de estructuras por la forma en la que se organizan, es necesario realizar un proceso de transformación en nuevas estructuras analíticas que agreguen la información en múltiples dimensiones. Este proceso permite acelerar las consultas sobre los datos, sacrificando no obstante espacio de almacenamiento, al ser necesaria redundancia.

Uno de los principales problemas de los sistemas de almacenamiento de datos actuales radica en que las soluciones de seguridad existentes son altamente costosas computacionalmente. Esto se debe a la ineficiencia de los algoritmos de cifrado por bloques como AES y los procedimientos de firmado empleados típicamente para verificación de integridad (como por ejemplo SHA-1) en las de bases de datos relacionales y, por extensión, en los sistemas analíticos. Por ello, es necesario mejorar el rendimiento de estos procedimientos o idear nuevos algoritmos adecuados para estructuras analíticas.

Por otro lado, la utilización de bases de datos analíticas conlleva problemas de escalabilidad debido al espacio de almacenamiento que necesitan. Para solucionar los problemas de eficiencia asociados al acceso a la información contenida en ellas se han propuesto aproximaciones centradas en el almacenamiento de datos en memoria principal (bases de datos in-memory). La mayor ventaja de esta solución reside en su respuesta extremadamente rápida a consultas de usuario con tiempos subjetivos despreciables; no obstante, esta clase de estructuras no ofrecen soporte de bajo nivel para operaciones complejas, por lo que ven restringidas interacciones que se pueden realizar en un tiempo limitado.

En Gradiant se dispone de una línea de investigación en la que se trabaja para conseguir mejorar el comportamiento de estos sistemas, permitiendo su adaptación a diversos entornos y para fuentes de información variadas.