Databricks ha alcanzado la disponibilidad general de Lakebase, su base de datos PostgreSQL serverless diseñada para unificar cargas transaccionales (OLTP) y analíticas dentro del mismo ecosistema de la plataforma. El lanzamiento en AWS ya está en producción, con Azure en vista previa pública y Google Cloud previsto para finales de 2026.
La propuesta de Lakebase parte de una limitación reconocida: los motores transaccionales tradicionales sufren cuando múltiples procesos de machine learning, pipelines de datos y consultas analíticas compiten por los mismos recursos fijos de CPU y memoria. La arquitectura de Lakebase desacopla cómputo y almacenamiento, permitiendo escalarlos de forma independiente. El modo autoscaling, activado desde marzo de 2026, añade facturación por consumo en Databricks Units (DBUs) y la opción «scale to zero» para entornos de desarrollo o cargas intermitentes.
Más allá del motor PostgreSQL estándar —compatible con la versión 17 y con capacidad hasta 8 TB por instancia—, Lakebase incorpora la extensión pgvector para búsquedas semánticas, lo que lo posiciona directamente para casos de uso de IA generativa: memoria persistente de agentes, generación de features en tiempo real y aplicaciones RAG que necesitan almacenar y recuperar embeddings con baja latencia.
La integración con Unity Catalog proporciona controles de acceso unificados entre los datos transaccionales de Lakebase y las tablas Delta Lake del lakehouse, cerrando uno de los mayores puntos de fricción en arquitecturas que mezclan OLTP y OLAP: la gestión de permisos en dos sistemas separados.
Más en Dataprix: top plataformas de datos para Machine Learning y BI
Fuente: InfoQ