En Google Cloud Next 2026, celebrado en Las Vegas el pasado mes de abril, Google anunció la disponibilidad del Cross-Cloud Lakehouse, una arquitectura basada en Apache Iceberg que permite a BigQuery ejecutar consultas analíticas directamente sobre datos almacenados en Amazon S3 o Azure Data Lake, sin necesidad de copiar ni migrar la información. La solución elimina uno de los principales frenos al análisis multicloud: el coste y la complejidad de mover grandes volúmenes de datos entre proveedores.
El funcionamiento se apoya en tres componentes clave. El primero es el Iceberg REST Catalog, estándar abierto que actúa como capa de metadatos común entre plataformas. El segundo es Cross-Cloud Interconnect, la red de alta capacidad que Google utiliza para minimizar la latencia entre nubes. El tercero es un sistema de caché transparente que almacena los datos consultados en la primera lectura, de modo que las consultas posteriores sobre el mismo conjunto evitan costes de egress y logran rendimiento comparable al de un almacén nativo. Google cifra en un 35 % la mejora de rendimiento de BigQuery en el último año, con costes de procesamiento también a la baja.
Además del Cross-Cloud Lakehouse, Google anunció en el mismo evento la disponibilidad general de Managed Iceberg Tables —anteriormente BigLake— con soporte para transacciones multitabla, captura de cambios (CDC) y optimizaciones históricas automáticas. BigQuery Studio, en preview, incorpora un asistente contextual, celdas de SQL y visualización integradas, y flujos Git nativos. La compañía también presentó el Data Science Agent, que permite a usuarios no técnicos describir en lenguaje natural el análisis que necesitan y delegar la ejecución completa —carga, limpieza, visualización— en un agente de IA sobre BigQuery notebooks.
La propuesta de Google es especialmente relevante para organizaciones con datos distribuidos entre múltiples nubes por razones regulatorias, contractuales o de inercia histórica. Apache Iceberg se consolida como el estándar de facto del ecosistema lakehouse abierto, y la convergencia de Google, AWS y Databricks en torno a este formato reduce el riesgo de adopción para cualquier organización. Para los arquitectos de datos, el Cross-Cloud Lakehouse abre la posibilidad de centralizar la capa analítica en BigQuery sin imponer una migración de infraestructura que sus organizaciones no están listas para abordar.
Más en Dataprix: Plataformas de datos modernas: arquitecturas y herramientas
Fuente: Google Cloud Blog