Logo de DuckDB

DuckDB, la base de datos analítica embebida que se ha convertido en una de las herramientas favoritas de la comunidad de datos, mantiene un ritmo acelerado de releases. La línea 1.4 LTS consolida una tanda de novedades de calado y, en paralelo, DuckLake —el formato de lakehouse del proyecto— suma interoperabilidad con Apache Iceberg, un guiño directo al estándar que domina el sector.

Entre las funcionalidades destacadas de la rama 1.4 figuran la sentencia MERGE (upserts en una sola operación), el tipo VARIANT para datos semiestructurados, un motor de ordenación reescrito que mejora el rendimiento, cifrado AES-256 y la escritura de tablas Iceberg. A ello se suma pg_duckdb 1.0, la extensión que incrusta el motor analítico de DuckDB dentro de PostgreSQL para acelerar cargas OLAP sin sacar los datos de la base relacional. La adopción acompaña: DuckDB ha superado el millón de descargas semanales en PyPI, señal clara de su penetración en flujos de ciencia de datos e ingeniería.

La pieza más estratégica es DuckLake. Frente a la complejidad de montar un lakehouse completo, DuckLake propone gestionar los metadatos de las tablas en una base de datos SQL estándar, simplificando la arquitectura. Que ahora interopere con Iceberg significa que un equipo puede trabajar en local con DuckDB y conectar con catálogos y tablas Iceberg del resto de su plataforma, sin fricción. MotherDuck, la empresa comercial detrás del ecosistema, ofrece además una versión gestionada de DuckLake con vocación de escalar a petabytes.

El interés de DuckDB para los profesionales del dato está en su filosofía: cero configuración, ejecución en proceso y un coste mínimo para analítica que antes exigía un data warehouse. En 2026 se ha consolidado como la referencia para análisis ad hoc, prototipado y cargas de tamaño «humano», el segmento donde levantar un clúster cloud resulta desproporcionado. La interoperabilidad con Iceberg lo encaja, además, dentro de arquitecturas abiertas más grandes en lugar de dejarlo como una isla.

Para los equipos que evalúan su stack analítico, la lección es que no todo necesita un motor cloud masivo: una parte creciente del trabajo cabe en un portátil con DuckDB, y eso reordena decisiones de coste y arquitectura.

Más en Dataprix: Bases de datos en Dataprix.

Fuente: DuckDB