GenDB:下一代查询处理,不再靠手工工程,而靠合成生成
这篇论文提出 GenDB,把查询处理从“维护一个通用数据库引擎”转向“为每条查询合成面向实例的执行代码”,并通过 TPC-H 与 SEC-EDGAR 实验展示出明显的性能潜力。核心命题传统 DBMS 很难持续吸收新型负载、硬件和数据类型能力,扩展成本高,系统复杂度也高。GenDB 主张用 LLM 多 Agent 按查询…
转载说明:本文译自 arXiv 论文《GenDB: The Next Generation of Query Processing — Synthesized, Not Engineered》。作者:Jiale Lao、Immanuel Trummer。原发布方:arXiv。原文发布日期:2026-03-02。原文地址:https://arxiv.org/html/2603.02081v1。GenDB:下一代查询处理,不再靠手工工程,而靠合成生成 作者:Jiale Lao、Immanuel Trummer摘要 传统查询处理依赖由大量专家精心优化和工程化实现的数据库引擎。然而,新技术与新的用户需求演化得非常快,现有系统往往难以及时跟上。同时,这些系统由于内部复杂度很高而难以扩展,而从头开发新系统又需要大量工程投入和成本。本文认为,近期大型语言模型(LLM)的进展,正在开始塑造下一代查询处理系统。 本文提出,不再持续构建、扩展和维护复杂的查询处理引擎,而是改为让 LLM 为每一条到来的查询合成执行代码。作为概念验证,作者提出了 GenDB:一个由 LLM 驱动的 Agentic 系统,它能够针对特定数据、工作负载与硬件资源,生成面向具体实例优化、可定制的查询执行代码。 作者实现了 GenDB 的一个早期原型,其中多 Agent 系统的底层组件使用 Claude Code Agent,并在 OLAP 工作负载上进行了评测。实验使用了广为人知的 TPC-H 基准,同时又构造了一个新的基准来降低 LLM 训练数据泄漏的可能性。作者将 GenDB 与 DuckDB、Umbra、MonetDB、ClickHouse、PostgreSQL 等最先进查询引擎进行比较,结果显示 GenDB 的性能显著优于这些系统。最后,论文讨论了 GenDB 当前的局限,并给出了未来扩展方向与相关研究挑战。 PVLDB 复现实验资源:源代码、数据及其他相关材料可在 https://github.com/SolidLao/GenDB 获取。1. 引言 几十年来,数据库管理系统(DBMS)已经发展出大量实现形态(Momjian, 2001; Raasveldt and Mühleisen, 2019; Neumann and Freitag, 2020; Schulze et al., 2024; Zukowski et al., 2005; Fernandes and Bernardino, 2015; Dageville et al., 2016)。这些系统通过复杂设计与精细工程化实现,来获得高性能和丰富功能。 但新技术与用户需求变化很快,现有系统往往跟不上,只能依赖外部扩展,甚至需要从头设计新的系统。例如 PostgreSQL 在 OLTP 场景中表现优秀,但对于 OLAP、时序数据实时分析、向量嵌入存储与相似度检索等负载就不够理想。围绕 PostgreSQL 已经出现了很多扩展(DuckDB, 2025; Timescale, 2025; pgvector, 2025),也有一些扩展尝试缓解原始架构的限制,例如面向 page 的存储布局对向量索引并不高效(Liu et al., 2026)。与此同时,也有不少为这些场景专门打造的系统,它们通常能取得显著更高的性能(Shen et al., 2023; Wang et al., 2021; Pinecone Systems Inc., 2026; Neumann and Freitag, 2020; Schulze et al., 2024; Dageville et al., 2016; Fernandes and Bernardino, 2015)。 由于系统本身非常复杂,扩展数据库系统通常很困难,而且常常会带来兼容性问题与系统故障(Kim et al., 2025)。反过来,从头开发新系统又需要大量工程成本与资金投入。近来还出现了更多新技术,例如多模态数据上的语义查询处理,这已经被整合进一些工业系统(Fernandes and Bernardino, 2015; Dageville et al., 2016);以及原生面向 GPU 的分析处理,它在成本效率上已经优于传统 CPU 方案(Yogatama et al., 2025)。面对这些新技术与未来需求,我们到底应该继续扩展既有系统(例如 PostgreSQL),还是重新设计并实现新系统?或者,其实还存在第三种选择? 本文的核心观点是,LLM 的近期进展正在塑造下一代查询处理范式:不再持续构建、扩展并维护复杂的通用查询引擎,而是为每条查询生成面向该查询的执行代码。作为概念验证,作者提出了 GenDB,这是一套由 LLM 驱动的 Agentic 系统,能够…
正在初始化 WebAssembly 引擎…
首次编译原生模块可能需要数秒
就绪后,页面交互将以接近原生的速度运行