数据库一体机简史:从Britton-Lee的陨落到Exadata和zData的智能复兴
在上一篇《从Teradata到Exadata和zData的容量愿景》中,我们讨论了Teradata开创的“数据库机”时代。很多文献也将Teradata视为第一个成功的商业数据库机创造者,但这一说法其实并不完全准确。
在数据库机的历史上,还有一家名噪一时的公司——布里顿-李(Britton-Lee)。Britton-Lee是世界上第一台大规模量产的商业数据库机的构建者,其一时之兴衰,更能说明数据库机的过往与未来。
1 Memorex(美力思)于1961年创立,是硅谷早期的标志性企业之一。公司最初以生产高质量计算机磁带起家,并迅速成为挑战IBM在大型机外设领域垄断地位的重要竞争者。其业务范围随后扩展至磁盘驱动器、通信设备及各类磁性存储介质,在数据存储技术的黄金时代扮演了关键角色。对于全球大众消费者而言,Memorex最辉煌的印记源于其20世纪70年代的经典营销活动——那句著名的广告语“是现场演出,还是Memorex?”(Is it live, or is it Memorex?),配合爵士天后艾拉·费兹洁拉(Ella Fitzgerald)极具穿透力的歌声与震撼的影像,完美诠释了其高保真录音带的性能,成为广告史上的传奇。Memorex于1981年被Burroughs公司收购,后曾作为Unisys的一部分。上世纪90年代后,品牌权先后流转于坦迪(Tandy)及Imation公司。尽管传统的磁带和磁盘制造业务已随技术更迭远去,但Memorex至今仍是全球知名的消费电子品牌,涵盖光存储、闪存及各类配件。
2 鲍勃·爱泼斯坦(Bob Epstein)拥有电气工程与计算机科学博士学位,专业方向为分布式数据库系统(辅修音乐)。他早期的职业生涯专注于数据库与网络技术的商业化。1976年至1979年,他担任加州大学伯克利分校Ingres项目的负责人。1979年至1984年,爱泼斯坦担任Britton-Lee的开发副总裁兼首席架构师。1984年,他作为首席架构师和倡导者,通过创建Sybase及开发SQL Server,推动了客户端/服务器计算模式的发展,后者最终通过纳入中间件和开发工具,发展成为价值数十亿美元的业务。爱泼斯坦联合创办了Sybase、GetActive Software、Zight和Britton-Lee四家信息技术公司。
Britton-Lee的“智能数据库机”(Intelligent Database Machine,IDM)于1981年正式推出(比Teradata早3年),主要包括IDM 500和IDM 200两种型号。在宣传中,他们将IDM称为“真正的数据库机(A TRUE DATABASE MACHINE)”。这一命名是否似曾相识?——Oracle的RAC全称是Real Application Cluster。从“True”到“Real”,技术圈里真假难辨,最后导致大家在命名上开始较劲。此外,数据库一体机从诞生之初,就以“智能”为名,其核心价值就是通过智能化加持,使软硬件协同创造超越用户期待的性能奇迹。
图3展示了IDM 500的产品架构。图中清晰显示,Britton-Lee IDM的本质是一种数据库加速外设。它必须作为“后端(Back-end)”连接到大型主机或大型微机,无法独立面向终端用户提供计算服务。这种“术业有专攻”的设计,正是早期“Database Machine”理念的精髓:让计算归计算,让数据处理归数据处理。
在20世纪80年代,计算资源极其昂贵,架构分工非常明确。Britton-Lee的设计初衷是“卸载(Offloading)”。Britton-Lee IDM实际上实现了现代存储界梦寐以求的“近数据计算(Near-Data Computing)”。传统存储必须把成千上万条原始数据搬运到主机内存,再由CPU判断哪些数据符合条件。这会导致主机网络带宽被占满(I/O瓶颈)。IDM内部集成了处理器和硬件加速器(Database Accelerator),它在数据离开自己的机箱之前,就把不需要的数据“扔掉”了。

图3 IDM 500的产品架构图
Britton-Lee的IDM数据库机中包含了完整的数据库系统,具有清晰完整的技术栈层次,其中并发控制、审计日志、崩溃恢复等功能一应俱全。主机系统则负责查询、报表等用户侧功能的实现。
到1983年,Britton-Lee销售了大约200台IDM数据库机,取得了良好的开端。但是行业也在发生变化,随着硬件技术的加速进步,爱泼斯坦认为为数据库研发专用硬件已无必要,应该将优化聚焦于数据库软件层完成,客户端/服务器架构的理念在他脑海中形成。
3 汤姆·哈根(Tom Haggin)毕业于加州大学伯克利分校,与Bob Epstein为校友及好友。加入Sybase前,他在Britton-Lee担任MIS(管理信息系统)主管,负责开发数据库管理系统应用程序。在Sybase,他主要负责应用程序接口和开发工具。他是DB-Library(Sybase客户端API)和OpenServer(服务器端API框架)的主要设计者和开发者。他还是ODBC规范前身(SQL Connectivity)的核心制定者之一。他曾与微软的Kyle Geiger和Jim Gray合作,推动了动态SQL的标准化。哈根在Sybase工作了约10年,于1994年左右离开。随后他创立Tilden Park Software公司并担任负责人,专注于商业软件产品的设计与开发。
4 简·多尔蒂(Jane Doughty)毕业于加州大学伯克利分校。Bob Epstein曾评价其编程天赋极高,且项目管理能力卓越。在Britton-Lee时期,她与Bob Epstein、Tom Haggin等人共同参与数据库技术的开发。她是Sybase的四位联合创始人之一。在公司早期,她负责数据库服务器(Database Server)的工程研发工作,是核心技术架构的奠基人之一。她在Sybase 1991年IPO前离开了公司,原因是搬迁至外州(威斯康星州麦迪逊市)。她的丈夫是著名计算机科学家、威斯康星大学麦迪逊分校教授David A. Wood。
在技术创新期的瞬息万变中,形势可能一夜之间就会逆转。Britton-Lee在1987年经历了数据库机销售的严重放缓,当年营收约2500万美元,亏损约900万美元。当年第四季度亏损250万至290万美元,其中包括为裁减约50名员工(占当时280名员工总数的20%)所计提的准备金。
1990年,Britton-Lee被Teradata收购。在这一时期,Teradata成为“数据库机”领域的唯一幸存者。
此处可作一小结:专用硬件和通用硬件之争,是数据库机成败的关键。其次,是硬件与软件之争,当硬件进化速度超过软件,数据库机就获得关注;当软件进化速度超过硬件,数据库机就归于沉寂。可谓此起彼伏、此消彼长。
1991年9月,AT&T公司收购了NCR公司,后者于12月宣布以约2.5亿美元收购了Teradata。幸运的是,Teradata并未在并购中沉沦。2007年1月,NCR宣布Teradata将成为一家独立的上市公司。图6是Teradata自2007年以来的收入变化曲线。截至2026年1月底,Teradata的市值约为26亿美元。

图6 Teradata收入历史趋势图
Teradata的目标市场是数据仓库。伴随着开源产品(如Hadoop等)的普及以及大数据技术的崛起,其市场进一步被蚕食。
真正为数据库一体机带来复兴的是Oracle。Exadata以通用硬件为基础,将数据库一体机从OLAP环境拓展到OLTP环境,从而为“数据库一体机”打开了广阔市场,开启了真正波澜壮阔的新时代。而云和恩墨的zData更进一步,通过分布式存储技术,将数据库一体机推进到通用数据库支持范畴,实现了统一数据库运行平台的交付,大大简化了用户的数据库基础设施架构。
从Teradata到Exadata和zData,数据库一体机经历了从“专用硬件+专用软件”到“通用硬件+专用软件特性”再到“通用硬件+通用软件”的演进过程(如图7所示)。

图7 数据库一体机的时代演进
“专用硬件+专用软件”时代:早期Teradata使用自研的专用网络交换机和网卡(BYNET)。BYNET是系统的“神经中枢”,负责处理MPP架构中的节点间高速通信、合并排序和消息广播。整个系统被封装在特定的物理机柜中,包含定制的存储阵列和容错电源。
“通用硬件+专用软件特性”时代:Exadata设计的核心目标是使用通用硬件,采用开放架构实现集成化交付。Oracle采用InfiniBand技术作为网络互连方案;在数据库软件层面,通过Smart SCAN技术、混合列压缩等专用软件特性实现一体机加速。
“通用硬件+通用软件”时代:zData的设计目标是通过智能化的软件定义存储技术,面向数据库场景提供高性能块存储,实现软硬件解耦并支持所有数据库产品。用户可采用经官方认证的通用硬件,构建自有的数据库统一存储资源池,实现性能与成本的自主可控。
从以上演进过程可以看到,技术的进化是在需求驱动下不断重塑的。例如,zData为顺应国内用户的需求,从过去仅支持Mellanox的InfiniBand,进化为支持更通用的RoCE(RDMA over Converged Ethernet)高速网络技术;网络带宽从过去的100Gb扩展为支持从25Gb到200Gb的不同带宽配置;硬件平台也从Intel处理器扩展到支持AMD、海光、鲲鹏等处理器;支持的数据库更是从Oracle扩展到DB2、SQL Server、MySQL、PostgreSQL、GaussDB、OceanBase、达梦、崖山等数十种。如图8所示,zData的进化,为用户带来了稳定可靠、性能卓越的数据库运行平台。通过整合的数据库资源池和智能化运维能力,数据库管理效率显著提升,运营成本也得以优化。

图8 云和恩墨数据库一体机从zData到zData X的进化
作为补充,关系型数据库在诞生之初,曾被认为最适合数据仓库场景,因为当时其性能表现有限,但具备存储更多数据的能力。DB2诞生后,就是作为IMS的补充先被尝试用于分析型系统的。而Oracle创始人拉里·埃里森也曾回忆说:“我们经历了传统观点所预测的那些非常严重的性能问题。我们始终无法让数据库运行得足够快。我们尝试了一个又一个方法。最终我们取得了突破,实现了十倍的性能提升。在最后的测试中,我们的性能超越了当时被认为是最快的PDP-11数据库CODASYL系统运行得更快。”
作为本篇最后的延展,我们通过图10来看一下Britton-Lee的IDM 500一体机在当年的性能表现。由于年代久远,此处不再提供测试用例和详细解释,但可直观看出,数据库机的性能表现非常强劲。

图10 Britton-Lee IDM 500的性能表现
参考文献:
History of Sybase,by Bob Epstein
Oral History of Mark B. Hoffman




