语言
<< 返回文章列表

数据库一体机简史:从Britton-Lee的陨落到Exadata和zData的智能复兴

2026年3月9日
,
z
D
a
t
a
X
,
E
x
a
d
a
t
a
,
B
r
i
t
t
o
n
-
L
e
e
,
盖国强
11

在上一篇《从Teradata到Exadata和zData的容量愿景》中,我们讨论了Teradata开创的“数据库机”时代。很多文献也将Teradata视为第一个成功的商业数据库机创造者,但这一说法其实并不完全准确。

在数据库机的历史上,还有一家名噪一时的公司——布里顿-李(Britton-Lee)。Britton-Lee是世界上第一台大规模量产的商业数据库机的构建者,其一时之兴衰,更能说明数据库机的过往与未来。

图1 大卫·布里顿

Britton-Lee与Teradata同年(1979年)创立,其公司名称来自两位联合创始人——大卫·布里顿(David L. Britton,见图1)和杰弗里·李(Geoffrey M. Lee)。可以说,Britton-Lee与Teradata共同开创了计算机领域“数据库机(Database Machine)”这一新品类。

为什么有Britton-Lee这样的创业机遇呢?原因有两个。

第一个起因是Britton和Lee曾经在生产磁带、磁盘的硅谷传奇公司Memorex1任职,他们对存储设备有着深刻的理解。大卫·布里顿还曾担任国际存储器公司(International Memories)总裁,他于1978年离职寻求创业。第二个起因是当时的硬件资源较弱,新生的关系型数据库性能存在很大的问题,并且关系型数据库最初被认为最适合数据分析场景。

Britton和Lee创业的起点与Oracle非常相似。有一次,一家计算机公司需要磁带支持,但该公司不知道如何实现磁带驱动器软件,于是要求Britton和Lee在约三个月内开发一款PC磁带站软件。他们及时地完成了该项目,获得了约一百万美元的高额报酬,并决定用这笔钱开设Britton-Lee公司。Oracle的起点类似:拉里·埃里森(Larry Ellison)就职的精密仪器公司(PIC)希望推出一种取代缩微胶卷及其读取器的产品,PIC以40万美元将软件开发项目外包给埃里森、鲍勃·迈纳(Bob Miner)和爱德华·奥茨(Edward Oates)。他们三人为此设立了SDL(软件开发实验室)公司,这家公司后来发展成为了Oracle。此外,大卫·布里顿和拉里·埃里森都曾经在Ampex公司任职。

Memorex(美力思)于1961年创立,是硅谷早期的标志性企业之一。公司最初以生产高质量计算机磁带起家,并迅速成为挑战IBM在大型机外设领域垄断地位的重要竞争者。其业务范围随后扩展至磁盘驱动器、通信设备及各类磁性存储介质,在数据存储技术的黄金时代扮演了关键角色。对于全球大众消费者而言,Memorex最辉煌的印记源于其20世纪70年代的经典营销活动——那句著名的广告语“是现场演出,还是Memorex?”(Is it live, or is it Memorex?),配合爵士天后艾拉·费兹洁拉(Ella Fitzgerald)极具穿透力的歌声与震撼的影像,完美诠释了其高保真录音带的性能,成为广告史上的传奇。Memorex于1981年被Burroughs公司收购,后曾作为Unisys的一部分。上世纪90年代后,品牌权先后流转于坦迪(Tandy)及Imation公司。尽管传统的磁带和磁盘制造业务已随技术更迭远去,但Memorex至今仍是全球知名的消费电子品牌,涵盖光存储、闪存及各类配件。

图2 鲍勃·爱泼斯坦

在创业的开端,Britton和Lee还找到了精通数据库的鲍勃·爱泼斯坦2(Bob Epstein,见图2)来共同解决数据库性能问题,他们选择的方向是硬件。爱泼斯坦担任了Britton-Lee的开发副总裁兼首席架构师。

爱泼斯坦是加利福尼亚大学伯克利分校Ingres项目的第三任经理。他是图灵奖得主迈克尔·斯通布雷克(Michael Stonebraker)的博士生,也是斯通布雷克开创Ingres项目时的主要开发者之一。

彼时,斯通布雷克与王佑曾(Eugene Wong)和拉里·罗(Larry Rowe)已经在筹建关系技术公司——RTI(Relational Technology,Inc.)。RTI的目标是将Ingres商业化。但是爱泼斯坦深知关系型数据库在小型机上的性能极差,且只能同时支持少数几个用户。因此他选择加入Britton-Lee,希望通过专用硬件提高数据库性能。爱泼斯坦加入Britton-Lee时还从Ingres项目组带走了几位核心成员,属实是拆了他导师斯通布雷克的台。

鲍勃·爱泼斯坦(Bob Epstein)拥有电气工程与计算机科学博士学位,专业方向为分布式数据库系统(辅修音乐)。他早期的职业生涯专注于数据库与网络技术的商业化。1976年至1979年,他担任加州大学伯克利分校Ingres项目的负责人。1979年至1984年,爱泼斯坦担任Britton-Lee的开发副总裁兼首席架构师。1984年,他作为首席架构师和倡导者,通过创建Sybase及开发SQL Server,推动了客户端/服务器计算模式的发展,后者最终通过纳入中间件和开发工具,发展成为价值数十亿美元的业务。爱泼斯坦联合创办了Sybase、GetActive Software、Zight和Britton-Lee四家信息技术公司。

Britton-Lee的“智能数据库机”(Intelligent Database Machine,IDM)于1981年正式推出(比Teradata早3年),主要包括IDM 500和IDM 200两种型号。在宣传中,他们将IDM称为“真正的数据库机(A TRUE DATABASE MACHINE)”。这一命名是否似曾相识?——Oracle的RAC全称是Real Application Cluster。从“True”到“Real”,技术圈里真假难辨,最后导致大家在命名上开始较劲。此外,数据库一体机从诞生之初,就以“智能”为名,其核心价值就是通过智能化加持,使软硬件协同创造超越用户期待的性能奇迹。

 

图3展示了IDM 500的产品架构。图中清晰显示,Britton-Lee IDM的本质是一种数据库加速外设。它必须作为“后端(Back-end)”连接到大型主机或大型微机,无法独立面向终端用户提供计算服务。这种“术业有专攻”的设计,正是早期“Database Machine”理念的精髓:让计算归计算,让数据处理归数据处理。

在20世纪80年代,计算资源极其昂贵,架构分工非常明确。Britton-Lee的设计初衷是“卸载(Offloading)”。Britton-Lee IDM实际上实现了现代存储界梦寐以求的“近数据计算(Near-Data Computing)”。传统存储必须把成千上万条原始数据搬运到主机内存,再由CPU判断哪些数据符合条件。这会导致主机网络带宽被占满(I/O瓶颈)。IDM内部集成了处理器和硬件加速器(Database Accelerator),它在数据离开自己的机箱之前,就把不需要的数据“扔掉”了。

图3 IDM 500的产品架构图

 

Britton-Lee的IDM数据库机中包含了完整的数据库系统,具有清晰完整的技术栈层次,其中并发控制、审计日志、崩溃恢复等功能一应俱全。主机系统则负责查询、报表等用户侧功能的实现。

到1983年,Britton-Lee销售了大约200台IDM数据库机,取得了良好的开端。但是行业也在发生变化,随着硬件技术的加速进步,爱泼斯坦认为为数据库研发专用硬件已无必要,应该将优化聚焦于数据库软件层完成,客户端/服务器架构的理念在他脑海中形成。

图4 Sybase的Logo

但是,Britton和Lee只想做硬件,他们不支持爱泼斯坦的想法。1984年,爱泼斯坦离开Britton-Lee,并带走了他在这里结识的马克·霍夫曼(Mark Hoffman)。从伯克利时代一直追随爱泼斯坦的汤姆·哈根3(Tom Haggin)和简·多尔蒂4(Jane Doughty)也随后加入。1984年,在爱泼斯坦家的后院,Sybase(如图4所示)诞生了。

历史总是充满了偶然,我们很难假设,如果Britton-Lee当时接受了爱泼斯坦的想法,那么凭借硬件先发优势和数据库硬核产品的组合,会否成长为基业长青的巨头?Oracle是否还能崛起?

但是历史不容假设。在数据库领域,Sybase在20世纪90年代异军突起,一度挑战了Oracle的王座,而后被SAP收购,通过HANA再次加入数据库机的赛道,此乃后话。

Britton-Lee于1985年实现了IPO。到1987年,他们已经向150多个客户销售了逾675套数据库机,其中包括AT&T、杜邦、RCA、法国里昂信贷银行和高盛等。

汤姆·哈根(Tom Haggin)毕业于加州大学伯克利分校,与Bob Epstein为校友及好友。加入Sybase前,他在Britton-Lee担任MIS(管理信息系统)主管,负责开发数据库管理系统应用程序。在Sybase,他主要负责应用程序接口和开发工具。他是DB-Library(Sybase客户端API)和OpenServer(服务器端API框架)的主要设计者和开发者。他还是ODBC规范前身(SQL Connectivity)的核心制定者之一。他曾与微软的Kyle Geiger和Jim Gray合作,推动了动态SQL的标准化。哈根在Sybase工作了约10年,于1994年左右离开。随后他创立Tilden Park Software公司并担任负责人,专注于商业软件产品的设计与开发。

4 简·多尔蒂(Jane Doughty)毕业于加州大学伯克利分校。Bob Epstein曾评价其编程天赋极高,且项目管理能力卓越。在Britton-Lee时期,她与Bob Epstein、Tom Haggin等人共同参与数据库技术的开发。她是Sybase的四位联合创始人之一。在公司早期,她负责数据库服务器(Database Server)的工程研发工作,是核心技术架构的奠基人之一。她在Sybase 1991年IPO前离开了公司,原因是搬迁至外州(威斯康星州麦迪逊市)。她的丈夫是著名计算机科学家、威斯康星大学麦迪逊分校教授David A. Wood。

在技术创新期的瞬息万变中,形势可能一夜之间就会逆转。Britton-Lee在1987年经历了数据库机销售的严重放缓,当年营收约2500万美元,亏损约900万美元。当年第四季度亏损250万至290万美元,其中包括为裁减约50名员工(占当时280名员工总数的20%)所计提的准备金。

图5 Britton 和 Lee 的合影

1988年1月1日,Britton-Lee公司联合创始人大卫·布里顿和杰弗里·李宣布辞职。这使公司总裁兼首席执行官约翰·卡瓦利尔(John C. Cavalier)得以完全掌控公司。卡瓦利尔于1987年加入Britton-Lee,此前他是NCA公司的CEO。NCA后来被Ask Computer Systems公司收购。大卫·布里顿和杰弗里·李在退出公司后基本淡出公众视野,图5是互联网上能够找到的唯一一张他们两人的合影。

1990年,Britton-Lee被Teradata收购。在这一时期,Teradata成为“数据库机”领域的唯一幸存者。

此处可作一小结:专用硬件和通用硬件之争,是数据库机成败的关键。其次,是硬件与软件之争,当硬件进化速度超过软件,数据库机就获得关注;当软件进化速度超过硬件,数据库机就归于沉寂。可谓此起彼伏、此消彼长。

 

1991年9月,AT&T公司收购了NCR公司,后者于12月宣布以约2.5亿美元收购了Teradata。幸运的是,Teradata并未在并购中沉沦。2007年1月,NCR宣布Teradata将成为一家独立的上市公司。图6是Teradata自2007年以来的收入变化曲线。截至2026年1月底,Teradata的市值约为26亿美元。

图6 Teradata收入历史趋势图

Teradata的目标市场是数据仓库。伴随着开源产品(如Hadoop等)的普及以及大数据技术的崛起,其市场进一步被蚕食。

真正为数据库一体机带来复兴的是Oracle。Exadata以通用硬件为基础,将数据库一体机从OLAP环境拓展到OLTP环境,从而为“数据库一体机”打开了广阔市场,开启了真正波澜壮阔的新时代。而云和恩墨的zData更进一步,通过分布式存储技术,将数据库一体机推进到通用数据库支持范畴,实现了统一数据库运行平台的交付,大大简化了用户的数据库基础设施架构。

从Teradata到Exadata和zData,数据库一体机经历了从“专用硬件+专用软件”“通用硬件+专用软件特性”再到“通用硬件+通用软件”的演进过程(如图7所示)。

图7 数据库一体机的时代演进

“专用硬件+专用软件”时代:早期Teradata使用自研的专用网络交换机和网卡(BYNET)。BYNET是系统的“神经中枢”,负责处理MPP架构中的节点间高速通信、合并排序和消息广播。整个系统被封装在特定的物理机柜中,包含定制的存储阵列和容错电源。

“通用硬件+专用软件特性”时代:Exadata设计的核心目标是使用通用硬件,采用开放架构实现集成化交付。Oracle采用InfiniBand技术作为网络互连方案;在数据库软件层面,通过Smart SCAN技术、混合列压缩等专用软件特性实现一体机加速。

“通用硬件+通用软件”时代:zData的设计目标是通过智能化的软件定义存储技术,面向数据库场景提供高性能块存储,实现软硬件解耦并支持所有数据库产品。用户可采用经官方认证的通用硬件,构建自有的数据库统一存储资源池,实现性能与成本的自主可控。

从以上演进过程可以看到,技术的进化是在需求驱动下不断重塑的。例如,zData为顺应国内用户的需求,从过去仅支持Mellanox的InfiniBand,进化为支持更通用的RoCE(RDMA over Converged Ethernet)高速网络技术;网络带宽从过去的100Gb扩展为支持从25Gb到200Gb的不同带宽配置;硬件平台也从Intel处理器扩展到支持AMD、海光、鲲鹏等处理器;支持的数据库更是从Oracle扩展到DB2、SQL Server、MySQL、PostgreSQL、GaussDB、OceanBase、达梦、崖山等数十种。如图8所示,zData的进化,为用户带来了稳定可靠、性能卓越的数据库运行平台。通过整合的数据库资源池和智能化运维能力,数据库管理效率显著提升,运营成本也得以优化。

图8 云和恩墨数据库一体机从zData到zData X的进化

作为补充,关系型数据库在诞生之初,曾被认为最适合数据仓库场景,因为当时其性能表现有限,但具备存储更多数据的能力。DB2诞生后,就是作为IMS的补充先被尝试用于分析型系统的。而Oracle创始人拉里·埃里森也曾回忆说:“我们经历了传统观点所预测的那些非常严重的性能问题。我们始终无法让数据库运行得足够快。我们尝试了一个又一个方法。最终我们取得了突破,实现了十倍的性能提升。在最后的测试中,我们的性能超越了当时被认为是最快的PDP-11数据库CODASYL系统运行得更快。”

 

图9 埃里克·欧曼

再做一个补充,当年爱泼斯坦从伯克利带到Britton-Lee的一员大将是埃里克·欧曼(Eric Allman,见图9)。欧曼是sendmail的开发者,他的努力对电子邮件传输技术产生了重大影响。sendmail是互联网上最早的邮件传输代理之一,欧曼因此于2014年入选互联网名人堂 (Internet Hall of Fame)。欧曼还是syslog的创造者,syslog是几乎所有开放系统和外围设备中使用的事实上的标准日志记录机制。他在Britton-Lee担任首席程序员,从事数据库接口软件的开发。

作为本篇最后的延展,我们通过图10来看一下Britton-Lee的IDM 500一体机在当年的性能表现。由于年代久远,此处不再提供测试用例和详细解释,但可直观看出,数据库机的性能表现非常强劲。

图10 Britton-Lee IDM 500的性能表现

 

参考文献:

http://www.neophilic.com/~eric/

History of Sybase,by Bob Epstein

Oral History of Mark B. Hoffman

http://www.tildenpark.com/who.html

http://www.tildenpark.com/tomresume.htm