语言
<< 返回文章列表

数据库一体机简史:是独立还是融合,创业的两难选择

2026年5月18日
,
,
N
e
t
e
z
z
a
,
z
D
a
t
a
X
,
盖国强
7

面对Netezza的快速崛起,数据仓库市场中的参与者都感受到了压力与挑战,这其中最直接的竞争者是Teradata和IBM。

图1 吉特·萨克塞纳

Netezza首席执行官兼联合创始人吉特·萨克塞纳1(Jit Saxena,见图1)满怀信心地发出战斗檄文:“我们的竞争对手是IBM和Teradata这样的大公司。我们参与的每一笔交易都在与这些巨头竞争。我们之所以能竞争,是因为我们拥有竞争对手根本无法比拟的价值主张。在客户进行的所有基准测试中,我们不仅持续胜出,而且性能领先数个数量级,价格却只有他们的零头。

吉特·萨克塞纳(Jit Saxena)是全球企业软件和数据仓库领域的先驱企业家与投资人。他最卓越的成就之一是于2000年创立了Netezza,并担任其创始首席执行官。在创立Netezza之前,萨克塞纳于1983年创立了Applix,专注于实时数据分析和决策支持软件。他带领Applix于1994年成功上市,该公司后来被Cognos(现属IBM)收购。萨克塞纳拥有印度理工学院孟买分校(IIT Bombay)的学士学位、密歇根州立大学的硕士学位以及波士顿大学的MBA学位。作为波士顿科技生态系统的领军人物,萨克塞纳目前活跃于风险投资和导师领域。他曾担任包括Demandware(被Salesforce收购)、Actifio和VoltDB在内的多家科技公司的董事会成员。他凭借敏锐的技术预见力和推动初创企业规模化发展的领导力,被公认为现代大数据产业架构的奠基人之一。

01

Teradata:市场领导者的变革

图2 2006年Gartner数据仓库魔力象限

Netezza的崛起让Teradata感受到了真实的市场压力。一些核心客户开始将Netezza引入企业用于分析工作负载,直接与Teradata的传统系统并列运行——这是一种赤裸裸的竞争信号。根据Gartner的2006年数据仓库魔力象限报告,Netezza已经高居远见者象限(如图2所示),距离“领导者”仅余一步之遥。

Teradata最初认为数据仓库一体机只是“误导事实”的概念,但随着Netezza的崛起,Teradata不得不改变策略,于2008年4月推出了自己的一体机产品线。并且,Teradata开始声称自己是“最早的数据仓库一体机供应商”。虽然Teradata的主张客观上符合事实,但是如此与新晋小生——Netezza争起口舌之利显然是仓促之举。

Teradata的数据仓库一体机核心产品是Teradata Data Warehouse Appliance(如图3所示),定位中端市场,主打“高性能、低复杂性”,预集成了服务器、存储和数据库软件,部署时间从数周缩短到数天。此外,Teradata还推出了针对部门级应用的Teradata Data Mart Appliance,以更低的价格吸引预算有限的中小型企业。然而,Teradata的这次转型是被动防御:其一体机产品的核心仍然是传统MPP架构,只是换了一个“开箱即用”的外壳,而其高昂的维护成本和对DBA的高度依赖并未从根本上得到改变。

图3 Teradata的一体机系列产品

2008年1月,Netezza的联合创始人吉特·萨克塞纳宣布退休,离开了公司。而Netezza的另外一位创始人福斯特·欣肖(Foster Hinshaw)已于2005年离开。吉姆·鲍姆(Jim Baum)被任命为新的CEO。

2008年9月,Oracle Exadata发布。拉里·埃里森(Larry Ellison)坦然承认:“Netezza是Exadata的灵感来源之一,Teradata也是Exadata的灵感来源之一,我们要感谢他们促使我们不断努力,并让我们进军硬件业务。”

而吉姆·鲍姆对Oracle的反馈是:“你不能把现有的解决方案随便拼凑在一起,用巧妙的包装就期望能提供更快的性能。”

02

十年功成:IBM并购吃下了数仓革命者

2010年9月,IBM以总价约17亿美元现金收购创立整十年的Netezza,收购价格较当时股价溢价超过50%。彼时的IBM,正处于从传统硬件公司向“智慧地球”战略全面转型的关键时期,大数据分析被视为未来十年企业IT支出增长最快的领域。收购Netezza,是IBM在数据分析硬件领域布下的关键棋子。

Netezza拥有IBM迫切需要的三样东西:成熟的AMPP架构和FPGA技术专利;超过200家覆盖金融、零售、电信等核心行业的客户;以及对抗Oracle Exadata的战略价值——Oracle在2009年收购Sun之后,Exadata X2已经威胁到IBM的核心服务器市场。

IBM收购Netezza后,甚至直接在其官网上打出标语:“成本仅是Oracle Exadata的一小部分。”真是时移则事异啊!

图4 2011年1月的Gartner数据仓库魔力象限

根据Gartner在2011年发布的数据仓库魔力象限(如图4所示),IBM/Netezza已经位列领导者象限。这一象限还包括被EMC收购的Greenplum、被SAP收购的Sybase。对于独立的创业公司而言,如果不能迅速壮大规模,在竞争激烈的市场里,被人并购往往是最终出路。

2012年,IBM将Netezza更名为IBM PureData System for Analytics,纳入IBM PureData产品家族(如图5所示)。Netezza的独立销售团队被整合进IBM的全球销售体系,那种硅谷创业公司的敏捷文化,被IBM庞大的企业机器缓慢消化。部分核心工程师选择离职,加入Cloudera、Hortonworks等新兴大数据公司。

图5 IBM的数据仓库一体机家族

2017年,IBM推出了新一代的IBM Integrated Analytics System。2019年,IBM重新将产品线命名为IBM Netezza Performance Server(NPS),并迁移到IBM Cloud Pak for Data平台上,支持混合云部署(包括AWS和Azure)。2020年,NPS提供了SaaS版本。2023年,IBM Netezza进一步集成Apache Iceberg表格式,扩展了数据湖仓能力。

回望这段历史,许多业界人士认为,IBM虽然支付了合理的收购价格,但未能有效传承Netezza的创新基因。Netezza最宝贵的资产——那种以客户痛点为驱动、以技术颠覆为武器的创业精神——在IBM的企业文化中逐渐消散了。这是大公司并购小型创新企业时的永恒悖论:并购的目的是获得创新,但并购本身往往会扼杀创新

03

IMS:最早的“数据库一体机”思想

众所周知,“关系型数据库”的概念是由IBM的研究员埃德加·科德(Edgar F. Codd)博士于1970年提出的。而当时IBM热销的数据库产品是1968年诞生的层次数据库产品IMS。IMS很好地满足了用户的需求,利润丰厚,所以当时IBM并未重视关系型数据库的创新想法,这导致了Oracle的崛起。IBM后来发起的System R项目与加州大学伯克利分校的Ingres项目,被并列为关系型数据库的奠基项目。在System R项目之后,DB2开始崛起。

IMS与大型机捆绑销售,可以说是最最早期的“数据库一体机”——硬件(大型机)和软件(IMS)由同一厂商统一交付,用户无法单独购买其中之一。这一“捆绑”模式带来了巨大的商业成功,也带来了垄断性的客户锁定。大型企业一旦选择了IBM的大型机和IMS,就几乎不可能轻易迁移——数据格式不兼容、软件依赖深、迁移成本极高。这种生态锁定(Ecosystem Lock-in)的逻辑,在后来的Teradata、Exadata,乃至今天的公有云数据库中被一再复制。

图6 IBM的AS/400

IBM的AS/400(后改名iSeries,再改名IBM i)也被业界公认为另一种形式的“数据库一体机”(如图6所示)——它将操作系统、数据库(DB2 for i)和应用服务器深度集成,用户几乎感知不到数据库与操作系统的边界。几乎所有的数据库产品、数据库一体机产品,都是通过挑战IBM的数据库和服务器来分割市场的——从Britton-Lee,到Teradata,到Netezza,再到Oracle。这是数据库历史上一个令人着迷的反复主题。

04

zData:将开放进行到底

无论是Teradata、Netezza还是Exadata,数据库一体机本质上与数据库产生了强绑定,强绑定就带来了高成本。云和恩墨在中国市场上,依托软件定义存储的时代浪潮,希望将“数据库一体机”的开放性进行到底,从而让用户获得选择的自由与成本的透明。

为此,云和恩墨研发了面向数据库的软件定义存储产品——智存(zStorage),进而在此基础上推出了新一代产品zData X——一款真正意义上的通用数据库一体化承载平台(Multi-Database Integrated Platform)。它所实现的技术突破,是对Netezza当年"No Tuning"哲学在中国场景下的继承与进化(如图7所示):

  • 极致性能:自适应锁核技术将线程绑定固定CPU核,消除上下文切换开销,每I/O节省10-20微秒。实测在三节点配置下,I/O性能可达1100万IOPS(4KB随机读),是传统SAN存储的数十倍。

  • 广泛兼容:zData X支持Oracle、MySQL、PostgreSQL、MogDB、达梦、OceanBase、GaussDB等数十种数据库,既是OLTP的承载平台,也支持OLAP工作负载。这正是数据库一体机从“数据仓库专用”向“通用数据库基础设施”演进的最新形态,也是云和恩墨对Netezza原创精神的延展。

  • 开箱即用:zData X的管理平台提供全生命周期自动化运维能力——软硬件预装,30分钟完成开箱即用;数据库自动化部署,交付时间从16小时缩短至2小时;900+项Oracle监控指标、600+项MySQL监控指标;高可用容灾切换时间降至5分钟以内。这是对Netezza "No Tuning"精神的现代诠释。

  • 弹性扩展:zData X以3节点起配,最大可扩展至1024节点,添加节点无需停机,性能线性增长——与昔日Netezza的S-Blade扩展逻辑一脉相承。

  • 稳定可靠:实时校验、多点检测、后台巡检和自动修复;支持数据多副本,可容忍2个节点或机柜同时故障;支持快照与克隆,确保“业务不中断,数据不丢失”。

图7 zData X通用数据库一体化承载平台的技术突破

2025年秋,云和恩墨在产品发布会上正式推出了zData X 3.5版本,核心优势概括为“性能更高、成本更优、运维更易”。在性能层面,其表现相比上一版本提升20%以上;在成本优化上,推出了精简融合架构(2台融合节点+1台管理节点),并通过数据压缩技术实现2:1至3:1的压缩比,等效存储容量提升2-3倍;在运维简化上,新增存储卷回收站(数据保留7天防误删),引入CGroup技术实现CPU/内存资源隔离。

在与崖山数据库(YashanDB)的联合测试中,zData X 3.5在承载YashanDB时,单实例tpmC达231万,双实例并发tpmC达345万,性能线性比达75%,充分验证了zData X作为国产数据库一体机承载平台的技术实力。

05

永恒命题:“近数据计算”的持续进化

从IBM IMS与大型机的捆绑销售,到Britton-Lee的智能数据库机,到Teradata的MPP大规模并行处理,到Netezza的FPGA加速与"No Tuning"革命,到Oracle Exadata的软件定义硬件,再到今天云和恩墨zData X的通用数据库承载平台——这条历史长河中贯穿着一个永恒的命题:如何让计算更接近数据?

技术在变,答案在变,但命题本身从未改变。每一代数据库一体机,都是这个命题在特定技术条件和市场环境下的最优解。Netezza用FPGA在硬盘出口处拦截了不需要的数据;Teradata用MPP让计算在每一个AMP的本地磁盘旁发生;Oracle Exadata用Smart Scan在存储服务器上执行过滤,把“相关数据”而非“全部数据”交给数据库节点;zData X以zStorage的去中心化分布式块存储,让数据库的每一次I/O都走最短的路径,从磁盘到内存之间再无冗余。

回顾数据库一体机40多年的发展历程,每一个答案的背后,都是一代人的青春、热血、失落与执念。面对同样的数据处理难题,Teradata说:“让它分布。”Netezza说:“让它过滤。”Oracle说:“让它智能。”云和恩墨zData X说:“让它通用。”每一代技术进步,本质上都是对“数据搬运成本”的进一步降低。在OLTP的世界里,这意味着更快的事务响应;在OLAP的世界里,这意味着更快的分析洞察;在未来的AI数据库世界里,这将意味着更快的模型训练与推理。

Netezza的故事源自一位“苦思冥想I/O瓶颈”的工程师,他的创造最终以17亿美元被IBM收购,成为一代传奇。在这一时期,数据仓库领域的创业企业书写着不同的故事,这其中包括:2008年7月微软收购DATAllegro;2010年7月EMC收购Greenplum;2011年2月HP收购Vertica;2011年3月Teradata收购Aster Data。值得注意的是,大部分数据仓库产品都和斯通布雷克(Michael Stonebraker)教授的PostgreSQL有关。Netezza数据库是基于PostgreSQL 7.2版本进行的分支迭代。

每一个挑战者的故事,都以不同的方式落幕——不是因为他们错了,而是因为他们太对了。

Netezza用"No Tuning"改变了整个行业对“易用性”的理解,用FPGA证明了“硬件加速”不是天方夜谭,用“民主化分析”让中小企业也能负担得起企业级数据仓库。它留下的遗产,不是一项FPGA专利,也不是“数据仓库一体机”这个品类名称——而是一种信念:复杂的性能问题,有时候不需要更复杂的解决方案;只需要一个足够好的问题,和一伙足够坚持的人。

云和恩墨的zData X,正在延续这份坚持。