数据库一体机简史:是独立还是融合,创业的两难选择
面对Netezza的快速崛起,数据仓库市场中的参与者都感受到了压力与挑战,这其中最直接的竞争者是Teradata和IBM。
1 吉特·萨克塞纳(Jit Saxena)是全球企业软件和数据仓库领域的先驱企业家与投资人。他最卓越的成就之一是于2000年创立了Netezza,并担任其创始首席执行官。在创立Netezza之前,萨克塞纳于1983年创立了Applix,专注于实时数据分析和决策支持软件。他带领Applix于1994年成功上市,该公司后来被Cognos(现属IBM)收购。萨克塞纳拥有印度理工学院孟买分校(IIT Bombay)的学士学位、密歇根州立大学的硕士学位以及波士顿大学的MBA学位。作为波士顿科技生态系统的领军人物,萨克塞纳目前活跃于风险投资和导师领域。他曾担任包括Demandware(被Salesforce收购)、Actifio和VoltDB在内的多家科技公司的董事会成员。他凭借敏锐的技术预见力和推动初创企业规模化发展的领导力,被公认为现代大数据产业架构的奠基人之一。
01
Teradata:市场领导者的变革
2008年9月,Oracle Exadata发布。拉里·埃里森(Larry Ellison)坦然承认:“Netezza是Exadata的灵感来源之一,Teradata也是Exadata的灵感来源之一,我们要感谢他们促使我们不断努力,并让我们进军硬件业务。”
而吉姆·鲍姆对Oracle的反馈是:“你不能把现有的解决方案随便拼凑在一起,用巧妙的包装就期望能提供更快的性能。”
02
十年功成:IBM并购吃下了数仓革命者
2010年9月,IBM以总价约17亿美元现金收购创立整十年的Netezza,收购价格较当时股价溢价超过50%。彼时的IBM,正处于从传统硬件公司向“智慧地球”战略全面转型的关键时期,大数据分析被视为未来十年企业IT支出增长最快的领域。收购Netezza,是IBM在数据分析硬件领域布下的关键棋子。
Netezza拥有IBM迫切需要的三样东西:成熟的AMPP架构和FPGA技术专利;超过200家覆盖金融、零售、电信等核心行业的客户;以及对抗Oracle Exadata的战略价值——Oracle在2009年收购Sun之后,Exadata X2已经威胁到IBM的核心服务器市场。
IBM收购Netezza后,甚至直接在其官网上打出标语:“成本仅是Oracle Exadata的一小部分。”真是时移则事异啊!
2012年,IBM将Netezza更名为IBM PureData System for Analytics,纳入IBM PureData产品家族(如图5所示)。Netezza的独立销售团队被整合进IBM的全球销售体系,那种硅谷创业公司的敏捷文化,被IBM庞大的企业机器缓慢消化。部分核心工程师选择离职,加入Cloudera、Hortonworks等新兴大数据公司。

图5 IBM的数据仓库一体机家族
2017年,IBM推出了新一代的IBM Integrated Analytics System。2019年,IBM重新将产品线命名为IBM Netezza Performance Server(NPS),并迁移到IBM Cloud Pak for Data平台上,支持混合云部署(包括AWS和Azure)。2020年,NPS提供了SaaS版本。2023年,IBM Netezza进一步集成Apache Iceberg表格式,扩展了数据湖仓能力。
回望这段历史,许多业界人士认为,IBM虽然支付了合理的收购价格,但未能有效传承Netezza的创新基因。Netezza最宝贵的资产——那种以客户痛点为驱动、以技术颠覆为武器的创业精神——在IBM的企业文化中逐渐消散了。这是大公司并购小型创新企业时的永恒悖论:并购的目的是获得创新,但并购本身往往会扼杀创新。
03
IMS:最早的“数据库一体机”思想
众所周知,“关系型数据库”的概念是由IBM的研究员埃德加·科德(Edgar F. Codd)博士于1970年提出的。而当时IBM热销的数据库产品是1968年诞生的层次数据库产品IMS。IMS很好地满足了用户的需求,利润丰厚,所以当时IBM并未重视关系型数据库的创新想法,这导致了Oracle的崛起。IBM后来发起的System R项目与加州大学伯克利分校的Ingres项目,被并列为关系型数据库的奠基项目。在System R项目之后,DB2开始崛起。
IMS与大型机捆绑销售,可以说是最最早期的“数据库一体机”——硬件(大型机)和软件(IMS)由同一厂商统一交付,用户无法单独购买其中之一。这一“捆绑”模式带来了巨大的商业成功,也带来了垄断性的客户锁定。大型企业一旦选择了IBM的大型机和IMS,就几乎不可能轻易迁移——数据格式不兼容、软件依赖深、迁移成本极高。这种生态锁定(Ecosystem Lock-in)的逻辑,在后来的Teradata、Exadata,乃至今天的公有云数据库中被一再复制。
04
zData:将开放进行到底
无论是Teradata、Netezza还是Exadata,数据库一体机本质上与数据库产生了强绑定,强绑定就带来了高成本。云和恩墨在中国市场上,依托软件定义存储的时代浪潮,希望将“数据库一体机”的开放性进行到底,从而让用户获得选择的自由与成本的透明。
为此,云和恩墨研发了面向数据库的软件定义存储产品——智存(zStorage),进而在此基础上推出了新一代产品zData X——一款真正意义上的通用数据库一体化承载平台(Multi-Database Integrated Platform)。它所实现的技术突破,是对Netezza当年"No Tuning"哲学在中国场景下的继承与进化(如图7所示):
-
极致性能:自适应锁核技术将线程绑定固定CPU核,消除上下文切换开销,每I/O节省10-20微秒。实测在三节点配置下,I/O性能可达1100万IOPS(4KB随机读),是传统SAN存储的数十倍。
-
广泛兼容:zData X支持Oracle、MySQL、PostgreSQL、MogDB、达梦、OceanBase、GaussDB等数十种数据库,既是OLTP的承载平台,也支持OLAP工作负载。这正是数据库一体机从“数据仓库专用”向“通用数据库基础设施”演进的最新形态,也是云和恩墨对Netezza原创精神的延展。
-
开箱即用:zData X的管理平台提供全生命周期自动化运维能力——软硬件预装,30分钟完成开箱即用;数据库自动化部署,交付时间从16小时缩短至2小时;900+项Oracle监控指标、600+项MySQL监控指标;高可用容灾切换时间降至5分钟以内。这是对Netezza "No Tuning"精神的现代诠释。
-
弹性扩展:zData X以3节点起配,最大可扩展至1024节点,添加节点无需停机,性能线性增长——与昔日Netezza的S-Blade扩展逻辑一脉相承。
-
稳定可靠:实时校验、多点检测、后台巡检和自动修复;支持数据多副本,可容忍2个节点或机柜同时故障;支持快照与克隆,确保“业务不中断,数据不丢失”。

图7 zData X通用数据库一体化承载平台的技术突破
2025年秋,云和恩墨在产品发布会上正式推出了zData X 3.5版本,核心优势概括为“性能更高、成本更优、运维更易”。在性能层面,其表现相比上一版本提升20%以上;在成本优化上,推出了精简融合架构(2台融合节点+1台管理节点),并通过数据压缩技术实现2:1至3:1的压缩比,等效存储容量提升2-3倍;在运维简化上,新增存储卷回收站(数据保留7天防误删),引入CGroup技术实现CPU/内存资源隔离。
在与崖山数据库(YashanDB)的联合测试中,zData X 3.5在承载YashanDB时,单实例tpmC达231万,双实例并发tpmC达345万,性能线性比达75%,充分验证了zData X作为国产数据库一体机承载平台的技术实力。
05
永恒命题:“近数据计算”的持续进化
从IBM IMS与大型机的捆绑销售,到Britton-Lee的智能数据库机,到Teradata的MPP大规模并行处理,到Netezza的FPGA加速与"No Tuning"革命,到Oracle Exadata的软件定义硬件,再到今天云和恩墨zData X的通用数据库承载平台——这条历史长河中贯穿着一个永恒的命题:如何让计算更接近数据?
技术在变,答案在变,但命题本身从未改变。每一代数据库一体机,都是这个命题在特定技术条件和市场环境下的最优解。Netezza用FPGA在硬盘出口处拦截了不需要的数据;Teradata用MPP让计算在每一个AMP的本地磁盘旁发生;Oracle Exadata用Smart Scan在存储服务器上执行过滤,把“相关数据”而非“全部数据”交给数据库节点;zData X以zStorage的去中心化分布式块存储,让数据库的每一次I/O都走最短的路径,从磁盘到内存之间再无冗余。
回顾数据库一体机40多年的发展历程,每一个答案的背后,都是一代人的青春、热血、失落与执念。面对同样的数据处理难题,Teradata说:“让它分布。”Netezza说:“让它过滤。”Oracle说:“让它智能。”云和恩墨zData X说:“让它通用。”每一代技术进步,本质上都是对“数据搬运成本”的进一步降低。在OLTP的世界里,这意味着更快的事务响应;在OLAP的世界里,这意味着更快的分析洞察;在未来的AI数据库世界里,这将意味着更快的模型训练与推理。
Netezza的故事源自一位“苦思冥想I/O瓶颈”的工程师,他的创造最终以17亿美元被IBM收购,成为一代传奇。在这一时期,数据仓库领域的创业企业书写着不同的故事,这其中包括:2008年7月微软收购DATAllegro;2010年7月EMC收购Greenplum;2011年2月HP收购Vertica;2011年3月Teradata收购Aster Data。值得注意的是,大部分数据仓库产品都和斯通布雷克(Michael Stonebraker)教授的PostgreSQL有关。Netezza数据库是基于PostgreSQL 7.2版本进行的分支迭代。
每一个挑战者的故事,都以不同的方式落幕——不是因为他们错了,而是因为他们太对了。
Netezza用"No Tuning"改变了整个行业对“易用性”的理解,用FPGA证明了“硬件加速”不是天方夜谭,用“民主化分析”让中小企业也能负担得起企业级数据仓库。它留下的遗产,不是一项FPGA专利,也不是“数据仓库一体机”这个品类名称——而是一种信念:复杂的性能问题,有时候不需要更复杂的解决方案;只需要一个足够好的问题,和一伙足够坚持的人。
云和恩墨的zData X,正在延续这份坚持。




