当OLTP数据库遇上分布式存储,我选择走一条难而正确的路
分布式存储可扩展性强、灵活度高,如果能做到集中式存储的低时延,必定会成为主流的存储技术路线。
—— 黄岩
黄岩是云和恩墨分布式存储总架构师。十几年来,他在存储领域,尤其是NAS和备份中深入钻研,曾担任某NAS产品性能SE,负责产品性能调优工作。2011年,该产品打破了SPESsfs性能测试世界纪录。
-
为何分布式存储如此受欢迎?
-
为什么它是未来存储的发展方向?
-
分布式存储可以用于OLTP数据库吗?
带着这些问题,笔者采访到黄岩老师,且听他细细道来……
“2010年,我进入了企业存储领域。那时候传统的集中式SAN存储(磁盘阵列或阵列)已经很成熟了。EMC、IBM、HDS都在销售相关产品。”黄岩回忆道,“NetApp的集中式NAS(文件服务器)产品也很受欢迎。但是随着业务的不断发展和数字化转型的推进,集中式存储的弊端越来越凸显。”
说起集中式存储的弊端,可扩展性差是绕不开的问题。一般来说,集中式存储的中低端产品可以支持两个控制器,高端产品最多支持32个控制器,面对更多的存储要求时,无法再进行有效扩展。因此,客户在购买集中式存储产品之前,必须根据对未来业务发展情况的预测确定存储性能和容量需求,从而决定自己所选存储产品的类型。
预测未来总是困难的。“预测不准确可能导致所选产品与业务发展不匹配的情况。”黄岩进一步解释道,“根据预测,企业选择了低端产品。但业务成长比预估快,存储性能或者容量无法拓展,限制了企业发展。客户直接选择高端产品,价格高昂不说,如果后期业务没有充分利用这些性能或容量资源,就会造成浪费。”
此外,在数字化转型的过程中,为了应对以“烟囱式架构”为主的系统在资源利用、运维管理等方面的挑战,越来越多的企业开始搭建云平台。“在私有云模式下,企业某个部门如果有建设新IT系统的需求,只需填写电子流申请虚拟机、存储资源、数据库PaaS服务即可。只要电子流审批通过,部门就获得了所需的底层计算和存储资源,不再需要走招标、采购流程来购买新硬件。但实现这一过程的前提是各种资源可以统一调配。显然,集中式存储做不到这一点。”
在私有云平台上,集中式存储的局限性主要体现在存储空间和性能资源的相互隔离。“打个比方,当我们发现电脑C盘空间不足而D盘还有剩余时,是无法把D盘空间划分给C盘使用的。私有云平台也存在类似问题。”黄岩说,“现在平台有两套集中式存储设备,分别给A、B两个部门使用。由于隔离的存在,如果A部门的存储空间或者性能不足,B部门的资源无法分配给A使用。”