<< 返回案例列表

核心业务同城双活“零”突破,国网新疆电力再造佳绩

2020年12月10日
,
,
,
z
D
a
t
a
,
721
INTRODUCTION
引言

在过去的一年里,国家电网在全国全力落实“三型两网”的战略,致力于打造枢纽型、平台型和共享型企业。在推进能源转型和信息技术深度融合,科技创新与产业升级相互促进的大趋势下,国网新疆电力在数字化的建设上也做出了巨大改进。云和恩墨充分利用自身在数据领域的深耕积淀,结合国家电网的运维经验和深厚的场景理解,通过应用架构改造和双活架构升级,支持国网新疆电力的数字电网建设工作。

双方通过合作协同,继2019年12月31日,国网新疆电力顺利完成营销业务应用系统架构改造后(了解详情),该系统的双活架构改造项目又历时半年多,并经过最终40多个小时的连续奋战,于2020年11月23日顺利割接上线,标志着该项目的成功完成。改造后的系统高效支撑95598客服、缴费业务的高可用,切实让客户体验到“互联网+营销服务”带来的便利。

01
核心业务长足发展,同城灾备迫在眉睫

国网新疆电力的营销业务应用系统于2009年上线运行,用电用户数将近800万。目前,营销业务的数据月增长量约为200GB,年增长达2TB以上。随着该业务的不断深化和拓展,当前的基础环境已不能满足业务和技术发展需求,缺少应用级容灾预案,如果遇到严重故障无法快速完成应用切换。

今年年初,国网新疆电力顺利将营销业务系统迁移至zData数据库一体机上。通过引入X86易扩展架构,构建“4个计算节点+2台100Gb/s的InfiniBand交换机+8个存储节点”的分布式存储系统,大幅提高系统响应速度,有效提升电力业务办理体验。此外,升级后的营销系统全面提升了业务承载能力,为后续IT基础架构的优化扩展奠定了坚实的基础。

接下来,如何在保证高并发存储和强计算的同时,又能做到数据的完整性和业务的连续性,是新疆电力面临的重要挑战,同城灾备的建设刻不容缓。

02
新冠疫情共克时艰,双活改造排除万难

自今年3月启动双活架构改造工作以来,国网新疆电力集中技术、业务骨干力量,同云和恩墨一起成立专项攻坚工作组,深入研究X86架构、分布式存储、全域负载均衡等核心技术,组织开展多方技术交流,全方位论证新架构、新平台的可行性,同时摸清业务脉络,制定完备的应急预案,为双活改造奠定基础。

国网新疆电力同云和恩墨的技术专家一起,结合其自身基础架构布局,确定了营销系统同城双活架构的方案。该方案利用南湖、建设路同城两地数据中心,采用裸光纤和长距InfiniBand技术,构建两中心微秒级双通道网络;同时应用全域负载均衡和“6+15”分布式数据库集群,搭建营销系统同城双活环境。

同城双活建成后,将实现与电网人资、财务、交易等33套系统、4067项业务流程的双活高可用,可有效抵御局部重大灾难发生带来的风险,保障应用快速切换和数据的零丢失,从技术上实现无感知,提升用户体验。

双活架构-拓扑图

云和恩墨结合客户现场实际环境条件,定制了完备的项目实施计划,在正式割接前,做到充分的测试准备,保证双活的顺利上线。

双活项目计划-关键节点步骤

然而,受到年初全国范围的疫情影响,以及7月中旬乌鲁木齐的疫情再次反弹,双活改造项目的推进遇到了巨大的阻挠。云和恩墨的专家和工程师们在无法到达客户现场的时候,在家隔离时依然积极推进项目进展,同客户远程开展项目会议,及时同步项目进度,不放过任何一个潜在的风险点。

03
同城双活五九可用,高效双写自动切换

11月23日,在经过了40多个小时的连续奋战后,国网新疆电力的营销系统双活架构改造项目顺利割接上线,项目取得圆满成功。

该系统构建了一套南湖4计算节点、10存储节点,建设路2计算节点、5存储节点的“6+15”双活Oracle数据库高可用架构,同时采用了三副本的冗余方式(每五个存储节点作为一组副本),当南湖节点整体不可用时,系统能够自动并快速切换到建设路节点,保证RTO和RPO均接近于0。

双活架构改造的项目成效包括:

  • 真正双活:可在两个数据中心,对数据库同时进行事务处理,双中心的6个计算节点数据库对应用系统透明无感知,相比传统两中心的主备建设模式,设备资源利用率提高了30%以上。

  • 五九可用:活架构支持下的两个数据中心数据库可达到99.999%可用性,出现任意单个存储故障、计算节点故障,甚至单中心机房掉电等事件发生时,营销业务均能自动化切换,连续对外提供服务。整个灾难切换及业务恢复的过程均无需人工干预,自动化的操作能够有效降低企业客户的管理成本。

双活架构-高可用测试通过

  • 高效双写:双活架构存储网络基于RDMA,读写效率是传统SAN存储的10倍以上,真正实现了高带宽、高性能、低延迟。I/O性能在同站点和不同站点的表现都很优秀,在同站点下双端口200Gbps的IB网络环境下,最大读带宽高达20GB/s,单节点8K写的IOPS高达55.5w,在不同站点间延迟低至0.3ms。

  • 自动运维:zData的一体化管理与监控平台,实现了从底层硬件到上层数据的完整管理和监控,可维护性和可管理性更强。双活拓扑可呈现众多节点和网络的运行状态,性能图表则全面直观地展示性能趋势,一目了然。

zData双活版 - 拓扑图管理

 

zData 双活版– 性能监控图表

04
里程碑式意义深远,持续探索再谱新篇

国网新疆电力营销系统双活建设,不仅可以高效支撑95598客服、缴费业务的高可用和业务连续性,切实让客户体验到“互联网+营销服务”带来的便利,良好的可扩展性更能够满足营销类信息系统未来3-5年的发展需要。同时,本次的建设实现了电网核心业务同城双活零的突破,为电力企业业务系统的容灾建设提供了有益的借鉴和参考。

下一步,国网新疆电力将持续探索人工智能、区块链等新技术的应用,以信息化建设为平台,全面提升信息化服务水平,推动电力的数字化、网络化和智能化发展。