<< 返回案例列表

英大财险丨10倍业务效率和性能提升背后的核心系统架构升迁之路

2021年8月4日
z
D
a
t
a
,
,
,
,
522

伴随着IT信息化、产业数字化的浪潮滚滚向前,企业的信息化建设经历了逐步发展、逐渐成熟、加速转型的过程。特别是我国保险业正处于全面深化改革的关键阶段,业务的多样化、复杂化都对支撑系统提出了更高要求,管理上的难度也随之增大。唯有筑牢底层基础,才能支撑上层业务快速发展,才能更好地服务于社会需求。因此,打造一套可以稳定支撑、敏捷响应、降本增效的IT基础架构来满足未来业务的需要,也就理所当然地成为英大财险必须要走的一条发展之路。

问题与挑战

随着英大财险核心数据库的数据量迅速增长,基本上可以达到50%的年复合增长率。照此计算,五年内数据量将至少翻三番,事务数也会有成倍的提高。相较于业务的高速发展,当前的IT基础设施能力则显得捉襟见肘。英大财险核心系统的支撑环境为传统的“IOE”架构,业务的大核心模式使得数据存放交互繁杂,且主机、存储等系统硬件均较为陈旧,随着各核心系统业务量的增加,主机性能已经越来越难以支撑;并且核心数据存放在集团的集中式存储中,I/O性能瓶颈明显,且扩展困难,数据量的增加也让这种存放模式难以支撑。

具体来看,当前的传统IOE架构存在诸多问题:

1. 中心化的存储系统成为I/O存取的瓶颈,性能受限;

2. 小型机+高端存储,成本高昂,相对比较封闭,扩展能力差;

3. 复杂的系统带来部署及操作、运维和管理的高门槛;

4. 数据库更新换代快,老系统对新功能、新特性支持不完善,无法提高业务效率。

架构改造思路

经过前期审慎的可行性研究和需求分析,英大财险针对核心业务系统,从未来五年的业务需求出发,在数据库的结构上进行合理的分拆设计,保证业务分支的处理性能和效率,同时考虑对承载核心系统数据库的基础架构进行改造,以彻底改变当前计算能力偏低、I/O性能差、空间容量及扩展能力不够等问题。

作为目前的流行架构,分布式部署架构在动态扩展和高性能方面相较传统IOE架构有明显优势。一方面,通过x86化、分布式替代封闭的小型机和集中存储,实现去“IE”,提升了可扩展性和可用性,同时降低了成本;另一方面,通过Infiniband高速网络和SSD固态硬盘,可使同样成本下的I/O性能提升20倍以上。 

最终,在云和恩墨公司专家的建议下,英大财险放弃沿用传统的IOE架构,选择符合业内发展趋势、行业领先技术的分布式部署架构,以更好地解决当前系统所面临的诸多问题。

分布式架构改造方案

改造前,英大财险核心系统数据库的硬件运行环境为IBM小型机,数据库架构为一套Oracle 10g单实例,两台服务器HA集群,总体数据容量约1.5T。

为改变原架构下计算能力偏低、I/O性能差、空间容量及扩展能力不足的问题,云和恩墨给出了通过在线传输表空间(XTTS)方式将核心系统数据库从IBM小型机平稳迁移至x86分布式存储平台(zData)的方案。

总体方案架构如下图所示:

方案说明:

1)采用分布式存储一体机,实现核心系统支撑架构的高性能、强稳定、灵活扩展、低成本及易维护。在本方案中,根据实际调研情况,采用一套“3计算节点+3存储节点”的zData数据库一体机代替原来的传统架构,通过Infiniband高速交换网络、闪存卡、数据多份冗余及分布式的数据访问模式,彻底解决了现存的性能不足、扩展困难以及维护不便等问题。

2)采用Oracle RAC和Oracle ADG技术,实现核心系统的高可用灾备。为规避极端情况下的系统性故障,在本方案中采用Oracle RAC代替原来的HA高可用模式,可实现对业务无感知的故障切换能力;同时,对站点级故障采用了Oracle ADG技术构建了灾备节点,实现灾难情况下的核心系统恢复和业务连续性保障能力。

3)采用符合业界最佳实践的升级迁移方案,最大化的缩减停机时间、提升系统稳定。结合最佳实践,利用改造契机,将核心数据库由原已不被厂商支持的Oracle 10g版本升级为Oracle 11g,保障数据库的稳定且有保障;并采用先进的XTTS方式,在3个小时内完成了核心数据库在新旧环境间的迁移,实现了对业务影响的最小化。

改造前后性能对比

1)数据库负载大幅降低

原环境:

新环境:

数据库整体性能指标DB Time由1042.48m下降至106.14m,性能提升近10倍。

2)I/O效率大幅提升

数据库I/O类相关等待事件单次平均等待时间由25毫秒,下降至1毫秒以内。I/O性能提升近25倍。

3)业务效率大幅提高

平均提升幅度为10至30倍,部分业务场景下性能提升可达35倍以上,部分SQL执行时间由原来的2000多秒减少到100多秒,效率提升20倍。

4)更为强大的支撑能力

整体平台可支持超过200万的IOPS、20GB/s的MPBS、1000万次以上的TPM,使得英大财险可以在该zData平台上承载更多的业务系统,实现最佳性价比。

小结
英大财险核心系统数据库升级迁移项目,在经过前期严格且全面的高可用测试、应用功能测试、压力测试后,开始迁移准备工作。经过割接前一周数据文件的全量备份和恢复工作,割接前三天的第一次增量备份和恢复工作,割接当天的第二次增量备份和恢复工作,以及割接时的最后一次增量备份和恢复工作,整个系统在停机3小时内顺利完成割接。
至此,英大财险核心数据库从AIX小机平稳升级迁移至x86分布式存储架构,并构建了更为安全可靠的高可用容灾能力,有效地保障了业务平台的平稳运行,提高了数据库整体的稳定性、健壮性及安全性。
云和恩墨始终坚持以专业的态度、专业的产品、专业的服务,满足英大财险在IT信息化、产业数字化变革中的需要,与用户一道继续开展合作,提供更全面、更深入、更符合数据管理需求的产品和服务,推动英大财险向中国领先、具有国际竞争力的保险公司加速迈进。

 

关于zData数据库一体机
zData数据库一体机是基于云化架构的Oracle数据库高性能运行平台。架构支持软硬解耦:硬件以高性能x86服务器和高速闪存为基础,通过高带宽低时延的InfiniBand交换机进行互联,构建数据库运行的高速通路;软件实现多租户、高可用、高安全的分布式存储和资源统一管理。软硬件配合形成开放的、高可靠、按需动态扩展、极致性能的Oracle数据库运行平台。
该方案具备以下五大特点:
1)强大的IO处理能力
存储节点和计算节点通过高速56Gb/100Gb的Infiniband网络互联,通过zData Light Storage存储管理软件,在使用闪存卡和NVMe协议加持的情况下,单计算节点上的IOPS更是可以达到200万以上,I/O吞吐量达到30GB/s,磁盘访问延迟在0.6ms以内(三存储节点);存储的三项关键能力是传统磁盘阵列的10倍以上。
2)灵活的扩展能力
计算节点、存储资源可以随业务变化在线动态扩展。存储资源既可以动态添加SSD,也可以动态添加存储节点;计算资源也可以动态添加计算节点,实现性能和存储容量的准线性增长。
3)安全的数据和关键部件全冗余能力
数据支持两份或三份冗余,任何一个节点损坏,均不影响数据库的数据安全性和完整一致性。同时,采用关键部件(存储节点、计算节点、交换机、网络设备等)全冗余架构,在任一单部件出现故障的情况下,不会影响业务系统运行,保障了业务连续性。
4)强大的故障自愈能力
当某个存储节点出现故障时,分布式管理系统将自动把此节点上的数据在其它节点内进行重生,从而保证在节点故障的情况下,自动将数据保护模式恢复到原有模式,实现故障自愈式处理。
5)便捷易用的管理维护工具
便捷易用的监控及运维管理工具,可实现对整个分布式架构的软硬件环境的运行状况进行统一监控,对异常情况进行告警,并提供分析工具对系统运行状态进行统计和分析。

关于英大财险
英大泰和财产保险股份有限公司(简称“英大财险”)是经中国保监会批准设立的一家全国性股份制财产保险公司。公司由国家电网公司资产管理有限公司等31家国有大型骨干企业发起成立。
英大财险自2008年10月成立以来,业务健康发展,打破了财险业“三年持平、五年盈利”的行业规律,实现了持续盈利;机构和队伍不断壮大,已开设省级分公司30家,基本实现了对国家电网公司经营区域的覆盖;市场地位逐步提升,在中国保监会发布的2020年年报中,英大财险位列中国财险行业保费收入20强第15位,实现了由小型保险公司向中型保险公司的跨越发展。