英大财险丨10倍业务效率和性能提升背后的核心系统架构升迁之路
伴随着IT信息化、产业数字化的浪潮滚滚向前,企业的信息化建设经历了逐步发展、逐渐成熟、加速转型的过程。特别是我国保险业正处于全面深化改革的关键阶段,业务的多样化、复杂化都对支撑系统提出了更高要求,管理上的难度也随之增大。唯有筑牢底层基础,才能支撑上层业务快速发展,才能更好地服务于社会需求。因此,打造一套可以稳定支撑、敏捷响应、降本增效的IT基础架构来满足未来业务的需要,也就理所当然地成为英大财险必须要走的一条发展之路。
随着英大财险核心数据库的数据量迅速增长,基本上可以达到50%的年复合增长率。照此计算,五年内数据量将至少翻三番,事务数也会有成倍的提高。相较于业务的高速发展,当前的IT基础设施能力则显得捉襟见肘。英大财险核心系统的支撑环境为传统的“IOE”架构,业务的大核心模式使得数据存放交互繁杂,且主机、存储等系统硬件均较为陈旧,随着各核心系统业务量的增加,主机性能已经越来越难以支撑;并且核心数据存放在集团的集中式存储中,I/O性能瓶颈明显,且扩展困难,数据量的增加也让这种存放模式难以支撑。
具体来看,当前的传统IOE架构存在诸多问题:
1. 中心化的存储系统成为I/O存取的瓶颈,性能受限;
2. 小型机+高端存储,成本高昂,相对比较封闭,扩展能力差;
3. 复杂的系统带来部署及操作、运维和管理的高门槛;
4. 数据库更新换代快,老系统对新功能、新特性支持不完善,无法提高业务效率。
经过前期审慎的可行性研究和需求分析,英大财险针对核心业务系统,从未来五年的业务需求出发,在数据库的结构上进行合理的分拆设计,保证业务分支的处理性能和效率,同时考虑对承载核心系统数据库的基础架构进行改造,以彻底改变当前计算能力偏低、I/O性能差、空间容量及扩展能力不够等问题。
作为目前的流行架构,分布式部署架构在动态扩展和高性能方面相较传统IOE架构有明显优势。一方面,通过x86化、分布式替代封闭的小型机和集中存储,实现去“IE”,提升了可扩展性和可用性,同时降低了成本;另一方面,通过Infiniband高速网络和SSD固态硬盘,可使同样成本下的I/O性能提升20倍以上。
最终,在云和恩墨公司专家的建议下,英大财险放弃沿用传统的IOE架构,选择符合业内发展趋势、行业领先技术的分布式部署架构,以更好地解决当前系统所面临的诸多问题。
改造前,英大财险核心系统数据库的硬件运行环境为IBM小型机,数据库架构为一套Oracle 10g单实例,两台服务器HA集群,总体数据容量约1.5T。
为改变原架构下计算能力偏低、I/O性能差、空间容量及扩展能力不足的问题,云和恩墨给出了通过在线传输表空间(XTTS)方式将核心系统数据库从IBM小型机平稳迁移至x86分布式存储平台(zData)的方案。
总体方案架构如下图所示:
方案说明:
1)采用分布式存储一体机,实现核心系统支撑架构的高性能、强稳定、灵活扩展、低成本及易维护。在本方案中,根据实际调研情况,采用一套“3计算节点+3存储节点”的zData数据库一体机代替原来的传统架构,通过Infiniband高速交换网络、闪存卡、数据多份冗余及分布式的数据访问模式,彻底解决了现存的性能不足、扩展困难以及维护不便等问题。
2)采用Oracle RAC和Oracle ADG技术,实现核心系统的高可用灾备。为规避极端情况下的系统性故障,在本方案中采用Oracle RAC代替原来的HA高可用模式,可实现对业务无感知的故障切换能力;同时,对站点级故障采用了Oracle ADG技术构建了灾备节点,实现灾难情况下的核心系统恢复和业务连续性保障能力。
3)采用符合业界最佳实践的升级迁移方案,最大化的缩减停机时间、提升系统稳定。结合最佳实践,利用改造契机,将核心数据库由原已不被厂商支持的Oracle 10g版本升级为Oracle 11g,保障数据库的稳定且有保障;并采用先进的XTTS方式,在3个小时内完成了核心数据库在新旧环境间的迁移,实现了对业务影响的最小化。
1)数据库负载大幅降低
原环境:
新环境:
数据库整体性能指标DB Time由1042.48m下降至106.14m,性能提升近10倍。
2)I/O效率大幅提升
数据库I/O类相关等待事件单次平均等待时间由25毫秒,下降至1毫秒以内。I/O性能提升近25倍。
3)业务效率大幅提高
平均提升幅度为10至30倍,部分业务场景下性能提升可达35倍以上,部分SQL执行时间由原来的2000多秒减少到100多秒,效率提升20倍。
4)更为强大的支撑能力
整体平台可支持超过200万的IOPS、20GB/s的MPBS、1000万次以上的TPM,使得英大财险可以在该zData平台上承载更多的业务系统,实现最佳性价比。