<< 返回案例列表

华泰证券,数据库自动化运维的探索

2020年11月5日
,
,
,
z
C
l
o
u
d
,
1715
“  在金融科技的浪潮下,华泰证券正在以“数字化+平台化”的思路,全面启动了数字化转型,而数据库作为业务的重要支撑,面临着爆发式互联网业务增长带来的运维压力。在此背景下,华泰证券携手云和恩墨,共同组织进行了数据库服务平台的典型设计,实现了IT架构的转型升级。

 

数字化转型的挑战
1

华泰证券股份有限公司是一家领先的科技驱动型综合证券集团。自1991年成立以来,华泰证券积极把握中国资本市场改革开放的历史机遇,在业内率先以金融科技助力转型,并持续加大信息技术投入,积极探索证券行业的未来发展模式。

 

华泰证券坚定以数字化+平台化的思路,重构业务模式,并已经全面启动了数字化转型,用数字化思维和手段彻底改造业务及管理模式。

 

数据库作为业务的重要支撑,面临着爆发式互联网业务增长带来的运维压力,而以前建设的竖井式基础架构,无疑使数据库运维变得更加艰难。

 

• 统一管理难:面对数百套的数据库系统,缺少统一的数据库系统台账管理中心,无法全面获取数据库系统及其关联硬件资产的生命周期数据。

• 日常运维难:数百套的数据库系统,每日、每月例行的健康检查、工作任务繁重。

• 全面监控难:缺乏全方位、细粒度的系统运行状态监控、告警。

 故障快速定位难:随着系统架构复杂性变高,仅仅依托传统脚本来定位问题,不能满足证券行业对系统故障定位效率的严苛要求。

• 灾备演练难:缺少统一的备库管理中心。定期的灾备演练,需要依托大量的脚本、人工操作等方式才能完成,耗时耗力。

 

数据库自动化运维方案
2

具有前瞻性的数据库平台建设不能只停留在保证业务稳定的阶段,而是应该践行“数字化+平台化”的双轮驱动的理念,通过建设统一的数据服务平台,实现数据库系统运维的五大必要能力:事前预警能力、健康评估能力、故障快速定位能力、应急响应能力以及深度优化的能力。

 

在华泰信息科技部门的支持下,云和恩墨与客户携手共同组织进行了华泰数据库服务平台的典型设计、集中开发和试点推广。华泰数据库服务平台主要实现数据库建设、管理的自动化,接管华泰环境中所有的Oracle数据库,实现数据库系统的部署、运维、备份、监控、优化等平台级的管理控制。

 

 

敏捷迭代,测试先行
3

 

敏捷迭代

对于华泰证券这样的大型、重要券商,建设基于数据库系统的自动化运维服务平台是一项极其复杂的高难度工作,由于涉及到核心数据库的管理,所以需要慎之又慎。在经过云和恩墨的专家小组研究讨论后,最终与客户达成共识,即在追求系统功能稳定的大前提下,结合云和恩墨的研发力量和华泰证券的运维支持,采用敏捷开发管理方法,分步提供产品的功能模块。

 

用户故事->需求定义->功能排期->迭代会议->功能开发->功能测试->评审会议->回归测试->升级补丁->发布更新->升级实施

 

测试先行

鉴于数据库服务平台的重要性,为确保上线的功能稳定可靠,且对生产环境的数据库不造成任何破坏,我们同时构建了华泰数据平台的测试环境和生产环境,并先将每次迭代的发布更新,在测试环境上线试运行,在解决了测试环境中试运行出现的所有问题后,根据生产上线计划, 最终实现了生产环境的稳定上线。

 

获得阶段性成功,让运维跑起来
4

在经过了一年的持续迭代和使用磨合,华泰证券数据库服务平台达到了阶段性的预期:先让运维跑起来!

 

目前已上线了的平台功能包括多租户管理、灾备中心管理、数据库的表空间/用户管理、统一的监控告警管理、数据库部署、DG部署等基础运维的自动化、智能巡检自动化和对性能的智能优化分析等等,能够通过平台将日常运维的大部分内容搬到线上统一起来。

 

1多租户管理:支持资源隔离,用户隔离,多租户共存于一个统一平台。

 

 

2灾备管理平台化:数据库测试、灾备演练平台化、自动化。自动化备份恢复,能够将复杂的备份恢复简单化,流程化,确保数据安全。

 

 

3数据库表空间管理平台化:可以查看近期表空间增长数量和趋势,并排序列出增长最快的表空间,在线扩容。

 

 

4数据库用户管理平台化:可以在平台上管理数据库用户的创建及角色和权限管理。

 

 

5统一监控和告警:通过数据库会话、锁、阻塞树管理,快速定位问题,并可以一键杀会话,形成问题的闭环。

 

 

6基础运维自动化支持:针对数据库的基础运维工作如数据库部署、高可用环境搭建等,能够平台化和自动化。

 

 

7智能巡检分析:能够将数据库重要的巡检工作,实现自动化,并给出智能化建议。

 

 

8性能分析:自动采集性能数据,分析找出性能瓶颈,进而辅助系统优化工作。

 

 

 

 

朝着智能化运维迈进
5

华泰证券DBA架构师胡连亚透露,根据数据服务平台一期建设情况,目前已构建了数据库全生命周期管理框架,完成了应急响应、故障预警、故障快速定位等关键能力的建设。后续将基于全生命周期管理框架,进一步夯实巡检智能化、服务自治化、健康评估全面化、SQL工作标准化等的运行管理能力,提供自助式数据库服务,积极赋能DevOps。

 


“金融企业实现数字化转型在实现线下业务线上化之后,需要建设数字化运营能力,其中技术运营是重中之重,特别是如何确保以数据库运维管理为代表的运行保障能力建设对保障金融企业业务连续稳定运行具有重要意义,在本次实现数据库标准化运维管理的基础上,华泰将加强对数据高可用管理和运营能力的建设。”

 

——华泰证券信息技术部运行保障中心负责人 田江

 

 

 


一直以来,云和恩墨都秉承「数据驱动,成就客户」的理念,深入一线与客户并肩作战,打造真正满足用户需要同时引领行业的 dbPaaS 平台。感谢华泰证券的信任与支持,让我们可以一起探索AIOps的智能未来!

 

——云和恩墨总经理 盖国强

 

 

此次数据库自动化运维项目取得阶段性成功,更深层次的原因在于华泰证券与云和恩墨建立了深度的关联和良好的合作关系,并共同探索出了一条属于券商行业的数字化建设方法,为行业的数字化建设的发展提供了可行性的路径参考。未来,华泰证券将与云和恩墨继续携手共进,探索建设更加智能的数据库运维平台。