用 zCloud 解锁智能运维,“以小为美”的苏州银行成就数字化转型“大作为”
作为唯一一家总部设在苏州的城市商业银行,苏州银行坚持“以小为美、以民唯美”的发展理念,大力推进金融科技战略实施和数字化转型。智能化运维体系建设是银行数字化转型的重要工作,苏州银行联合云和恩墨构建 zCloud 数据库智能监控运维平台,解锁智能运维新体验,为数字化转型提速。
拥抱数字化转型,监控运维平台成重要抓手
2022年初,银保监会印发《中国银保监会办公厅关于银行业保险业数字化转型的指导意见》,对银行保险数字化转型提出了方向性指导,其中明确提出:“加快构建面向大规模设备和网络的自动化运维体系,建立‘前端敏态、后端稳态’的运行模式,推进基础设施虚拟化、云化管理。建立对信息科技资源全方位覆盖的统一监控平台,提高运维侧研发能力,积极运用大数据加强态势感知、故障预警和故障自愈,不断提高运维智能化水平。”
在政策指导下,各大银行持续推动数字化进程。智能运维在数字化转型过程中扮演着重要角色。随着银行各类业务“系统”日渐增多,结构关系日趋复杂,业务对IT的依赖程度越来越高。作为业务系统“神经末梢”的数据库,一旦出现问题,将对业务造成难以估量的损失。因此,建立一个高效稳定的数据库监控运维平台,成为当前银行数字化转型的重要抓手。
与国有大行和股份制银行相比,区域性银行深耕地方,具有地缘优势。苏州银行根植苏州,面向江苏,融入长三角,至今已发展了上百个分支行网点,服务个人客户超过千万。在数字化转型背景下,越来越多的新型应用组件在苏州银行业务系统的生产环境中上线使用,承载各类应用的数据库种类和数量也大幅增加,这给银行的数据库监控管理带来了新挑战。
此前,苏州银行采用开源监控软件 Zabbix 作为数据库监控系统,配合少量的DBA,在数据库数量较少的时候,可以高质量执行的运维工作。但随着运维对象指数级别增长,旧模式的已经不能满足数字化转型新环境的要求。仅以问题定位为例,面向海量运维对象和海量指标,耗时费力地依赖人工经验定位问题的做法显然不再可行了。
为提升对监控告警全生命周期的闭环管理水平,加强整体的IT运营和运维能力,苏州银行联合云和恩墨构建 zCloud 数据库智能监控运维平台,该平台可以实现统一监控并主动提示风险预警,帮助运维人员在问题故障出现之前排除隐患,使数据库环境始终保持在最佳状态,为同行业的监控运维平台的建设树立了“苏式”典范!
专业、精准是实现复杂IT环境下的最优数据库监控的前提。zCloud 诊断范围覆盖底层、业务、数据库三大类数百项可能引起数据库异常的核心问题。云和恩墨专业的深度学习算法模型和300多位专家经验积累形成的知识库,可以帮助运维人员快速发现问题并给出决策建议。
苏州银行信息技术部专家说:“在保证运维系统稳定运行的架构基础上,苏州银行联合云和恩墨构建的 zCloud 平台实现了从数据库实例->集群->主机三位一体的深度监控,并逐步完善三层架构风险预警机制。当收到问题预警时,运维人员通过 zCloud 一键诊断即可迅速定位故障原因,节省了大量时间,提升了主动运维的效率!”
在实际环境中就发生过这样一个案例,运维人员收到提示,发现M系统“磁盘IO负载过高”,监控状态处主机层也呈现黄色亚健康状态提示。运维人员迅速登录 zCloud 点击“一键诊断”查看,显示 zCloud 诊断根因为“M系统数据库正在进行备份,影响了其中某个数据库实例,并发现了6个问题”。
由此,苏州银行实现了全行数据库监控体系从单一基础资源监控到“主机-集群-数据库”的核心指标全链路监控,实现了运维模式由被动运维向主动运维、由人工运维向智能运维的转变。
打造双重视角,数据库运行情况尽在掌握
随着苏州银行业务网点的快速扩张,管理体系也逐渐变得多层次化、多元化,这意味着对其IT资产的集中管理和统一调度难度增加。数据库管理平台需要满足不同职位的人的差异化需求:银行数据中心运维人员要完成日常巡检、处理故障等工作;开发测试人员更关注数据库资源、表空间资源、账号权限等基础信息;公司领导则更关注周期性的数据库综合运行报告。zCloud“资产总览+监控总览”的双重视角,为多方提供其关注的数据库信息,多维度呈现数据库运行状态。
-
资产总览按照更贴近业务使用的视角来组织和呈现,页面展示了数据库类型及数量、主机资源池及关键活动告警信息,为使用方提供简洁、直观的数据库相关数据,方便业务人员第一时间掌握数据库系统的最新动态,及时了解运维部门提供的可用性服务。 -
监控总览从细节出发,展示运维人员最关注的核心指标,包括活动告警、智能诊断、巡检统计等数据库关键信息汇总,以及活动会话数Top10、会话阻塞数Top10、CPU使用率Top10等数据库关键指标,帮助运维人员实时了解数据库运行状态及趋势变化,聚焦核心问题。
自2021年12月上线以来,zCloud 已纳管苏州银行全行数据库,包括商业、开源等多个类型,协助处理各项告警问题上千条,为各业务系统的稳定运行提供了关键支撑。
zCloud 适应金融科技时代背景下的城商行数字化转型与发展需求,深入银行业务场景的智能运维方案直指银行数字化转型的核心。苏州银行数据库智能监控平台项目建设伊始,云和恩墨采用敏捷开发管理模式,与客户协同推进。zCloud 提供的数据库巡检、监控告警、性能分析、一键诊断等模块充分满足客户智能运维需求,实现了流程管理统一化、资产管理精细化的一体化运维管理,建立了符合金融机构的IT运维服务流程。对于云和恩墨,这也是科技赋能银行业的又一次成功实践!