语言
行业现状与问题
1、系统多、依赖复杂、管理难,现网整体情况无量化统计,规划模糊、建议不可信,无法约束管理业务系统;
2、申请业务太困难,不人性化,资源申请通常按最大资源申请,越大越好;
3、数据库部署时间长,需要人工介入,时长从数小时到1天不止,影响业务上线;
4、多种数据库运维对DBA要求高,无法提前预测风险,故障依赖DBA人工介入,告警多,难以查找,不灵活;
5、资源一旦申请了,利用率低,提不出优化措施,业务还不断申请扩容,不知道该如何优化,依赖外部专家。
方案详情
为解决通信运营商当前的数据库管理痛点,需要建立一套能够管理多元异构数据库、覆盖数据库全生命周期智能化数据库管理平台,提供覆盖安装部署、配置发放、监控告警、备份恢复、高可用、性能优化等方面的数据库全生命周期智能运维能力,从半手工半脚本、被动响应式的传统运维模式转向服务化、自动化和智能化的主动运营模式,减少重复的人工劳动,构建面向未来海量运维对象的dbPaaS能力。
dbPaaS能力基于云和恩墨的zCloud产品构建,立足于通信运营商的技术中台和微服务架构,构建运营中心、运维中心、能力中心,覆盖数据库管理的规划、建设、O&M、优化全生命周期。
一、运营中心
面向前台业务人员,实现资源运营规范化、精细化,简化管理流程,快速匹配业务对资源的需求。主要建设能力包括运营对象(服务发放、服务管理、SLA、服务变更)、运营角色(平台管理、租户管理、用户管理、权限关联)。
二、运维中心
运维中心面向后台运维人员,是dbPaaS的关键能力部分,主要覆盖数据库管理中的O&M和优化阶段,基于智能分析能力,提供主动和可预见的运维能力。
主要建设能力包括监控管理(监控告警、巡检评分、告警下钻、实时性能)、资源管理(物理设备管理、资源池管理、数据库管理、系统管理)、自动化管理(批量操作、脚本管理、作业管理、自动化部署)、安全管理(备份恢复、容灾演练、性能容量分析、SQL审核)。
三、能力中心
为运营中心和运维中心提供基础能力,属于dbPaaS通用能力,主要建设能力包括数据库服务、AIOps引擎、任务调度引擎、介质仓库、高可用服务、备份服务、数据库安全、API。
图片
方案优势
1、全自助式资源规划与申请,精细化人性化操作,提升资源申请效率和资源申请规范;
2、建立全面的资源视图,提供现网数据库资源的聚合视图,为数据库资源管理和优化提供支撑;
3、全面提升数据库运维管理成熟度,从自动化、智能化、数据安全等方面提升数据库管理能力;
4、通过问题智能感知、智能分析、智能处置提升数据库库问题处置效率,提升系统可用性;
5、通过高效的容灾环境搭建、管理,提升系统容灾能力,释放容灾架构能力。