ZONE - 性能监控与性能分析平台



云和恩墨自主研发的数据库级性能监控与性能分析工具 - ZONE,是综合众多客户使用常规监控工具的综合体验,并结合云和恩墨专家十数年优化经验推出的一款数据库运维产品。通过主机层、数据库层多个维度的性能信息展示、对比、趋势分析,可以直观的展示各个应用、数据库的性能变化,使DBA可以从容的通过对系统配置、SQL语句等各种性能因素深入挖掘、对比分析,快速准确的定位性能问的根本原因。


ZONE性能监控与分析工具有以下意义:

  • DBA和运维人员通过该工具进行数据库监控,快速定位问题根源,解决隐患,提升数据库和应用的可用性。

  • 管理人员可以通过该工具了解各个应用对数据库资源的需求情况,方便制定业务发展计划。


目前ZONE产品已服务于大地保险、三胞集团、合肥京东方B3、民生银行等多家客户,因其使用直观、全面、轻量、灵活、高效、智能等特点,得到客户的认可。



image.png



接下来将从四个方面介绍:平台特点、系统架构、功能概览、重要功能。


1.平台特点

ZONE是我们进行快速性能问题定位,解决隐患,提升数据库和应用的可用性的重要手段,具有如下特点:

  • 基于业界最佳性能实践和等待事件分析方法。

  • 主机、数据库、应用SQL多视角性能可视化。

  • 历史性能数据长久保留,直观性能趋势,环比、同比敏锐凸显性能变化趋势。

  • 构建性能基线,快速辅助性能确诊。

  • 持续7*24小时的数据库监控,自动化智能分析与预警。

  • 采用多级架构,有效降低对被监控数据库的性能影响。

  • 支持所有平台上的Oracle数据库。

  • 通过工具箱、工作台等功能模块整合简化DBA工作流程,提高数据库运维效率。

  • 监控点、指标模板化、定制化,构建贴身监控保健卫士。


2.系统架构

整体的架构如下图所示:


image.png


系统由四大模块组成:数据采集、数据存储、数据分析、结果展示。而以上的操作过程非常简单方便,下载并安装软件以后,就会自动完成整个的数据处理分析过程,并不需要下载脚本,分析过程也不需要人工干预。同时ZONE自动兼容Oracle 10g以上的各版本数据库。


ZONE的分析结果从不同的维度出发,设计了多种展示方式。


1、首页集中展示体现数据库性能的两个核心指标,以及DBA日常工作中最关注的内容。

● Active Session:数据库上的SQL并发执行数量。

● Total Wait Time:数据库上所有SQL执行时的消耗时间。

● 待处理告警:说明数据库运行中存在隐患、或者已经发生问题,需要DBA在第一时间响应,以保证数据库稳定运行。


image.png

对主机性能的展示:

● TOP主机:从多维度展示TOP资源消耗的主机,主要维度包括:主机负载、CPU等;

● 特定主机:从多维度展示特定主机的性能变化趋势,以及对应的基线变化;

● 主机性能对比:从多维度对比主机性能变化,支持多性能维度、不同主机的环比、同比;


下面是特定主机多维度性能指标变化趋势展示页面:

image.png

对数据库性能的展示:

● TOP数据库:从活动会话、执行次数、DB Time、事务数、逻辑读、物理读等多个维度展示TOP资源消耗的数据库。

 ● 特定数据库性能:展示特定数据库的活动会话变化趋势,并可以下钻到等待事件、TOP SQL等。

 ● TOP SQL展示:展示TOP SQL性能详情及变化趋势,以及该SQL执行时的绑定变量值、相关应用等。


下面是TOP数据库的多维度性能指标展示页面:


image.png


关于日常巡检的展示:

● 每天定时对各个数据库前一天的运行状态、性能、配置和容量等进行汇总分析,并形成报告,帮助用户快速了解所有数据库的健康状态。

下面是日常巡检展示页面:


image.png

3.功能概览


ZONE的功能概览如下图所示:


image.png

  • 首页:展现核心数据库的近期性能趋势;展现待处理告警多维度汇总统计

  • 性能展示:展示所有生产数据库的性能趋势,并支持钻取到Top SQL

  • 告警:展示数据库的性能、运行状态、空间使用、连接数、SQL性能等方面的告警

  • 工作台:涵盖DBA日常工作内容的统一操作平台,包括问题SQL和事件处理、配置管理、监控管理、数据采集等

  • 工具箱:涵盖DBA日常工作需要的SQL脚本、性能报告工具,以及所有数据库的全部数据字典、SQL信息等

  • 系统管理:包括主机信息管理、数据库信息管理、用户信息管理等功能


4.重要功能

part 1:数据分析

对于系统对分析可下钻到分钟级性能详情,并可下钻Top SQL详情、等待事件、秒级活动会话详情,并按等待事件、应用主机、执行计划等进行分组展示


1、DB time趋势


image.png

2、SQL分析


image.png

3、活动会话信息


image.png

支持多维度对数据库进行对比:单库环比和多库同比


image.png

能够展示数据库连接数变化趋势,并按应用服务器分组汇总


image.png

展示数据库使用空间变化趋势,可按用户、对象使用量进行分组展示


image.png

part 2:告警展示

展示所有数据库的告警记录,可按照告警级别、状态、数据库名称、告警名称等查找历史告警


image.png

part 3:监控管理

DBA可以针对不同业务类型的库,定制合适的监控模板。通过监控模板管理监控范围、阈值,从而实现对数据库的分级分类管理


image.png

DBA可根据需求定制监控项,设置:

  1. 告警逻辑:存储过程实现

  2. 告警频率

  3. 延迟告警次数

  4. 连续告警次数

  5. 静默期


延迟警告次数:数据库连续几次出发阈值后再发送通知,从而避免偶尔波动导致的误报。

连续警告次数:在数据库进入告警状态后,连续发送几次通知给DBA。

静默期:系统连续发送相应次数告警后,自动暂停告警一段时间,通过连接告警次数和静默期的协同作用,以免DBA再进行数据库维护时受到无效告警干扰。


image.png

part 4:CMDB模块

CMDB模块,管理数据库与应用系统之间的关系。为用户定位问题根源、了解数据库连接数变化趋势提供支持。


1、CMDB-数据库


image.png

2、CMDB-应用服务器


image.png

3、CMDB-应用系统


image.png

part 5:SQL中心

系统自动汇总所有数据库上的全部SQL信息:

‣执行用户

‣上线时间

‣最近活动时间


可以按如下条件搜索SQL:数据库、执行用户、上线时间、最近执行时间表、索引、执行计划


1、全部SQL展示

image.png

2、TOP SQL展示

展示Top SQL清单,可按:执行次数、运行时间、CPU时间、内存读、磁盘读进行排序。


支持按照数据库、schema、时间范围、表、索引、执行计划等查找SQL。并可对Top SQL创建问题单进行跟踪处理。


image.png

展示SQL的详细信息:

执行用户、上线时间、最近活动时间、性能趋势、执行计划、绑定变量、相关应用、相关表和索引等。


image.png

可以帮助DBA在线管理问题SQL


image.png


part 6:数据库等对象信息

1、数据字典展示


image.png

2、表结构详情

展示表的详细信息:创建时间、修改时间、分析时间、相关索引、依赖对象、相关SQL等。


image.png


part 7:常用脚本共享

帮助DBA集中管理在日常工作中积累的快捷脚本,有助于知识传递。支持在多个库上同时执行脚本,并将执行结果导出、下载到本地。


1、DBA常用脚本


image.png

2、多库执行脚本


image.png

云和恩墨自主研发数据库性能监控平台ZONE直观、全面、轻量、灵活、高效、智能,全面而精准地分析数据库存在的先有或潜在问题,有效帮助DBA做决策和分析。


对产品有任何疑问请添加微信云和恩墨小助手(sunx5126)进行咨询。


云和恩墨,致力于做您最值得信赖的数据管家。


相关案例
中国大地财产保险股份有限公司
行 业:金融服务
项 目:优化客户数据库运维管理流程
服务价值:帮忙客户从人工运维转到自助运维流程,在线优化SQL、管理性能隐患,大大提高运维管理效率、节省了50%的人力成本。