频发:记ADG备库日志应用延迟的一次故障处理-云和恩墨技术通讯精选
各位亲爱的用户/读者朋友们:
为了及时共享行业案例,通告共性问题,达成知识共享和提前预防,我们整理和编辑了《云和恩墨技术通讯》(7月刊),通过对过去一段时间的知识回顾和故障归纳,以期提供有价值的信息供大家参考。
同时,我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来,为您提供具有前瞻性的支持信息,保持对于当前最新的数据库新闻和事件的了解,其中包括重要数据库产品发布、警报、更新、新版本、补丁等。
本期目录:
新闻:2019年7月份数据库流行度排行榜
警示:Oracle 12.1 因 bug 触发 ORA-600
警示:PGA 超过 4GB 时触发 BUG 导致 ORA-4030
频发:记ADG备库日志应用延迟的一次故障处理
经验:如何应对DNS服务器异常导致监听故障
经验:Linux大内存下未设置大页引发故障
问题:开启Audit审计偶遇buffer busy waits异常等待
问题:主机内存太大致redo buffer size超过redo file size继而引发大量log file switch
公告:墨天轮DBASK技术专家邀请函
抢先下载:https://cs.enmotech.com/docDownload/2988(复制链接浏览器中打开,或者点击“阅读原文”)
往期技术通讯下载链接:https://cs.enmotech.com/docDownload?tag=enmo_techrelease
部分精选 - 频发:记ADG备库日志应用延迟的一次故障处理-卢立广
Oracle ADG(Active Data Guard)实现了主备数据库之间的数据实时同步传输,但是如果备库 standby redo log 组数配置过少,在业务高峰期时刻,主库日志切换频繁,备库日志来不及应用, 便会导致短期内暂无空闲的standby redo log接收主库传输过来的日志,从而引发数据延迟,增 加潜在的数据安全风险。近期,我们再次收到几个核心生产系统的故障案例, 特此再次提醒大家,防范此问题发生。
问题描述
某客户数据库的DG备库出现间歇性的日志应用延迟,具体表现为备库apply lag延迟过高。影响到数据库的实时同步传输,增加潜在的数据安全风险。
检查该备库的参数配置,发现备库参数均符合标准规范。
检查备库日志应用状态,MRP0状态为applying状态,表明备库正在做日志应用。
检查DG告警提示,发现无error项,且状态为valid,说明无传输性异常。
问题分析
由于DG相关的参数配置和进程均正常,无报错信息,检查主库的日志产生量,发现主库日志在一定时间内产生了较多的归档量,说明主库业务发生了变化。
检查主库的alert告警日志,以2019年5月29日下午3点到4点的日志为例,伴随着业务量的提升,主库产生的归档量增加,这也就意味着备库需要传输和应用的归档也会同步增加,通过alert日志可以看到,在业务高峰期,备库所有standby redo 都处于active状态,无法接收thread 1的日志,因此造成了日志的应用延迟。
问题解决
当前备库standby redo log比主库多1组,建议增加备库standby redo log 组数,防止在业务高峰期 时刻备库没有空闲的standbyredo log接收主库传输过来的日志,引发数据延迟。