终止代码invalid kernel handle,警示:强制关闭OGG进程触发bug致abended,详述处理过程

 2023-09-22 阅读 13 评论 0

摘要:导读:Oracle Golden Gate(OGG)是一种基于日志的结构化数据复制备份软件,是一种较为常用且很成熟的数据复制手段。但是当OGG版本为10.0.0.0 - 11.2.0.0.0时,如果强制关闭OGG 进程时,可能会触发Bug – 14552560- For data pump导致进

导读:Oracle Golden Gate(OGG)是一种基于日志的结构化数据复制备份软件,是一种较为常用且很成熟的数据复制手段。但是当OGG版本为10.0.0.0 - 11.2.0.0.0时,如果强制关闭OGG 进程时,可能会触发Bug – 14552560- For data pump导致进程状态变为abended。在此我们分享一个近期的客户故障案例,供大家参考。

关注“数据和云”公众号的读者们都知道,每月我们都会整理数据库行业热点问题,分享行业经验,警示异常故障,以其帮助更多的用户,维护数据库系统安全稳定运行。

本文选自《云和恩墨技术通讯》(11月刊),下载地址:https://www.modb.pro/topic/5927(复制到浏览器中打开或者扫描下方二维码)

 

问题描述


某天早上5点左右,OGG源端所在服务器发生异常重启(已确认是存储损坏导致),服务器主机及ORACLE数据库恢复正常后,无法正常启动OGG。查看OGG进程,发现抽取和应用进程正常,但部分投递进程状态变为abended。

问题分析


终止代码invalid kernel handle、查看异常进程报错如下:

投递进程DPxxx、DPyyy、DPzzz等异常终止,进程报告提示读检查点的位置大于trail文件里记录的最大地址。

ERROR OGG-01705 Input checkpoint position 321693396 for input trail  file '/xxx/xxxx/xxxx/dirdat/xxxxx' is greater than the size of the file (321052167).  Please consult Oracle Knowledge Management Doc ID 1138409.1. for  instructions.

查看进程报告中提及到的MOS文档:OGG Extract / ReplicatCheckpoint RBA Is Larger than Local Trail Size (文档 ID1138409.1),文档里对此异常有明确的说明,属于OGG Bug – 14552560:Datadump Extract进程通常会读取磁盘缓存中的数据,而不是直接读取trail文件,如果主机突然重启,会导致缓存中的部分数据来不及写入到trail文件中,但是read checkpoint会把这部分数据记录为属于当前trail文件。而在下一次Datadump Extract启动时,会把主机重启前未写入trail文件的数据改写到下一个trail文件中,这就造成read checkpoint和实际数据所在trail文件产生出入。

问题解决


为保证OGG进程检查点的一致性,应尽量避免强制关闭OGG进程。

针对此问题,可采用如下2种方式:

ogg命令,1)进程重建

源端重建后,应用进程参数文件需添加参数handlecollisions和reperror default,discard

2)修改datadump extract检查点信息

可参考MOS文档:OGGData Pump Extract Abend With GGS ERROR 190 and ZZ-0SD "Input CheckpointPosition <m> for Input Trail File <file> is Greater Than the Sizeof the File <n>" (文档 ID 1389086.1)

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/3/83843.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息