1 故障描述
内存异常,XCF报警导致数据库主机宕机 。
2 故障恢复
2.1 REPORT 日志分析
将数据库主机起来之后,数据库可以 正常启动,OGG进程也是都起来了,但是过一段时间后,pump传输进程abend。
使用view report pump1日志如下:
源端错误信息就是一致刷
2023-02-17 15:00:21 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809.2023-02-17 15:00:31 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809.
2023-02-17 15:00:41 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809.
2023-02-17 15:00:51 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809.
2023-02-17 15:00:21 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809.2023-02-17 15:00:31 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809.
2023-02-17 15:00:41 WARNING OGG-01223 TCP/IP error 79 (Connection refused), endpoint: 192.168.248.92:7809
过一段时间后abend。
目标MGR rpport信息如下:
类似信息一直刷新 。
2023-02-17 15:01:01 INFO OGG-00963 Command received from EXTRACT on host [192.168.243.29]:51344 (START SERVER CPU -1 PRI -1 TIMEOUT 300 PARAMS ).
2023-02-17 15:01:01 INFO OGG-00963 Command received from EXTRACT on host [192.168.243.29]:51345 (START SERVER CPU -1 PRI -1 TIMEOUT 300 PARAMS ).
2023-02-17 15:01:01 INFO OGG-00963 Command received from EXTRACT on host [192.168.243.29]:51344 (START SERVER CPU -1 PRI -1 TIMEOUT 300 PARAMS ).2023-02-17 15:01:01 &nbs

文章描述了一次数据库主机因内存异常和XCF报警导致的宕机事件。在故障恢复过程中,OGG进程的Pump传输出现TCP/IPerror79,即连接被拒绝的问题。源端和目标端的日志显示端口7809的连接存在异常,尽管端口在监听,但无法建立连接。目标端的GGSERR.LOG中揭示了TCP/IPbinderror125,表明地址已被使用。最终,通过重启进程解决了问题,并且当Pump成功切换到其他端口连接时,恢复正常运行。
7675

被折叠的 条评论
为什么被折叠?



