加入收藏 | 设为首页 | 会员中心 | 我要投稿 百客网 - 百科网 (https://www.baikewang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

数据库 update 操作慢,我为什么断定是硬件故障

发布时间:2022-10-11 10:18:56 所属栏目:MySql教程 来源:
导读:  如何完整处理一个故障,聊聊我的思路。

  技术人人都可以磨炼数据库更新操作,但处理问题的思路和角度各有不同,希望这篇文章可以抛砖引玉。

  一、问题背景

  某业务模块反馈系统涉及提交保存
  如何完整处理一个故障,聊聊我的思路。
 
  技术人人都可以磨炼数据库更新操作,但处理问题的思路和角度各有不同,希望这篇文章可以抛砖引玉。
 
  一、问题背景
 
  某业务模块反馈系统涉及提交保存类的操作异常缓慢,应用运维的兄弟排查说update相关的操作卡住了,卡在了数据库。
 
  卡在了数据库...留给我一句这,真让人头大。
 
  数据库环境:Oracle 19c RAC
 
  操作系统:CentOS Linux release 7.6.1810 (Core)
 
  存储:EMC存储
 
  二、故障现象
 
  三、故障说明
 
  四、疑问点排查及分析思路
 
  1、什么时间点开始有异常?异常前有没有做过变更?
 
  应用运维的兄弟反映昨天开始出现异常,而且系统已经很久没有做过变更了。
 
  ps:很多系统故障都是由变更引发的,提前了解系统做过什么操作对追根溯源很重要
 
  2、提交和保存类操作慢,DB是不是有阻塞会话?
 
  3、阻塞会话等待什么?
 
  两个节点等待和lgwr、control write有关,多次查询等待时有时无。
 
  查看pid为34852的会话

  可以看到节点2卡在了lgwr进程上。
 
  检查节点2的io等待情况
 
  查看节点2的io流程情况,io绝对值并不大
 
  对比节点1的io流量
 
  两个节点的io流量绝对值都不大,怀疑是硬件故障
 
  查看节点2的io空闲率
 
  排查到当前这一步,基本上可以断定存储故障,为了验证一下这个思路,我关闭了节点2实例,业务层面再次发起提交保存类操作速度恢复正常。
 
  4、解决?
 
  rac的io链路是比较长的,如主机上的hba卡,光纤,san交换机,存储控制器,前端口等,都有可能出现问题,我的工作到此结束,解决硬件故障那是服务器厂商的事
 
  长舒一口气,故障处理结束,故障分析处理方案整理成册,争取著作等身。
 
  全文结束。
 

(编辑:百客网 - 百科网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!