设为首页 收藏本站
查看: 826|回复: 0

[经验分享] oracle数据文件的一次恢复经历

[复制链接]
YunVN网友  发表于 2018-9-13 09:17:30 |阅读模式
  环境介绍:
双机  
操作系统:solaris 10
  
数据库版本:oracle 11g R1 64bit
  1、半夜接到电话,说数据库报大量错误,起来查看数据库,发现数据库已崩溃,查看alert日志,发现I/O报错:
Wed Dec 18 00:36:57 2013  
KCF: write/open error block=0x98abe online=1
  
file=89 /dev/raw/raw03
  
error=27063 txt: 'SVR4 Error: 5: I/O error
  
Additional information: -1
  
Additional information: 8192'
  
Wed Dec 18 00:36:57 2013
  
KCF: write/open error block=0x9d70f online=1
  
file=91 /dev/raw/raw05
  
error=27063 txt: 'SVR4 Error: 5: I/O error
  
Additional information: -1
  
Additional information: 8192'
  
Automatic datafile offline due to write error onAutomatic datafile offline due to write error on
  2、之前出过因为工程队碰到线,导致现网问题,问机房人员今晚是否有工程,机房人员说,今晚有新设备接入SAN网络,但经了解,无人碰到线,查看本机系统日志,报错如下:
Dec 17 23:33:10 fly-db01 scsi: [ID 107833 kern.warning] WARNING: /scsi_vhci/ssd@fly6000c5d0008a0000006b131400440 (ssd28):  
Dec 17 23:33:10 fly-db01 SCSI transport failed: reason 'tran_err': retrying command
  
Dec 17 23:33:10 fly-db01 scsi: [ID 107833 kern.warning] WARNING: /scsi_vhci/ssd@fly6000c5d0008a0000006b131400930 (ssd52):
  3、查看其他使用到SAN存储的服务器数据库运行情况,alert日志,操作系统日志是否报错,以及挂载的为SAN存储的文件系统是否变成只读,发现部分数据库也已崩溃,部分主机的文件系统变成只读,操作系统日志报lpfc的错误,之前也出现过这个错误,一般在出现lpfc的错误一段时间后,文件系统就会出现只读
lpfc错误:  
fly008:/var/log # cat messages | grep lpfc
  
Dec 18 00:34:05 fly008 kernel: [10201542.768302] lpfc 0000:03:00.0: 0:(0):0203 Devloss timeout on WWPN 21:4g:00:0b:5e:6a:18:14 NPort x014400 Data: x40000 x1 x0
  
Dec 18 00:34:07 fly008 kernel: [10201544.816750] lpfc 0000:03:00.0: 0:(0):0203 Devloss timeout on WWPN 21:4h:00:0b:5e:6a:18:14 NPort x014500 Data: x0 x7 x0
  
Dec 18 00:34:07 fly008 kernel: [10201544.816802] lpfc 0000:03:00.0: 0:(0):0203 Devloss timeout on WWPN 21:4k:00:0b:5e:6a:18:14 NPort x014600 Data: x0 x7 x0
  
文件系统只读错误:
  
fly008~ #df -h

  
Filesystem           >  
/dev/mapper/vg_fly008_app-lv_fly008_app
  
99G   41G   53G  44% /home/fly008
  
fly008~ # cd /home/fly008
  
fly008/home/fly008 # touch 1.txt
  
touch: cannot touch `1.txt': Read-only file system
  4、对今晚所做配置进行回退,问题消失,重新拉起数据库,数据库正常启动,拉起应用,应用拉起失败,在应用的日志中,报如下错误:
SQLErrorCode: 376 ORA-00376: file 92 cannot be read at this time  
ORA-01110: data file 92: '/dev/raw/raw06'
  5、在数据库的alert日志,也报相关错误
DDE: Problem Key 'ORA 1110' was flood controlled (0x5) (no incident)  
ORA-01110: 数据文件 92: '/dev/raw/raw06'
  
*** 2013-12-18 05:04:16.284
  
ORA-12012: 自动执行作业 226 出错
  
ORA-00372: 此时无法修改文件 92
  
ORA-06512: 在 "FLY.DELETE_FLY_EXCEPTION_INFO", line 8
  
ORA-06512: 在 line 1
  6、查看数据文件的状态,标记为recover,需要进行恢复操作
SQL> SELECT file_name, file_id, tablespace_name, status, online_status FROM DBA_DATA_FILES ORDER BY TABLESPACE_NAME;  
FILE_NAME       FILE_ID  TABLESPACE_NAME   STATUS        ONLINE_STATUS
  
/dev/raw/raw06     92        FLY           AVAILABLE      RECOVER
  7、数据库开启了归档,有数据库的备份,对92的文件进行恢复操作
# su - oracle  
$ sqlplus / as sysdba
  
SQL> archive log list;
  
SQL> recover datafile 92;

  
SQL>>  8、恢复后,应用拉起正常,业务测试正常。



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.iyunv.com/thread-577417-1-1.html 上篇帖子: oracle安装脚本 下篇帖子: oracle sqlplus相关知识
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表