AIX 5.3 Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

简介:

系统环境:

操作系统: AIX 5300-09

集群软件: CRS 10.2.0.1

数据库:   Oracle 10.2.0.1


                     系统架构图


wKioL1NrS-bRgWeoAAFqCT5td6k189.jpg

                                       本机采用vg 并发(VG concurrent)作为共享的存储

故障现象:

wKioL1NrTRiSiP7DAAEUCn2pgac229.jpg

当在第一个node(aix211)执行root.sh时,被hang住......

查看日志:

[root@aix211 soft]#cd /u01/crs_1/log

[root@aix211 aix211]#ls

admin            client           cssd             racg

alertaix211.log  crsd             evmd

[root@aix211 aix211]#cd client/

[root@aix211 client]#ls

ocrconfig_458796.log  ocrconfig_471234.log

[root@aix211 client]#ls -lt

total 24

-rw-r-----    1 root     system          681 May  8 14:57 ocrconfig_458796.log

-rw-r-----    1 root     system         5684 May  8 14:54 ocrconfig_471234.log

[root@aix211 client]#tail -f ocrconfig_458796.log

Oracle Database 10g CRS Release 10.2.0.1.0 Production Copyright 1996, 2005 Oracle.  All rights reserved.

2014-05-08 14:56:08.858: [ OCRCONF][1]ocrconfig starts...

2014-05-08 14:56:08.860: [ OCRCONF][1]Upgrading OCR data

2014-05-08 14:56:27.280: [  OCROSD][1]utread:3: problem reading buffer 100e09f0 buflen 512 retval -1 phy_offset 102400 retry 0

2014-05-08 14:56:27.280: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:03.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1024 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:03.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

2014-05-08 14:57:39.279: [  OCROSD][1]utread:3: problem reading buffer 100f1b70 buflen 1536 retval -1 phy_offset 102400 retry 0

2014-05-08 14:57:39.279: [  OCROSD][1]utread:4: problem reading the buffer errno 5 errstring I/O error

出现磁盘的I/O故障!


解决方法:

1、查看PV和VG

[root@aix211 client]#lspv

hdisk0          00040f8aaa29d28e                    rootvg          active

hdisk1          000e1a6ce663b4af                    racvg           concurrent

[root@aix211 client]#lsvg racvg

--查看VG时也 hang 住......看来是共享卷组的磁盘出现了故障,因为是个实验环境,阵列不很稳定,重启系统......


2、重启系统后,重新执行root.sh

3、手工执行安装后校验

[oracle@aix211 ~]$cd /u01/soft/Disk1(CRS 安装盘)

[oracle@aix211 Disk1]$ls

cluvfy        install       response      rootpre       runInstaller  stage         upgrade

[oracle@aix211 Disk1]$cd cluvfy/

[oracle@aix211 cluvfy]$ls

bin           cv            cvupack.zip   jlib          jrepack.zip   lib           lib32         runcluvfy.sh

[oracle@aix211 cluvfy]$./runcluvfy.sh -help

USAGE:

cluvfy [ -help ]

cluvfy stage { -list | -help }

cluvfy stage {-pre|-post} <stage-name> <stage-specific options>  [-verbose]

cluvfy comp  { -list | -help }

cluvfy comp  <component-name> <component-specific options>  [-verbose]


[oracle@aix211 cluvfy]$./runcluvfy.sh stage -post crsinst -n aix211,aix212 -verbose

Performing post-checks for cluster services setup

Checking node reachability...

Check: Node reachability from node "aix211"

 Destination Node                      Reachable?              

 ------------------------------------  ------------------------

 aix211                                yes                    

 aix212                                yes                    

Result: Node reachability check passed from node "aix211".

Checking user equivalence...

Check: User equivalence for user "oracle"

 Node Name                             Comment                

 ------------------------------------  ------------------------

 aix212                                passed                  

 aix211                                passed                  

Result: User equivalence check passed for user "oracle".


Checking Cluster manager integrity...

Checking CSS daemon...

 Node Name                             Status                  

 ------------------------------------  ------------------------

 aix212                                running                

 aix211                                running                

Result: Daemon status check passed for "CSS daemon".

Cluster manager integrity check passed.

Checking cluster integrity...

 Node Name                          

 ------------------------------------

 aix211                              

 aix212                              

Cluster integrity check passed

Checking OCR integrity...

Checking the absence of a non-clustered configuration...

All nodes free of non-clustered, local-only configurations.

Uniqueness check for OCR device passed.

Checking the version of OCR...

OCR of correct Version "2" exists.

Checking data integrity of OCR...

Data integrity check for OCR passed.

OCR integrity check passed.

Checking CRS integrity...

Checking daemon liveness...

Check: Liveness for "CRS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CRS daemon".

Checking daemon liveness...

Check: Liveness for "CSS daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "CSS daemon".

Checking daemon liveness...

Check: Liveness for "EVM daemon"

 Node Name                             Running                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: Liveness check passed for "EVM daemon".

Liveness of all the daemons

 Node Name     CRS daemon                CSS daemon                EVM daemon

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       yes                       yes      

 aix211        yes                       yes                       yes      

Checking CRS health...

Check: Health of CRS

 Node Name                             CRS OK?                

 ------------------------------------  ------------------------

 aix212                                yes                    

 aix211                                yes                    

Result: CRS health check passed.

CRS integrity check passed.

Checking node application existence...

Checking existence of VIP node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        yes                       exists                    passed    

 aix211        yes                       exists                    passed    

Result: Check passed.

Checking existence of ONS node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Checking existence of GSD node application

 Node Name     Required                  Status                    Comment  

 ------------  ------------------------  ------------------------  ----------

 aix212        no                        exists                    passed    

 aix211        no                        exists                    passed    

Result: Check passed.

Post-check for cluster services setup was successful.

[oracle@aix211 cluvfy]$

@至此,CRS安装成功,问题解决!










本文转自 客居天涯 51CTO博客,原文链接:http://blog.51cto.com/tiany/1408511,如需转载请自行联系原作者
目录
相关文章
|
2月前
|
Oracle 关系型数据库
oracle asm 磁盘显示offline
oracle asm 磁盘显示offline
29 2
|
1月前
|
存储 运维 Oracle
Oracle系列十八:Oracle RAC
Oracle系列十八:Oracle RAC
|
2月前
|
Oracle 关系型数据库
oracle Hanganalyze no RAC
oracle Hanganalyze no RAC
15 0
|
2月前
|
Oracle 关系型数据库
oracle rac 手工安装补丁,不适用auto
oracle rac 手工安装补丁,不适用auto
25 3
|
2月前
|
存储 Oracle 关系型数据库
【数据库数据恢复】Oracle数据库ASM磁盘组掉线的数据恢复案例
oracle数据库ASM磁盘组掉线,ASM实例不能挂载。数据库管理员尝试修复数据库,但是没有成功。
【数据库数据恢复】Oracle数据库ASM磁盘组掉线的数据恢复案例
|
4月前
|
运维 Oracle 关系型数据库
服务器数据恢复-raid5故障导致上层oracle数据库故障的数据恢复案例
服务器数据恢复环境: 一台服务器中有一组由24块FC硬盘组建的raid5磁盘阵列,linux操作系统+ext3文件系统,服务器上层部署有oracle数据库。 服务器故障&检测: raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正常使用。 通过管理后台查看服务器中硬盘的状态,显示有两块硬盘处于离线状态。
|
6月前
|
Oracle 关系型数据库 Java
分享一个 Oracle RAC 模式下客户端建立JDBC初始连接时因ONS造成应用启动时卡顿30秒问题的排查分析案例
分享一个 Oracle RAC 模式下客户端建立JDBC初始连接时因ONS造成应用启动时卡顿30秒问题的排查分析案例
|
8天前
|
SQL Oracle 关系型数据库
【Oracle】玩转Oracle数据库(一):装上去,飞起来!
【Oracle】玩转Oracle数据库(一):装上去,飞起来!
45 7
|
1月前
|
Oracle 关系型数据库 数据库