从昨天开始正式全程参与某客户的数据库系统升级工作工作内容是将客户的关键应用从原先的Oracle单实例升级为Oracle 双实例RAC
更加详细的工作内容包括
将原先存储在JFS文件系统上的文件转移到GPFS中
将原先单实例模式的Shareplex转换为RAC模式的Shareplex
将原先的高级复制转换为简单的物化视图刷新
使用Oracle Clusterware替代HACMP负责Shareplex资源的切换
总的来说是一个很大的工程数据库大小在G左右升级使用DBUA单实例转换为RAC则使用rconfig实用程序
工作的几个难点在于
DBUA是否能顺利将Oracle 升级为Oracle ?
rconfig是否能顺利将单实例数据库转换为RAC数据库?
能否正常在Oracle Clusterware中添加Shareplex资源并且保证在各种异常情况下顺利切换到另外一台主机上?
之前已经做过多次测试希望这两天的正式升级会一帆风顺
升级工作圆满结束有惊无险
本来一直到rconfig转换单实例到RAC之前整个进度都是提前了个小时左右的敲完rconfig的命令之后大家欢欣鼓舞地去开会结果开完会回来发现rconfig失败了一直处于悬停状态整个主机没有任何负载数据库实例也完全无法登录根据回退方案将数据库重新转换为之前的单实例模式成功启动完数据库以后开始检查转换为RAC失败的原因最后发现是ntp服务配置有问题RAC两个节点的时间差异在小时重新调整ntp服务然后再次转换成功结束此时落后进度计划大概个小时
后续的工作一帆风顺应用上的几个问题也相继迅速地修改了上线当天上午观察了一下主机情况一切正常于是中午就离开客户处了没过小时客户电话说机房忽然断电所有设备全部意外down机 我问UPS呢?客户说就是一台UPS短路导致机房断电的我FT再赶回客户处等着加电幻想着加电以后GPFS文件系统全部损坏然后再从带库恢复数据的凄惨景象幸运的是加电以后全部设备都安然启动数据库也正常Shareplex丢失了一部分数据也都成功恢复
到今天为止没有更点儿背的事情发生应用完全正常宣告这次升级工作圆满结束