DB伺服器硬碟故障了


中午吃完飯回來,主管告知廠區的ERP無法執行,趕緊打開電腦,用SSH連線Linux主機。

幸好SSH還可以連線,輸入 ps -ef |grep ora 也看的見Oracle的背景程式,所以應該沒有當機才對。

檢查了Linux及Oracle的log,發現一堆 I/O Error的訊息,趕緊到機房一看,伺服器中有一顆硬碟亮起了紅燈。

我們的伺服器有三顆硬碟,其中兩顆是Raid 1,Linux及Oracle都放在這裡。

另一顆是單獨使用,存放archive log、同步的第二份redo log、rman及export的備份檔,壞掉的是這顆硬碟。

Oracle的log一直無法寫入這顆硬碟,以致於無法正常使用。

先將資料庫以shutdown aobrt關閉,接著處理Linux的部份:

修改 /etc/fstab,將備份的硬碟設定注解,重新開機(關機失敗,只好強制重開),

成功進入Linux之後,在Raid 1的磁碟中重建arhcive log、redo log、rman、export等與壞掉的硬碟相同的資料夾結構,

再將第一份的redo log複製過來並更名,重開資料庫成功。

當然這只是緊急的處理,讓Oracle DB可以正常運行,後續還是需要報修及還原設定。

Oracle DB的listener.log清理