2010年1月7日 星期四

HDS 磁碟陣列detached搶救

機房前幾天連續二次斷電,再加上正關機時跳電,造成HDS中的CACHE資料遺失,直接的結果就是2台用CLUSTER提供網站服務的機器抓不到磁碟.........哭也沒用!

搶救的第一步,第一時間就是先從磁帶倒資料到另一台備援主機,讓網站可以work!

然後,當然是call 廠商!

廠商工程師來的時候,看到HDS系統警告的黃燈在亮,先查web log,結果做出了錯誤的研判,研判成CLUSTER的仲裁磁碟遺失,要打掉CLUSTER......其實從Array系統管理介面可以清楚的看到有三個LUN  Detached,不過我當下沒質疑,這個錯誤的研判讓我們做了許多白工,包括重灌2台CLUSTER主機!

最後,在重灌2台主機依然抓不到磁碟陣列,我們只好自己動手,在管理介面中讓detached的3個LUN做PARITY CORRECTION,也就是所謂的同位校正,神有保佑,資料只有毀損一小部份,主機也能正常運作囉~~

以下是HDS錯誤訊息,備忘一下~~





01/03/2010 15:53:56 C1 W48000 Forced parity correction LU is detected :MANUAL
...
12/28/2009 09:07:36 C0 W12000 User data lost(LU-0005) :MANUAL/STRC

1 則留言: