本次實驗室收到一件因地震導致機器摔下,需要緊急資料救援的案例 客戶原先使用群暉,24顆硬碟5TB組成 NAS 中的陣列Raid 5,總容量95TB 2024/04/03發生花蓮大地震,NAS從機架上摔下來,經過檢查後,二顆硬碟已經磁頭損壞、亮燈兩顆 發現使用舊方法救援,所需時間非常的長..... 藉由本次案例,分享如何節省時間,快速救援此種較複雜類型的NAS陣列救援!
設備名稱:群暉 Synology
硬碟數量:DS2415+ &DX1215
總容量:95TB
方法一、使用舊方法資料救援,速度緩慢,需要28年!!
更換好其中2顆磁頭後 24顆硬碟資料已經全鏡像,但是掛成一般救援軟體虛擬Raid掛載。
一般資料軟體 I/O 速度大概 30MB/s
90T*1000=90000GB
30MB*60*60/1000=108 GB/ Hour
恢復時間 90000/108= 833 小時
所以一般資料救援公司會跟客戶說需要900 Hours來恢復…差不多45天
而本案例狀況特殊,恢復數據,軟體時間更長….
然而這邊客戶十萬火急… 急需救援出資料…
因此我們開始換新方法,將原來損壞硬碟 1:1對拷後,換上新的硬碟 , 總共硬碟 5T *24顆。
整組先裝到本實驗室已經準備好的 NAS A (Source)硬體,搬到NAS B (Target) (客戶新買硬碟+原NAS)
這樣客戶到時候可以直接拿NAS B上線,傳送必須要二台直連.. 絕對不可以用電腦掛載二台 NAS檔案傳送!
轉移NAS方法,標準方法是用 Migration Assistant
Migration Assistant 強調服務不用停是他的優勢,不過如果只有純檔案的話,以下提供的方法比較好!
方法二、Target NAS 設定成FTP Server ,Source NAS File Station 掛載 GUI 操作複製
本來都很順 大概2xxMB/s
結果跑了6小時 後變成3MB/s
且FTP 續傳怪怪的
方法三、調整優化NAS 架構加快資料救援恢復速度
調整NFS封包設定
調整MTU到9000
增加第二個 Rsync Session,這樣把頻寬吃到了380MB/s
平均來講,在 300MB/s.
但這邊不滿意 才發現 直接NFS掛載後,使用 CP 效能最快
也就是說,90T恢復時間縮減到縮減到 80小時內
可在一個禮拜交出90T資料救援數據!
結論
Raid 陣列,企業儲存資料救援除了修復硬碟韌體、磁頭技術手段,手上是否有足夠設備、儲存空間以及優化Infra概念,絕對影響資料救援恢復成敗與時間… 當NAS遇到狀況後,一定要以最快速度先將最重要資料備份出來!10G ,NFS 等不可缺..
若自身不幸遇到機器摔落或是硬碟損壞等狀況,在自己拷貝低於200MB的狀態下,風險會更高!隨意處理通電可能會讓損壞狀況更加嚴重! 建議是直接停機,然後送到專業資料救援公司,儘速搶救把資料導出來!
如果沒有此種專業恢復設備與技術,歡迎洽詢OSSLab!
我們擁有頂尖的救援設備與證照,並熟知硬碟與系統底層技術原理、累積各式know-how。
針對硬碟與儲存裝置的各種現有狀況,分門別類 使用專業工具,近一步分析與執行最佳的資料救援路線。