Raid5數(shù)據(jù)恢復算法原理:
分布式奇偶校驗的獨立磁盤結構(被稱之為raid5)的數(shù)據(jù)恢復有一個“奇偶校驗”的概念??梢院唵蔚睦斫鉃槎M制運算中的“異或運算”,通常使用的標識是xor。運算規(guī)則:若二者值相同則結果為0,若二者結果不同則結果為1。
例如0101 xor 0010根據(jù)上述運算規(guī)則來計算的話二者第一位都是0,兩者相同,結果為0 ;第二、三、四位的數(shù)值不同則結果均為1,所以最終結果為0111。公式表示為:0101 xor 0010 = 0111,所以在 a xor b=c 中如果缺少其中之一,我們可以通過其他數(shù)據(jù)進行推算,這就是raid5數(shù)據(jù)恢復的基本原理。
了解了這個基本原理之后,您可以嘗試一下恢復raid5陣列的丟失數(shù)據(jù)。
北亞企安數(shù)據(jù)恢復——Raid5數(shù)據(jù)恢復
Raid5磁盤陣列數(shù)據(jù)恢復案例一:
一臺某品牌服務器中有一組由6塊SCSI硬盤組建的raid5磁盤陣列,redhat linux操作系統(tǒng)+ext3文件系統(tǒng)。
在運行過程中服務器癱瘓,管理員對服務器進行檢查后發(fā)現(xiàn)有兩塊硬盤離線,將其中一塊離線硬盤進行強制上線操作,但操作系統(tǒng)無法正常啟動。于是管理員將服務器關機,然后聯(lián)系北亞企安數(shù)據(jù)恢復中心恢復服務器中的數(shù)據(jù)。
在服務器數(shù)據(jù)恢復工作中,raid5陣列兩塊硬盤離線的情況十分常見。raid5支持一塊硬盤離線的冗余保護,一旦多塊硬盤離線,服務器便處于癱瘓狀態(tài),且離線硬盤不會自動上線。大多數(shù)品牌的raid控制器對陣列中磁盤狀態(tài)比較敏感,多數(shù)情況下硬盤掉線僅僅是因為電源波動、控制器bug、磁盤讀寫不穩(wěn)定等非磁盤故障原因所導致,所以很多情況下磁盤陣列中的掉線盤不存在物理故障,本案例就是如此。這種情況下將掉線硬盤強制上線的風險是很大的,一旦上線出錯就會給數(shù)據(jù)造成不可逆的損壞,數(shù)據(jù)恢復難度非常大。
將故障服務器中所有硬盤變厚取出,以只讀方式進行扇區(qū)級全盤鏡像,在鏡像備份過程中發(fā)現(xiàn)多塊硬盤存在壞道但沒有下線,可能是raid沒有讀到硬盤壞道。鏡像完成后將所有磁盤按照編號還原到原服務器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
基于鏡像文件分析原服務器的raid組成結構,虛擬重組raid并對raid結構進行驗證,人工修復破壞的結構,將修正后的數(shù)據(jù)導出到一臺存儲上臨時存放。
使用完好的硬盤在原服務器上搭建新的raid5磁盤陣列,將恢復出的數(shù)據(jù)遷移到新搭建的raid中。檢驗恢復出來的數(shù)據(jù),一切正常。
Tips:一旦raid5磁盤陣列出現(xiàn)多塊硬盤離線,并且服務器癱瘓的情況切記不要盲目進行強制上線操作。如果有足夠的備用空間,可將源硬盤全部鏡像。
北亞企安數(shù)據(jù)恢復——Raid5數(shù)據(jù)恢復
Raid5磁盤陣列數(shù)據(jù)恢復案例二:
一臺服務器中有一組由12塊磁盤組建的raid5磁盤陣列,Linux操作系統(tǒng)+ext3文件系統(tǒng)。Raid中2號盤和6號盤兩塊硬盤的指示燈亮黃色,工作人員檢查后將6號盤進行強制上線操作,強制上線后發(fā)現(xiàn)有很多目錄打不開,少數(shù)可以打開的目錄中的部分目錄有文件丟失的情況。管理員聯(lián)系北亞企安數(shù)據(jù)恢復中心恢復服務器中的數(shù)據(jù)。
鏡像過程在這里不再贅述了。首先基于鏡像文件分析原raid結構,將強制上線的6號盤去掉,將2號盤加入進去并虛擬重組raid。
提取數(shù)據(jù),在2號盤中發(fā)現(xiàn)不規(guī)則的壞道。
使用專業(yè)工具將2號硬盤進行完整鏡像,絕大部分壞道成功讀取。
將2號盤鏡像數(shù)據(jù)加入并虛擬重組raid環(huán)境,再次提取數(shù)據(jù),經過檢測,99%的數(shù)據(jù)都被恢復出來,用戶認可數(shù)據(jù)恢復結果。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9338瀏覽量
86165 -
數(shù)據(jù)恢復
+關注
關注
10文章
587瀏覽量
17674 -
RAID5
+關注
關注
0文章
122瀏覽量
12773
發(fā)布評論請先 登錄
相關推薦
評論