1.將服務(wù)器啟動,服務(wù)器自檢時手動進入管理程序查看raid磁盤陣列情況,發(fā)現(xiàn)硬盤的狀態(tài)為Failel,手動將其中一塊離線硬盤重新設(shè)置為online狀態(tài)后嘗試重啟服務(wù)器但重啟失敗。
2.將該硬盤重新Fail掉,重復(fù)上次的操作步驟將另一塊硬盤上線,啟動服務(wù)器,服務(wù)器啟動成功。
3.檢查系統(tǒng)和服務(wù)器內(nèi)的數(shù)據(jù)庫數(shù)據(jù)運行是否正常,然后用陣列配置工具把Failed后的盤手動rebuild,待rebuild完成后服務(wù)器及raid磁盤陣列系統(tǒng)就恢復(fù)原狀了。

磁盤陣列兩塊硬盤離線數(shù)據(jù)恢復(fù)案例二:

本案例中需要進行數(shù)據(jù)恢復(fù)的服務(wù)器為某品牌的 2850型號。服務(wù)器內(nèi)有一組6塊硬盤的raid5磁盤陣列,陣列內(nèi)的硬盤為SCSI硬盤,單盤容量為300G,服務(wù)器操作系統(tǒng)為linux Redhat4;文件系統(tǒng)為ext3文件系統(tǒng)。服務(wù)器在正常使用過程中由于未知原因有兩塊硬盤離線,管理員使用了案例一中提到的方法對其中一塊硬盤進行強制上線操作。但經(jīng)過嘗試發(fā)現(xiàn)服務(wù)器的操作系統(tǒng)啟動異常,無法通過強制上線方式恢復(fù)數(shù)據(jù),于是聯(lián)系到北亞數(shù)據(jù)恢復(fù)中心進行專業(yè)服務(wù)器數(shù)據(jù)恢復(fù)操作。
數(shù)據(jù)恢復(fù)工程師對客戶服務(wù)器進行扇區(qū)級別的完整備份,在備份過程中發(fā)現(xiàn)該服務(wù)器內(nèi)的一塊并未離線的硬盤居然存在大量壞道,可能由于服務(wù)器尚未讀到硬盤的壞道部分,因此尚未離線。
備份工作完成后對raid陣列結(jié)構(gòu)分析并重組raid環(huán)境驗證raid結(jié)構(gòu),通過人工的方式對被破壞的結(jié)構(gòu)進行修正并存檔。最后將修正和存檔的數(shù)據(jù)嵌入一臺正常的服務(wù)器陣列上即可進行數(shù)據(jù)驗證。
在服務(wù)器數(shù)據(jù)恢復(fù)工作中我們遇到了大量的raid5磁盤陣列兩塊硬盤同時離線的故障。其實raid5陣列是支持一塊硬盤離線時的冗余保護的,一組raid5陣列在一塊硬盤離線時是不會導(dǎo)致服務(wù)器癱瘓的,但如果是兩塊甚至多塊硬盤處于離線狀態(tài)時服務(wù)器便處于癱瘓狀態(tài)并且無法自動上線。由于raid控制器具有一定的敏感性,多數(shù)硬盤掉線僅僅是因為電源波動、控制器bug等隨機原因?qū)е拢缘艟€盤可能沒有嚴重的物理故障。本案例就是如此。但是此時管理員進行強制上線操作風(fēng)險性是很大的,一旦上線錯誤就會導(dǎo)致控制器對數(shù)據(jù)產(chǎn)生一些不可逆的損壞,當(dāng)管理員進入操作系統(tǒng)后因為文件系統(tǒng)不一致進行修復(fù),服務(wù)器中所有硬盤數(shù)據(jù)不一致,數(shù)據(jù)恢復(fù)難度非常大。

更多關(guān)于云服務(wù)器域名注冊,虛擬主機的問題,請訪問三五互聯(lián)官網(wǎng):www.shinetop.cn

贊(0)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享網(wǎng)絡(luò)內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。郵箱:3140448839@qq.com。本站原創(chuàng)內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明出處:三五互聯(lián)知識庫 » 服務(wù)器兩塊硬盤離線能否強制上線恢復(fù)

登錄

找回密碼

注冊