系統較為穩定了

【作者:tjm編輯案頭 2003.03.23


這次,我們主要是要把兩年半前購買,價值20多萬的 90G SCSI RAID更換為 10萬元左右, 600G 的IDE RAID。並且引進 lvm 與 journaling file system, 以提供可以自由縮放的硬碟分割功能與當機快速修復的檔案系統。我們預期建造 一個巨大、容易調整、穩定安全而且便宜的全新檔案系統,然後把舊的SCSI RAID 移到台北機房,供台北站使用。

於是,我們用了一個禮拜的時間,利用tech(技術組測試機器)先在新RAID 上安裝 redhat 7.3 系統,並且把舊資料搬過去,然後啟動新系統。沒想到在這個 過程中,遭遇到 tech 的 SCSI 卡不穩定,而後終究損壞的事件,讓我們查了半天 ,浪費了一個多禮拜的時間,才搞定。其間當然花了不少精力,我自己重裝redhat 7.3 至少有十幾次,又跑了不少次電腦公司,浪費了不少長途電話費....當然,我們不 用太差的SCSI卡,乃是使用 AHA 的高檔卡,只是沒想到發生這種問題。

真正重大的損失,是在我們已經完成life的安裝,正利用tech安裝bbs時, SCSI卡正式宣告損壞,而損壞的結果造成 SCSI 卡送出亂七八糟的信號,以至於 裝在同一台 RAID 上的 life (已經裝好了的)檔案系統嚴重損毀。本來,我們使用 ext3 這種 journaling file system,具有如同資料庫般的容錯功能,就算電源 被直接關掉,重新開機只要幾秒鐘就可以正常運作,不用耗費長時間去檢查硬碟。但是遇到tech的SCSI卡損壞,卻讓整個系統出現一些奇怪的不穩定狀況,直到 昨天我還在排除這些錯誤導致的問題.....至於硬體的損失就不用說了,我們 又乖乖的去買了一片近萬元的高檔 SCSI卡。

不管怎麼說,還是要感謝主,看著 PDA 上面的待辦事項一件一件的減少, 也就表示我們的系統一天一天的穩定健全。終於我們快要可以享受lvm與 journaling file system 的穩定與好處了(也就是這樣我才能在這裡報告 進度)。目前,僅剩的兩件大工程,就是我們必須進行高檔 SCSI 卡的遷移( 要把高檔的卡換到工作的主機上,總不能一直放在測試用的 tech 上吧!) ,並且進行 RAID 的硬碟抽換演習。這些事情,都預計在本週一(2003.03.24) 晚上南部技術組開會後進行,如果上帝保守,一切順利,則南部機房可以 進入另一個穩定的時期了。600 G(BBS 200G Life 400G)要灌爆,至少要 過個兩三年吧?

一切的計畫與保護措施,有時也敵不過意外的重大損壞。週一的大動作, 仍需您的代禱,我們預計停機時間將在一個小時之內。喔!忘了說,承蒙 神的恩典與mic的幫忙,我們找到六個硬碟的 RAID,所以使用六個120G的硬碟 後,可以用十萬元多一點的價格買到我們心目中的 RAID,這對我們拮据的預算 ,有重大的意義。


上一則下一則