2015-02-09

ハードディスクの不良ブロックとメーカーサポート


Windows Server 2008 のイベントログに、イベントID:7、「デバイス \Device\Harddisk0\DR0 に不良ブロックがあります。」が記録されていることに気づいた。普段はでないのだが、毎金曜の真夜中に開始されるフルバックアップを実行する度に出ていた。

ググると、CHKDSK /F を行えとか、ディスクのプロパティを選択して、 ツール→エラーチェック を行え、とか書いてある。 CHKDISK単独ならエラーは出ない。 が、パラメータに /F や /R を付けると、サーバ稼働中は実行できない旨のメッセージが出る。サーバなので、そう簡単には落すわけにはいかぬ。
ネット上には、ハードディスクに問題がある可能性があるので交換したほうが良い、という書き込みも散見された。

ということで、メーカーのDELLのサポートに電話をかけるとすぐに繋がる。 DELLはいろいろ言われているが、"サーバ"のサポートはいつも良い。 担当に現象を説明すると、原因を精査するには、以下の3つの方法(いずれもプログラム)があると言う。
  1. Server Asministrator
  2. DSET
  3. Diagnostics
上記1と3はサーバを一旦は停止しなければならないため、 「2.DSET」(ディーセット、と読むらしい)という診断プログラムを送付してもらい、実行した。終了すると、ZIPファイルが出来上がるので、それを返送する。
夜も更けてきても電話が来ないので、こちらから電話をしてみると別の担当者が出て、送ったファイルを見てもらう。と、即「ディスクに異常がある」とのこと(ふーん、そんな簡単に解るのか!?)で、ディスク交換となった。

なにが言いたいかというと、重要なハードはやはりハード屋に任せるのが良いということ。トラブル発生時、イベントログをチェックし、CHKDSK を行い、ググる、位までのところはなんとかなる。 そこで見当をつけてHDDやらの部品を調達して交換とかも、クライアント機であればなんとかなる。が、ダウンタイムを最小限にしなければならないサーバとなると、ソフト屋には厳しい。オンサイト契約料は高いがケチってはいけないと、今日だけは改めて思ったのだった。


後日談(15/4/14追記)
ハードディスクを交換してもらって10時間位かけてリビルド、しかし上記のエラーは解消されず。
サポートにDSETを再度送ると、「(RAID1の)ディスクが両方壊れている」という。ちょっと待った! いまさらそれは反則だ。もしそうなら、全部再インストールすることになる。 とりあえず、前回交換しなかったもう一方のドライブだけ交換してもらうことになったが、同時に不吉な記事を見つける。

Double Faults and Punctures in RAID Arrays


とっとも厭な予感。いい予感はあたったことはないが厭な予感はとっても良く当たる。
数日後メンテの人が来てもう一方のドライブを交換、当然リビルド=10時間。で、やっぱりエラーは解消されない。 結局、一旦Windows Server Backup を実行し、ディスクを初期化後にリストア。以後2か月強、このエラーは発生していない。


(土屋)


【関連する土屋企画の講習】
FileMaker Server とバックアップ(対象者:中級、5時間×1日)

0 件のコメント: