ラベル イベントID の投稿を表示しています。 すべての投稿を表示
ラベル イベントID の投稿を表示しています。 すべての投稿を表示

2015-02-09

ハードディスクの不良ブロックとメーカーサポート


Windows Server 2008 のイベントログに、イベントID:7、「デバイス \Device\Harddisk0\DR0 に不良ブロックがあります。」が記録されていることに気づいた。普段はでないのだが、毎金曜の真夜中に開始されるフルバックアップを実行する度に出ていた。

ググると、CHKDSK /F を行えとか、ディスクのプロパティを選択して、 ツール→エラーチェック を行え、とか書いてある。 CHKDISK単独ならエラーは出ない。 が、パラメータに /F や /R を付けると、サーバ稼働中は実行できない旨のメッセージが出る。サーバなので、そう簡単には落すわけにはいかぬ。
ネット上には、ハードディスクに問題がある可能性があるので交換したほうが良い、という書き込みも散見された。

ということで、メーカーのDELLのサポートに電話をかけるとすぐに繋がる。 DELLはいろいろ言われているが、"サーバ"のサポートはいつも良い。 担当に現象を説明すると、原因を精査するには、以下の3つの方法(いずれもプログラム)があると言う。
  1. Server Asministrator
  2. DSET
  3. Diagnostics
上記1と3はサーバを一旦は停止しなければならないため、 「2.DSET」(ディーセット、と読むらしい)という診断プログラムを送付してもらい、実行した。終了すると、ZIPファイルが出来上がるので、それを返送する。
夜も更けてきても電話が来ないので、こちらから電話をしてみると別の担当者が出て、送ったファイルを見てもらう。と、即「ディスクに異常がある」とのこと(ふーん、そんな簡単に解るのか!?)で、ディスク交換となった。

なにが言いたいかというと、重要なハードはやはりハード屋に任せるのが良いということ。トラブル発生時、イベントログをチェックし、CHKDSK を行い、ググる、位までのところはなんとかなる。 そこで見当をつけてHDDやらの部品を調達して交換とかも、クライアント機であればなんとかなる。が、ダウンタイムを最小限にしなければならないサーバとなると、ソフト屋には厳しい。オンサイト契約料は高いがケチってはいけないと、今日だけは改めて思ったのだった。


後日談(15/4/14追記)
ハードディスクを交換してもらって10時間位かけてリビルド、しかし上記のエラーは解消されず。
サポートにDSETを再度送ると、「(RAID1の)ディスクが両方壊れている」という。ちょっと待った! いまさらそれは反則だ。もしそうなら、全部再インストールすることになる。 とりあえず、前回交換しなかったもう一方のドライブだけ交換してもらうことになったが、同時に不吉な記事を見つける。

Double Faults and Punctures in RAID Arrays


とっとも厭な予感。いい予感はあたったことはないが厭な予感はとっても良く当たる。
数日後メンテの人が来てもう一方のドライブを交換、当然リビルド=10時間。で、やっぱりエラーは解消されない。 結局、一旦Windows Server Backup を実行し、ディスクを初期化後にリストア。以後2か月強、このエラーは発生していない。


(土屋)


【関連する土屋企画の講習】
FileMaker Server とバックアップ(対象者:中級、5時間×1日)

2010-09-15

Windows Server 2008 サーバーマネージャの役割が表示されないときの対応方法

さて困った...役割追加したいだけなのになぜか真っ白

 Windows Server 2008 のサーバーマネージャから新しい役割を追加をしようしたところ、画面にさり気なく「エラー」と表示され、役割欄は真っ白いままという状況が起こりました。
 こうなってしまってはインストール済みの役割を参照することも、役割を追加したり削除したりすることもできません。

 以下の画面は、画面下の「エラーの詳細」リンクをクリックしたときに表示されたエラーメッセージです。

サーバー マネージャーの更新中に予期しないエラーが発生しました:
リモート プロシージャー コールに失敗しました。(HRESULT からの例外: 0X800706BE)


 このエラーはイベント ID1601 として記録されています。
 エラーの詳細はイベントビューアより、「アプリケーションとサービス ログ」→「Microsoft」→「Windows」→「Server Manager」→「Operational」の順に辿ることによって確認できます。

 この画面のように、イベント ID1601 が大量に記録されている場合は、おそらく当方が遭遇した障害とほぼ同じと考えても良いのではないかと思います。

Microsoft 技術情報を頼りに対応してみる

 この現象については回避策が Microsoft 社で提示されているのですが、自動翻訳があまりにも酷いため英語版を参考に対応してみました。

参考ページ:You receive an error message in Windows Server 2008 if you click Roles under the Server Manager console(Windows Server 2008 のサーバー マネージャーコンソールの役割をクリックするとエラーが返る)

1. 「スタート」→「ファイル名を指定して実行」の順に選択し、表示されたボックスに dcomcnfg.exe と入力して OK を押すと、コンポーネントサービスが開きます。


2.左ペインのツリーより、「コンポーネント サービス」→「コンピュータ」の順に展開すると、右ペインに[マイ コンピュータ]というアイコンが表示されるので、それを右クリックしてプロパティを表示させてから、「既定のプロパティ」タブを選択します。
 下図のように、設定の確認と変更を行います。


[既定の認証レベル] --- 接続(「なし」に設定されていたときのみ。)
[既定の偽装レベル] --- 識別する

3.“OK”をクリックしてプロパティシートを閉じ、コンポーネントサービスを閉じます。

 これでもう一度サーバー マネージャを開いて役割が参照できるか試してみてください。
(因みに当方ではこれでは解決しませんでした)

騙されたと思って当ててみようパッチ

 前述の方法を試してみてもエラーが再現する場合は、システム更新準備ツールという名前のパッチが Microsoft 社から出ていますので、それを当ててみます。
 (注意:アップデート関連作業は予期しない不具合を引き起こすことがあります。あくまでも自己責任でお願いします。)

Windows Server 2008 R2 x64 Edition 用システム更新準備ツール(KB947821) [2010 年 4 月]

 このパッチを当てたところ、サービス マネージャがサクサクと役割情報を表示するようになり、この問題は一気に解決してしまいました。

 当方の場合は Windows Server 2008 R2 x64 環境でこの現象が発生しましたが、ID1601 や同様のエラーが他の OS で発生している場合は、それらの環境に応じたパッチも出ているようですので、試してみると良いかもしれません。

その他 OS 向けパッチ:
Windows Vista 用システム更新準備ツール(KB947821) [2010 年 4 月]
Windows Vista for x64-based Systems 用システム更新準備ツール(KB947821) [2010 年 4 月]
Windows Server 2008 用システム更新準備ツール(KB947821) [2010 年 4 月]
システム更新準備ツール (Windows Server 2008 for Itanium-based Systems 用) (KB947821) [2008 年 8 月]
Windows Server 2008 x64 Edition 用システム更新準備ツール(KB947821) [2010 年 4 月]
Windows Server 2008 R2 for Itanium-based Systems 用システム更新準備ツール(KB947821) [2010 年 4 月]
Windows 7 用システム更新準備ツール(KB947821) [2010 年 4 月]
Windows 7 for x64-based Systems 用システム更新準備ツール(KB947821) [2010 年 4 月]

2010-09-13

IIS 運用中のマシンでイベント ID 115 のエラーが発生したらポート番号を疑ってみる

 Windows Server 環境で IIS による Web サーバを運用している場合、マシン起動時や WWW サービス起動時にイベント ID 115 のエラーが出ることがあります。

エラー内容:
「サービスはインスタンス 2 をバインドできませんでした。このデータはエラー コードです。
このメッセージに関する追加情報については、以下のマイクロソフト オンライン サポートのサイトを参照してください: http://www.microsoft.com/contentredirect.asp」


 上記ではインスタンスが 2 になっていますが、1 や他の番号が返されることもあります。
 これは IIS に設定されている Web サイトに対応する番号になっています。たとえば、Windows Server 2000 の IIS はインストール時に「既定の Web サイト」と「管理者 Web サイト」の 2 つのサイトを生成します。

 よって、サイトとインスタンスの関係は次のようになります。
 「既定の Web サイト」--- インスタンス 1
 「管理者 Web サイト」--- インスタンス 2

 今回のエラーはインスタンス 2 (= 管理者 Web サイト)で発生していたことになります。
 管理者 Web サイトの場合、IIS が 2000 ~ 9999 の範囲内で勝手にポート番号を自動割り当てするようになっているそうで、割り当てられたポート番号が別のアプリケーションにすでに使用されている場合は当然競合エラーが起こります。

 このサーバに自動割当されていたポート番号は 5900 で、これが VNC ポートと競合していました。


 ポート番号を任意の番号に変更して IIS を再起動したところ、エラーは解消しました。
 イベントビューアで同じようなエラーが発生している方は、一度ポート番号の競合を疑ってみると良いかもしれません。

参考サイト:
Web サイトおよび FTP サイトについて

2008-11-17

【Windows障害メモ】サーバの時刻が狂う

 ドメインコントローラのイベントビューアで NTP サーバのエラーが出ていました。
 イベント ID 11 NTP サーバー から応答がありませんでした

 NTP サーバの同期ミスということで、以下のコマンドを打って調べてみることにしました。

 NET TIME /querysntp

 結果は「このコンピュータは現在、特定の SNTP サーバーを使用するよう構成されていません。」だったため、外部の NTP サーバを登録して同期させることにしました。
 以下のサイトより、米国 NASA および東京大学の NTP サーバを指定してみました。

NTP サーバ一覧

 以下のコマンドで NTP サーバを指定することができます。この例では NASA の NTP サーバを指定しています。

 NET TIME /SETSNTP:198.123.30.132

 また、NTP サーバを複数指定したい時は、以下のように列記した NTP サーバ名(またはIPアドレス)を二重引用符で囲みます。この例では NASA の NTP サーバと東京大学の NTP サーバを一緒に指定しています。

 NET TIME /SETSNTP:"198.123.30.132 130.69.251.23"
 
 同期は 8 時間ごとに行われるということですが、レジストリキー HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\Parameters の Period 値を修正することで、同期の頻度を変更できます。


0 = 毎日 1 回。
65535, "BiDaily" = 2 日に 1 回。

65534, "Tridaily" = 3 日に 1 回。

65533, "Weekly" = 毎週 (7 日に) 1 回。

65532, "SpecialSkew" = 3 回正常に同期されるまでの間、45 分ごとに 1 回。その後、8 時間ごとに 1 回 (1 日に 3 回)。[デフォルト]

65531, "DailySpecialSkew" = 1 回正常に同期されるまでの間、45 分ごとに 1 回。その後、毎日 1 回。

freq= 1 日に freq 回同期する。


一応は NTP サーバーを設定して同期することは確認できましたが、例のイベント ID がまた出ていたので、ひょっとすると二つ指定したどちらかの NTP サーバとの同期に失敗したのかもしれません。

参考ページ:
W32Time サービスのレジストリ エントリ

【Windows障害メモ】 リモートディスクにアクセスできない

◇現象
アクセスできていたリモートディスクに、いつのまにかアクセスできなくなる
(NICを交換が原因か?)

発生イベント
イベントの種類: 警告
イベント ソース: LSASRV
イベント カテゴリ: SPNEGO (Negotiator)
イベント ID: 40960
日付: 2008/11/17
時刻: 11:29:53
ユーザー: N/A
コンピュータ: SC420
説明:
サーバー cifs/192.168.X.X の認証エラーを検出しました。 認証プロトコル Kerberos からのエラー コードは "指定されたユーザーは存在しません。
(0xc0000064)" でした。


◇解決策
http://www.eventid.net/display.asp?eventid=14&eventno=4189&source=Kerberos&phase=1

There were password errors using the Credential Manager. To remedy launch the Stored User Names and Passwords control panel applet (註:コンパネの「ユーザ名およびパスワードの保存」のこと)and reenter the password for the credential .

試してみて駄目だった(ような気がした)ので、エントリそのものを削除、さらに再アクセスしてアカウントとパスワードを再入力したらうまくいった。 尚、上記の「ユーザ名およびパスワードの保存」にこのときした入力したそれらは記録されず、どのような状況下でここに登録または誤登録されるのかは不明(調べていない)。

以上

【Windows障害メモ】ActiveDirectory へのログイン失敗

 最近、ネットワークコンピュータのうち一台がドメインに参加できなくなるという現象が発生しました。
 そのコンピュータに関しては、一ヶ月ほど前にネットワークカードを交換してからというもの、他のネットワークコンピュータからディスクドライブの参照ができなくなってしまいました。
 そしてつい先日、ActiveDirectory のドメインコントローラになっているサーバ機の Kerberos 認証サーバのリセット作業を行った後は、そのコンピュータはまったくログインできない状態となりました。

 ActiveDirectory サーバ機にはイベント NETLOGON ID 5722、クライアント機には NETLOGON ID 3210 が記録されたので、原因を調べてみると、ドメインコントローラでの認証エラーのようだったのですが、ネット検索により、以下の解決方法に辿りつきました。

Windows NT/2000/XP/2003 ドメインにログオンできない(その2)
ドメインに参加できない:コンピュータ・アカウントを登録し直す

 これらの情報に従って、一度そのコンピュータをドメインから外してワークグループにしてから、再度ドメインに参加させることによって、何とか解決することができました。
 単純なようで、意外とこれは裏技的な対応方法ではないかと思います。今回は上記サイトに助けられました。