ML115 G5 オンボード RAID HDD 増設でフリーズ??

2010/04/16

新規に購入した ML115 G5 を評価環境とするため、以下のセットアップを行った。

  1.  メモリの増設。1G × 4枚 = 4G。
  2. ハードディスクの増設。2T × 2 = 4T。
  3. ネットワークカードの増設。
  4. オンボード RAID の構成。ミラーリング。
  5. Windows Server 2008 R2 評価版 ( 無償版は、Microsoft Hyper-V Server 2008 R2) インストール。
  6. オンボード RAID のドライバーの更新
  7. Windows Server 2008 R2 の役割の追加から、Hyper-V をインストール。

上記の環境で、仮想マシンとして Windows 系から、Linux 系まで様々な OS をインストールして評価を行っていた。

それが、最近、挙動がおかしいことが多かった。

現象は、Hyper-V を使うタイミングで、突然フリーズし、ハードディスクのアクセスランプが点滅し続ける。 

Hyper-V を使うタイミングで発生していること、他のマルチコア化した ML115 G5 では同現象が確認できないことから、シングルコアプロセッサで、Hyper-V を使うことに無理があるのではと推測した。

また、ハードディスクのアクセスランプが点滅していること、比較的大きな容量 2T の HDD をオンボード RAID でミラーリングことから、BIOS、ハードレベルの相性が悪いのではと推測した。

何度か同様の現象が発生していたが、電源ボタン長押しで、電源を切り、リブートすると復旧していたので、あまり気にしてはいなかった。あくまで、評価環境として構築したからだ。

そして、また同現象発生。しかしながら、電源長押し、再起動での復旧ができなくなった。電源をいれなおしても BIOS のピッピ音 (デバイスを検知している音だと思う) が聞こえてこない。

これは OS レベルでの問題ではないと判断し、ハードウェアレベルでの切り分けを実施することにした。

こういう場合は、増設したデバイスを外しながら、消去法で問題を特定するのが常套手段。

まずは、一番怪しいと思っていた HDD の SATA ケーブル、電源ケーブルをマザーボードから外す。

電源オン、しかし、ピッピ音なし。疑って申し訳ないとオンボード RAID コントローラーと HDD に謝罪。

次に、PCI インタフェースのネットワークカードを外し、電源オン、ピッピ音なし。

次は、メモリスロット DIMM 1A 以外を外し、電源オン、ピッピ音が出た。

ということは、メモリに問題があるか、メモリスロットに問題があるかだ。

メモリスロット DIMM 2A、DIMM 3B、DIMM 4B と順番にメモリを設置して、電源オンを繰り返すと、DIMM 4B にメモリを設置した場合に、問題があることが分かった。

この場合、DIMM 4B スロット自体に問題があるか、DIMM 4B スロットに設置したメモリに問題があるかどっちかだ。

DIMM 3B スロットに設置したメモリを DIMM 4B に設置してみると、ピッピ音なし。

メモリスロットに問題があるらしいと分かった。この場合は、最悪の場合、マザーボード自体に問題があることもありえる。

何度か、DIMM 4B にメモリの抜き差しを繰り返すが、やはり再現してしまう。

DIMM 4B に物理的な問題があるのかと、スロットを覗き込むと、肉眼でギリわかるくらいのゴミがついていた。

そのゴミを慎重にマイナスドライバーで取り出す。これで、解決するわけないと思いながら、電源オン。

「ピッピ!!」

BIOS が起動した。

ML115 G5 クン、君はそんなに繊細なんだね。格安サーバーとか言ったり、デバイスの増設、筐体内のケーブリングなんかも雑に扱ってゴメン。

外したパーツを思いやりをもって、やさしく、丁寧に増設、ケーブリングしなおすよ。

デバイスの増設は、以下の記事を参照。

ML115 G5 HDD の追加