会社のサーバが突如ハングアップ。そしてその後…悪夢のリスタート地獄が始まった。
リスタート地獄
ウチの会社のサーバが突如ハングアップした。
おそらく最初に気付いたのが私で、ファイルサーバにアクセスしようとしたらリンクが切れていると言われた為である。
ネットワークに問題があるかどうかをすぐに確認すべく、ブラウザを立ち上げていろいろなサイトを見てみるが普通に見る事が出来、さらに外部にサーバのあるメールに関しても普通に受け取る事が出来た。
であるなら、サーバがトラブっているのは間違いない。
というワケで、サーバを確認してみたところ、やはりハングアップしていた。
ウチの会社のサーバはDELLのPowerEdge2800という、もうお蔵入りしても良いぐらい古いサーバなのだが、その正面にインジケーターは普通に青色を示していたため、ハードウェアトラブルではないようだった。
ただ、何をしても操作を受け付けない。どう見てもハングアップ状態である。
仕方が無いので、リセットして再起動するしかないと判断。
実行したところ、ここから地獄が始まってしまった。
普通にBIOSを読み込み、必要なシークエンスを踏んでいった後、さぁ今から起動だ、という時に、こんなメッセージが出てきやがった。
STOP: c0000218 {Registry File Failure}
The registry cannot load the hive(file):
\systemRoot\System32\Config\SOFTWARE
or its log or alternate.
It is corrupt, abset, or not writable.
…これってサーバOSのブルースクリーンじゃねーのか?
レジストリファイルが壊れてる? そんな感じのメッセージである。
その後、物理メモリに読み込まれた状況を記録する為なのか、
Beginning dump of physical memory
Dumping physical memory to disk:○○
○○の部分は数字のカウントである。
おそらくダンプリストの事だろうと思う。
で、結局この後は勝手に再起動が始まり、同じ事を繰り返す状態になってしまった。
この時点で「こりゃヤバイ」と私自身は自分の手に負えない事を理解していて、社内に「サーバトラブルが発生し、すぐに復旧できる見込みなし」という事を全社に案内した。
専門家じゃないのよ…
ウチの会社には私以上のPCに詳しい人がいない。
これは年齢的な事を含めてもそうで、私以上に知っている人がいたとしても、それは単純にソフトウェアレベル、しかもWebベースの知識しかない。
ハードウェア含めた知識となると、完全にお手上げという状態で、私自身、今回の件を独自に修復できる自信がなかった。
というのは、ウチが今使用しているサーバOSは“Windows Server 2003”と、今年7月14日にマイクロソフトがサポートを打ち切ったサーバOSを使用していて、このWindows Server 2003はレジストリの自動バックアップ機能を持ち合わせてはいないという事を知っていたからだ。
もちろん、私が独自にレジストリをバックアップしていたという事実もない。
というか、私自身はハードウェア含めてサーバの切り替えをもう5年近く前から進言していたのである。まして、今年7月14日にマイクロソフトのサポートが切れる為、セキュリティとしても問題が出る事も伝えている。
それでもサーバの切り替え、或いはクラウド化を許可しなかったのは会社の経営側である。
イザとなれば私が何とかする…とでも思っていたのだろうか?
別に私はこうしたネットワークの学校に行っていたわけでもないし、ましてPCの知識だって独学である。ただ、長年扱ってきたため、基本的な所がある程度見えているというだけで有り、それ故に最近のPCの新技術が出てきたとしても、それが何をするものなのかの糸口が見えているに過ぎない。
だから基本的な所など解らないし、ましてトラブルが起きた時に正しい対処がとれるという事でもない。結局は専門家に頼まざるを得ない事実は変わらないのである。
そして今回のような事が起きてしまった。
その時にはもう手遅れなのである。
会社側が基幹システムと思っているならば、もっとそこに力を注がねばならない、という事を身をもって知る時が来てしまったのである。


最近のコメント