障害の「切り分け」という作業

今回は、障害対応の初期段階のお話です。

 

 

コンピューターにおいて何らかの「障害」が発生したというお問い合わせの場合、まずは「それはどのような障害なのか」を明確にする作業から始めます。

作業内容を超ざっくり言うと、「こんな環境(条件)では同じ事が発生するだろうか?」といったようなことを、アレコレと試して試して試しまくります。

この作業は一般に「切り分け」と呼ばれます。

なぜそう呼ばれているのかははっきり分かりませんが、障害が「発生する環境(条件)」と「発生しない環境(条件)」を「切り分け」て、「病巣」を特定することだからだと思います。

 

 

回避策を検討するにしても原因を調査をするにしても、とにかくまず「切り分け」をしなくてはいけません。

相手が「どのような障害なのか」が分からなければ、手の出しようが無いからです。

たまに「原因の調査は後回しでいいから、過去に同じ事例があるかをまず教えてほしい。」といったご要望をいただく事もあります。

が、やはり「どのような障害なのか」が正確に分かっていなければ、過去の事例と照合することもままなりません。

 

 

さてこの「切り分け」ですが、実はこの段階では「技術力(知識)」はそれほど重要ではありません。

私の個人的な体感では、せいぜい二割程度です。

では残りの八割は何なのかと言うと、それは「思考力(知恵)」が五割と「経験」が三割です。

 

 

あくまでも譬え話ですが、「あるコンピューターで、あるアプリケーションが起動しない」という障害が起きたとします。

その時点でサポートセンターにお問い合わせいただいても、すぐにその障害を解決出来る見込みはほぼゼロです。

なぜなら、前述の通り「それはどのような障害なのか」がほとんど分かっていないからです。

 

 

こう言うと、「どのような障害なのかって? それはもう分かっている。このアプリケーションが起動しないんだ。」と思われるかもしれません。

しかし、それはただ目の前で起きている「事象」を口にしているだけです。

決して、「それはどのような障害なのか」を説明していることにはならないのです。

障害対応をするうえでは、まず最初の段階でその違いを理解しておく事が非常に重要です。

 

 

では実際に、このような場合に行う「切り分け」の例を挙げてみます。

1. 他のアプリケーションは大丈夫なのか?

もし、そのコンピューター上で他のアプリケーションも起動しないのだとしたら、アプリケーションの問題ではなくコンピューターの問題だと言えます。

2. 他のユーザーは大丈夫なのか?

もし、そのコンピューターに他のユーザーでログオンしてそのアプリケーションを起動できるのだとしたら、ユーザーの権限の違いによる問題なのかもしれません。

3. そのアプリケーションは、これまではちゃんと起動出来ていたたのか?

もし、そのコンピューターでそのアプリケーションを起動できた事が一度も無いのであれば、そもそもインストールの仕方がおかしかった可能性も出てきます。

 

 

ざっと三つほど例を挙げてみましたが、こういった切り分けの結果が異なれば、まったく違う障害だということをお分かりいただけるでしょうか。

(これだけで十分ではありませんし、実際の障害ではより多くの視点から切り分けを行います。)

「目の前で起きている事」だけでなく、「他に起きている事」と「起きていない事」まで確認し、障害の「輪郭」を浮かび上がらせなくてな、「それはどのような障害なのか」を正確に把握出来ないのです。

 

 

しかし、実際の障害において行うべき具体的な切り分け作業が書いてある技術書は、なかなか無いと思います。

せいぜい代表的ないくつかの障害パターンに対して、上記の三つのような例が一般論として書いてあるぐらいではないでしょうか。

実際の障害は様々なので、どのような視点から「こんな環境(条件)では同じ事が発生するだろうか?」という切り分けをすべきかは、結局のところ臨機応変に自分の頭で考えるしかないと思います。

 

ServerManager.exe

Windows Server 2008 の「サーバー マネージャ」と Windows Server 2008 R2 の「サーバー マネージャー」の実体は、「Microsoft管理コンソール(mmc.exe)」のスナップインの一つである「ServerManager.msc」でした。

 

 

一方、Windows Server 2012 や Windows Server 2012 R2 の「サーバー マネージャー」はプロセスとして独立し、「%systemroot%¥System32」にある「ServerManager.exe」になっています。

そのため、コマンドプロンプトや「ファイル名を指定して実行」に「ServerManager.msc」と打ち込んでも起動出来ません。

 

クラムメディア

資格試験対策の問題集をやっているのだが、問題の選択肢と解答における「有線ネットワーク」が「優先ネットワーク」に誤訳されてた。

(解説文だけは正しく「有線」となっている。)

いや、これはもう誤訳ですらなくて、単なる翻訳者のタイプミスだろ。

勘弁してほしい。。。