よくあるお問い合わせ「OS を再起動したところ、再起動前は実行されていなかったサービスが、再起動後に勝手に実行されている。これは問題ではないか。」をテーマに続けてきた [ サービスの「状態」比較 ] シリーズは、今回で最後となります。
今回取り上げるのは、第一回で少しだけ触れた、このお問い合わせに潜む問題点です。
問題点を一言で言うと、「サーバーの正常性確認というタスクを現場で実施している当人が、作業の意味をよく理解していない」という事に尽きます。
重要なサービスが起動しておらず、実際にサーバーとしての役割を果たせていなければ、紛れも無い障害事案です。
しかし多くの場合は何の問題も起きておらず、サービスの「スタートアップの種類」が「手動」であるが故の、たんなるタイミングの問題 (詳細は #2 参照) である場合がほとんどです。
この問題は、さらに A、B、C の要素に分解出来ます。
=====================================
[ A ] Windows における「サービス」の挙動についての知識不足。
他の OS を管理する部署から異動してきたばかりでたまたま知らなかっただけなのかもしれません。
が、Windows を管理する仕事においては、こういった知識がないと他にも色々と困る事が出てくると思います。
なぜか資格試験対策の本ではあまり触れられていないようなので、#3 で紹介したような情報源を利用して積極的に情報収集する必要があります。
=====================================
[ B ] 管理対象サーバーの正常性判断基準およびその手法が確立されていない
これは必ずしも個人の力量の問題ではなく、どちらかと言うと組織の管理上の問題です。
「サーバーを再起動した後には、正常性確認のためにサービスの状態を確認する」という手順が決まっているのでしょうが、その結果を解釈・判定する基準を策定していないのであればお粗末と言わざるを得ません。
=====================================
[ C ] お問い合わせ自体の矛盾
個人的にはこの点が一番気になります。
再起動前は問題無く稼働していたことを根拠にその時のサービスの状態を「正常」とし、それと違っている現在(再起動後)の状態を「異常」ではないかと考えてお問い合わせいただくことが多いのですが、これはまったく理に適っていません。
「問題無く稼働していたから正常」というロジックが正しいなら、再起動後も同じロジックに基づいて正常性を判断出来るはずです。
「表面的には問題無くとも、サービスの状態を細かくチェックしなければ見つけられないような潜在的な問題も存在し得る」ということを心配しているのかもしれませんが、その場合、再起動前が正常だった保証など無いことになります。
これまで潜在的な問題に気付かないまま運用してきたのだとしたらそれも問題ですが、その点を懸念してお問い合わせいただいたことは(私が知る限り)ありません。
おわり。