注目トピック

Wikiガイド

最近の更新

2018-08-20
2013-10-30
2013-02-06
2011-06-22
2010-08-13
2009-03-27
2008-11-14
2008-11-13
2008-10-01
2008-09-19

SIGMABLADE+SigmaSystemCenterによる仮想マシンの自律運用システム

運用ポリシーの設定

ここからは障害発生時や負荷変動に応じて仮想マシンを制御するための運用ポリシーの設定を行います。このポリシーは「あるイベントが発生した際にどのようなアクションを実行するか」というルールの集まりです。ポリシーの設定は管理ビュー(タイトルバーの「管理」をクリック)で行います。管理ビューを開いたらツリービューにある「ポリシー」をクリックし、「ポリシー一覧」を表示させます。

ご覧のように、ポリシー一覧にはあらかじめ3種類の標準ポリシーが用意されています。ただし、これらの標準ポリシーは物理サーバ用のもので、仮想マシン用のものは用意されていません。そこで最初に仮想マシン用ポリシーを作成することにします。

なお、物理サーバ用のポリシーを作成する際は「標準ポリシーをコピーして変更を加える」という方法を取るのが一般的です。しかし、(当然のことですが)仮想マシンではハードウェア障害は発生しませんから、細かなルールを定義する必要はありません。仮想マシンにアクセスできなくなったら、その理由が何であれ再起動を実行するといったルールを定義しておけば十分でしょう。そこで、仮想マシン用のポリシーは一から作成することにします。

仮想マシン用ポリシーの作成

ポリシーを一から作成するにはポリシー一覧の画面で「設定」メニューにある「ポリシー追加」をクリックします。すると、下のポリシー追加画面が表示されるので、「名前」にポリシー名を入力して「OK」をクリックします。ここではポリシー名を「VM用ポリシー」としました。

ポリシー一覧に中身が空の新しいポリシーが追加されます。当該ポリシーの「プロパティ」アイコンをクリックしてください。

ポリシープロパティ設定画面が開いたら、「監視イベント」タブをクリックします。ご覧のように監視イベントは一つも登録されていません。そこで監視イベントを追加するためにアクションメニューの「追加」をクリックします。

この画面(対応処置詳細設定(新規))では、監視するイベントの情報とそのイベントが発生した際に実行するアクションを設定します。イベント情報の項目は以下のように設定します。

  • 名前:イベント発生時に実行する対応処置(アクション)の名前。ここでは「VMアクセス不可能状態」としました。
  • イベント区分:イベントのタイプ。ドロップダウンリストから選択します。ここでは「マシンアクセス不可能状態」を選択しました。このイベントはSSCから対象サーバにアクセス出来なくなった際に発生します。アクセスできなくなった理由については問われません。
  • 通報元:イベントの通報元となるサブシステム。ドロップダウンリストから選択します。ここでは「VMwareProvider」を選択しました。
  • イベント:イベントのタイプ。ドロップダウンリストから選択します。ここでは「Alarm Virtual Machine Heatbeat on VM changed form green to red」を選択しました。これはVMwareの仮想マシンがハートビート信号に応答しなくなったときに発生するイベントです。
  • イベント名:イベントの名前。標準では「イベント」と同じ内容が入力されます。特に書き換える必要はありません。

イベントの情報を定義したら、「イベントに対する復旧処理」の枠内で実行するアクションを設定します。ここでは、1番目のアクションとして「通報/ E-mail通報、ESMPRO通報」を設定し、2番目のアクションとして「マシン操作/ マシン再起動」を設定しました。イベントの記録を残すために1番目のアクションには「通報」を必ず設定するようにしてください。

イベント追加後のポリシープロパティ設定画面(「監視イベント」タブ)です。次に、作成したポリシーを仮想マシンに適用します。

ポリシーの適用は、運用ビューのグループプロパティ設定画面で行います。手順は以下のとおりです。

  • タイトルバーの「運用」をクリック
  • ツリービューで対象グループ(ここでは「VM」)をクリック
  • 「設定」メニューの「プロパティ」をクリック
  • 「全般」タブをクリック
  • 「ポリシー名」のドロップダウンリストで適用するポリシー(ここでは「VM用ポリシー」)を選択
  • 「戻る」をクリック

以上で仮想マシンへのポリシー適用は終了ですが、仮想マシンのOSによっては多少手を加える必要があります。たとえば、Windows Serverには回復不可能なシステムエラー(いわゆる“ブルースクリーン”)が発生したときに自動的にシステムを再起動する機能が備わっていますが、この機能とSSCからの再起動指令がバッティングする可能性があります。Windows Serverの自動再起動はブルースクリーン発生時にしか機能しませんが、SSCからの再起動指令はそれ以外の場合(たとえば何らかのサービスがスタックしてOS全体が反応しなくなったような場合)でも有効です。そこでWindows Server側の当該機能はオフにしておいてください。Windows Server 2003の場合は、コントロールパネルの「システム」→「詳細設定」タブ→「起動と回復」の「設定」ボタンと進み、「システムエラー」の「自動的に再起動する」のチェックを外します。

なお、上記の画面には「デバッグ情報の書き込み」というセクションがあります。これはシステムがクラッシュした際にメモリダンプを採取するためのオプションですが、これを利用する場合はメモリダンプ中にSSCからの指令で再起動が掛からないようにアクション実行に遅延時間を設定してください。そのためには、ポリシープロパティ設定画面(「管理ビュー」→「ポリシー」→「ポリシー一覧」→当該ポリシーの「プロパティ」アイコンをクリック)の「全般」タブで「抑制設定」にある「サーバアクセス不可障害の抑制(仮想コンピュータ)」をチェックし、遅延時間(秒数)を設定します。メモリダンプの所要時間はメモリ割り当て量やディスク性能によって変動しますので、適宜調整する必要があります。


目次