Cluster Server 7.4.3 管理者ガイド - Linux
- 第 I 部 クラスタ化の概念と用語
- Cluster Server の概要
- Cluster Server について
- クラスタ制御のガイドラインについて
- VCS の物理コンポーネントについて
- VCS の論理コンポーネント
- クラスタトポロジーについて
- VCS 設定の概念
- Cluster Server の概要
- 第 II 部 管理 - VCS の利用方法
- VCS ユーザー権限モデルについて
- コマンドラインによるクラスタの管理
- コマンドラインでの VCS の管理について
- VCS ライセンスのインストールについて
- LLT の管理
- VCS の起動
- VCS エンジンと関連プロセスの停止
- VCS へのログイン
- VCS 設定ファイルの管理について
- コマンドラインによる VCS ユーザーの管理について
- VCS のクエリーについて
- サービスグループの管理について
- リソースの管理について
- リソースタイプの管理について
- クラスタの管理について
- VCS でのアプリケーションとリソースの設定
- VCS Simulator を使った VCS の動作の予測
- 第 III 部 VCS 通信と操作
- クラスタの通信、メンバーシップ、データ保護について
- クラスタ通信について
- クラスタメンバーシップについて
- メンバーシップアービトレーションについて
- データ保護について
- I/O フェンシングを使う VCS 操作の例
- I/O フェンシングを使わない、クラスタメンバーシップとデータ保護について
- I/O フェンシングを使わない VCS 動作の例
- I/O フェンシングの管理
- vxfentsthdw ユーティリティについて
- vxfentsthdw の -c オプションを使ったコーディネータディスクグループのテスト
- vxfenadm ユーティリティについて
- vxfenclearpre ユーティリティについて
- vxfenswap ユーティリティについて
- コーディネーションポイントサーバーの管理について
- IPv6 またはデュアルスタックをサポートする CP サーバーの設定について
- ディスクベースとサーバーベースのフェンシング設定間の移行について
- VCS の動作の制御
- リソース障害時の VCS の動作
- サービスグループレベルでの VCS 動作の制御について
- リソースレベルでの VCS 動作の制御について
- ストレージ接続消失時の VCS 動作
- サービスグループワークロード管理
- ワークロード管理を示した設定例
- サービスグループの依存関係のロール
- クラスタの通信、メンバーシップ、データ保護について
- 第 IV 部 管理 - 高度な操作
- VCS イベント通知
- VCS イベントトリガ
- イベントトリガのi使用
- イベントトリガの一覧
- Virtual Business Service
- 第 V 部 Veritas High Availability 設定ウィザード
- 第 VI 部 ディザスタリカバリ用のクラスタ設定
- クラスタの相互接続 - グローバルクラスタの作成
- コマンドラインによるグローバルクラスタの管理
- RDC の設定
- キャンパスクラスタの設定
- 第 VII 部 トラブルシューティングおよびパフォーマンス
- VCS パフォーマンスに関する注意事項
- クラスタコンポーネントの処理速度に対する影響
- クラスタ操作の処理速度に対する影響
- システムパニックのときの VCS の処理速度に関する注意事項
- スケジュールクラスと優先度の設定について
- VCS エージェントの統計機能
- VCS のチューニングパラメータについて
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- サイトのトラブルシューティング
- I/O フェンシングのトラブルシューティング
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- VCS クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- セキュア設定のトラブルシューティング
- ウィザードベースの設定に関する問題のトラブルシューティング
- [Veritas High Availability]ビューの問題のトラブルシューティング
- VCS パフォーマンスに関する注意事項
- 第 VIII 部 付録
メンバーシップアービトレーションの機能
クラスタの起動時に、すべてのシステムは一意のキーをコーディネータディスクに登録します。キーはクラスタとノードに固有のもので、LLT クラスタ ID と LLT システム ID に基づいています。
I/O フェンシング登録キーの形式についてを参照してください。
認識されたメンバーシップの変更がある場合、メンバーシップアービトレーションは次のように動作します。
GAB はシステムを DOWN としてマーク付けし、システムをクラスタメンバーシップから除外し、メンバーシップの変更(切り離されたシステムのリスト)をフェンシングモジュールに配信します。
クラスタ内で最小の LLT システム ID を持つシステムがコーディネータディスクの制御権の獲得競争に参加します。
最も一般的なケース(切り離されたシステムが実際に停止したか障害を起こしている場合)では、この競争の参加者は 1 システムだけです。
2 つ以上のサブクラスタが形成されているスプリットブレインのシナリオでは、コーディネータディスク制御権の獲得競争は、サブクラスタの最小の LLT システム ID を持つシステムによって行われます。サブクラスタ内の他のすべてのシステムに代わって制御権の獲得競争に参加するシステムは RACER ノードと呼ばれ、サブクラスタ内の他のシステムは SPECTATOR ノードと呼ばれます。
I/O フェンシング制御権獲得では、RACER ノードでパニックが発生するか、コーディネーションポイントに到達できない場合、VxFEN RACER ノードの再選択機能によって次に低いノード ID を持つサブクラスタ内の代替ノードが RACER ノードの役割を担います。
RACER 再選択は、次の手順で行われます。
RACER ノードに予期しないパニックが発生した場合、VxFEN ドライバは RACER の再選択を開始します。
RACER ノードがコーディネーションポイントの過半数に到達していない場合、VxFEN モジュールはサブクラスタ内の他のノードに RELAY_RACE メッセージを送ります。 次に、VxFEN モジュールは次に低いノード ID を新しい RACER として再選します。
再選が連続して行われ、サブクラスタに RACER ノードとして再選できるノードが残されていない場合、サブクラスタ内のすべてのノードにパニックが発生します。
この競争では、GAB メンバーシップから除外された可能性のある各システムの各キーに対して獲得と中止コマンドが実行されます。
獲得と中止コマンドは、有効なキーを持つ登録済みシステムだけに別のシステムのキーを削除することを許可します。したがって、他の削除を試みるシステムが複数あっても、各競争の勝者は 1 つだけになります。獲得と中止コマンドを実行する最初のシステムが勝者となり、他のシステムのキーを削除します。 獲得と中止コマンドを実行する 2 番目のシステムはキーの削除を実行できません。そのシステムは有効なキーを持つ登録済みのシステムではなくなっているためです。
クラスタレベルの属性 PreferredFencingPolicy の値が System、Group、Site のいずれかの場合、競争時に VxFEN Racer ノードはローカルサブクラスタと残りのサブクラスタのすべてのノードの重みを集計します。残りのパーティションの(ノードの重みの)合計のほうが大きい場合、このパーティションの競合者はコーディネーションポイントに対する競合を遅らせます。 これにより、より重要なサブクラスタが効果的に優先され、制御権を獲得します。 クラスタレベルの属性 PreferredFencingPolicy の値が Disabled の場合は、遅延はノード数の合計に基づいて計算されます。
優先フェンシングについてを参照してください。
獲得と中止コマンドから成功が返された場合、そのシステムはコーディネータディスクの制御権を獲得しています。
各システムはすべてのコーディネータディスクに対してこの制御権獲得競争を繰り返します。 コーディネータディスクの過半数から他のシステムの登録キーを削除したシステムが競争の勝者(制御権の獲得者)になります。
制御権を獲得したシステムでは、vxfen モジュールが、このシステムに制御権獲得競争の代表を任せた他のすべてのシステムに、制御権を獲得したことおよびサブクラスタは依然として有効であることを通知します。
制御権を獲得できなかったシステムでは、vxfen モジュールがシステムパニックを引き起こします。このサブクラスタ内の他のシステムはパニックに気付き、コーディネータディスクの制御を失ったことを確認し、同様にパニックを引き起こして再起動します。
再起動時に、システムはクラスタへのシーディングを試みます。
再起動されたシステムが、/etc/gabtab 内に定義された数のクラスタシステムとハートビートを交換できれば、そのシステムは自動的にシーディングされ、引き続きクラスタに参加します。コーディネータディスク上のそのシステムのキーは置き換えられます。この状況が発生するのは、メンバーシップ変更の本来の原因が再起動中に解決した場合のみです。
再起動されたシステムが、/etc/gabtab 内に定義された数のクラスタシステムとハートビートを交換できなければ、そのシステムは自動的にシーディングされず、HAD は開始されません。これはスプリットブレイン状態の可能性があります。管理者の介入が必要です。
クラスタで I/O フェンシングを有効にし、I/O フェンシングにを使用して GAB の自動シーディング機能を設定した場合、GAB は一部のクラスタノードが使用不能であっても自動的にクラスタをシーディング処理します。
メモ:
この時点で手動シーディングを強制すれば、クラスタはシーディングされます。 ただし、コーディネータディスク上にキーを持つシステムと GAB のメンバーシップをフェンシングモジュールが照合するときに不一致が発生します。vxfen はスプリットブレイン状態の可能性を検出し、警告を表示して、起動を停止します。同様に、HAD も開始されません。管理者の介入が必要です。
クラスタの手動シーディングを参照してください。