Cluster Server 7.3.1 管理者ガイド - Linux
- 第 I 部 クラスタ化の概念と用語
- Cluster Server の概要
- Cluster Server について
- クラスタ制御のガイドラインについて
- VCS の物理コンポーネントについて
- VCS の論理コンポーネント
- クラスタトポロジーについて
- VCS 設定の概念
- Cluster Server の概要
- 第 II 部 管理 - VCS の利用方法
- VCS ユーザー権限モデルについて
- コマンドラインによるクラスタの管理
- コマンドラインでの VCS の管理について
- VCS ライセンスのインストールについて
- LLT の管理
- VCS の起動
- VCS エンジンと関連プロセスの停止
- VCS へのログイン
- VCS 設定ファイルの管理について
- コマンドラインによる VCS ユーザーの管理について
- VCS のクエリーについて
- サービスグループの管理について
- リソースの管理について
- リソースタイプの管理について
- クラスタの管理について
- VCS でのアプリケーションとリソースの設定
- UNIX の VCS 付属エージェント
- NFS サービスグループの設定
- RemoteGroup エージェントの設定について
- Samba サービスグループの設定について
- HA ファイアドリルを使ったリソースフェールオーバーのテストについて
- InfoScale Enterprise を AWS で使用した HA および DR の設定
- Azure 環境での HA および DR の設定
- VCS Simulator を使った VCS の動作の予測
- 第 III 部 VCS 通信と操作
- クラスタの通信、メンバーシップ、データ保護について
- クラスタ通信について
- クラスタメンバーシップについて
- メンバーシップアービトレーションについて
- データ保護について
- I/O フェンシングを使う VCS 操作の例
- I/O フェンシングを使わない、クラスタメンバーシップとデータ保護について
- I/O フェンシングを使わない VCS 動作の例
- I/O フェンシングの管理
- vxfentsthdw ユーティリティについて
- vxfentsthdw の -c オプションを使ったコーディネータディスクグループのテスト
- vxfenadm ユーティリティについて
- vxfenclearpre ユーティリティについて
- vxfenswap ユーティリティについて
- コーディネーションポイントサーバーの管理について
- ディスクベースとサーバーベースのフェンシング設定間の移行について
- VCS の動作の制御
- リソース障害時の VCS の動作
- サービスグループレベルでの VCS 動作の制御について
- リソースレベルでの VCS 動作の制御について
- ストレージ接続消失時の VCS 動作
- サービスグループワークロード管理
- ワークロード管理を示した設定例
- サービスグループの依存関係のロール
- クラスタの通信、メンバーシップ、データ保護について
- 第 IV 部 管理 - 高度な操作
- VCS イベント通知
- VCS イベントトリガ
- イベントトリガの使用
- イベントトリガの一覧
- Virtual Business Services
- 第 V 部 Veritas High Availability 設定ウィザード
- 第 VI 部 ディザスタリカバリ用のクラスタ設定
- クラスタの相互接続 - グローバルクラスタの作成
- コマンドラインによるグローバルクラスタの管理
- RDC(Replicated Data Cluster)の設定
- キャンパスクラスタの設定
- 第 VII 部 トラブルシューティングおよび処理速度
- 処理速度に関する注意事項
- クラスタコンポーネントの処理速度に対する影響
- クラスタ操作の処理速度に対する影響
- システムパニックのときの VCS の処理速度に関する注意事項
- スケジュールクラスと優先度の設定について
- VCS エージェントの統計機能
- VCS のチューニングパラメータについて
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- トラブルシューティングのサイト
- I/O フェンシングのトラブルシューティング
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- VCS クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- セキュア設定のトラブルシューティング
- ウィザードベースの設定に関する問題のトラブルシューティング
- [Veritas High Availability]ビューの問題のトラブルシューティング
- 処理速度に関する注意事項
- 第 VIII 部 付録
例: クラスタ相互接続に障害が発生した、4 つのシステムを持つクラスタ
この例では、クラスタ相互接続に障害が発生し、4 つのシステムで構成される 1 つのクラスタが 2 つのシステムで構成されるクラスタに分割されます。 クラスタでは、1 つのサブクラスタのみが残るようにメンバーシップアービトレーションが実行されます。
ハートビートの消失によって、システム 0 とシステム 1 の両方はシステム 2 とシステム 3 が停止していると考えます。システム 2 とシステム 3 の両方はシステム 0 とシステム 1 が停止していると考えます。
I/O フェンシング操作は次のように進行します。
4 つの各システムの LLT は、通信相手(ピア)とのタイムアウト値に設定された期間、設定済みのどの LLT インターフェースにおいても、相互接続エラーの相手側のシステムからハートビートメッセージを受信しなくなります。
各システムの LLT は、メンバーシップの変更を認識したことを GAB に伝えます。 具体的には次のとおりです。
システム 0 の LLT は、システム 2 とシステム 3 を認識できなくなったことを GAB に伝えます。
システム 1 の LLT は、システム 2 とシステム 3 を認識できなくなったことを GAB に伝えます。
システム 2 の LLT は、システム 0 とシステム 1 を認識できなくなったことを GAB に伝えます。
システム 3 の LLT は、システム 0 とシステム 1 を認識できなくなったことを GAB に伝えます。
LLT が GAB にハートビートの消失を通知した後、残っているシステムは「GAB 安定タイムアウト」(5 秒)を実行します。 この例の詳細は次のとおりです。
システム 0 とシステム 1 は、その両方がシステム 2 とシステム 3 を認識できないことに同意します。
システム 2 とシステム 3 は、その両方がシステム 0 とシステム 1 を認識できないことに同意します。
GAB はシステムを DOWN としてマーク付けし、システムをクラスタメンバーシップから除外します。この例の詳細は次のとおりです。
システム 0 とシステム 1 の GAB は、システム 2 とシステム 3 を DOWN としてマーク付けし、それらをクラスタメンバーシップから除外します。
システム 2 とシステム 3 の GAB は、システム 0 とシステム 1 を DOWN としてマーク付けし、それらをクラスタメンバーシップから除外します。
4 つの各システムの GAB は、メンバーシップアービトレーションを行うためにメンバーシップの変更を vxfen ドライバに伝えます。各サブクラスタはコーディネータディスクの制御権を獲得しようとします。この例の詳細は次のとおりです。
システム 0 は LLT ID が低いため、自身とシステム 1 を代表して制御権の獲得競争に参加します。
システム 2 は LLT ID が低いため、自身とシステム 3 を代表して制御権の獲得競争に参加します。
4 つの各システムの GAB はメンバーシップの変更を HAD にも伝えます。HAD はフェンシングモジュールからのメンバーシップアービトレーションの結果を待ってから、以降の処理を実行します。
System0 がコーディネーションポイントの過半数に到達できない場合、VxFEN ドライバは システム 0 から 新たにシステム 1 を RACER として再選し、System1 はコーディネーションポイントへの競争を開始します。
システム 0 がコーディネータディスクの制御権を獲得し、システム 2 とシステム 3 の登録キーをディスクから削除したと仮定します。 結果は次のとおりです。
システム 0 がコーディネータディスクの制御権を獲得します。 システム 0 のフェンシングモジュールは、WON_RACE を現在のクラスタ内の他のすべてのフェンシングモジュール(この場合はシステム 0 とシステム 1)に伝達します。 WON_RACE を受け取ると、各システムのフェンシングモジュールは成功を HAD に伝達します。 システム 0 とシステム 1 は有効な現在のクラスタメンバーとして残ります。
System1 に WON_RACE を送信する前に System0 が停止した場合、VxFEN は System0 から新たに System1 を RACER として再選し、System1 はコーディネーションポイントへの競争を開始します。
コーディネーションポイントの過半数を獲得した System1 は有効なままとなり、System1 のクラスタとフェンシングモジュールの現在のメンバーは成功を HAD に伝えます。
System2 はコーディネータディスクの制御権の獲得に失敗し、System 2 のフェンシングモジュールは LOST_RACE メッセージを送信します。システム 2 のフェシングモジュールはカーネルパニックを呼び出し、システムは再起動します。
システム 3 はシステム 2 のカーネルパニックから別のメンバーシップの変更を認識します。システム 2 は、このサブクラスタでコーディネータディスクの制御権の獲得競争に参加したシステムであったため、システム 3 もパニックを起こします。
HAD は、メンバーシップの変更に基づいて、関連付けられたすべてのポリシーまたはリカバリ処理を実行します。
システム 2 とシステム 3 は、共有ストレージにアクセスできなくなります(システム 0 またはシステム 1 によって現在テイクオーバーされているサービスグループに共有ストレージが含まれていた場合)。
システム 2 とシステム 3 がクラスタに再参加するには、管理者は次の処理を実行する必要があります。
システム 2 とシステム 3 をシャットダウンします。
クラスタ相互接続リンクを解決します。
システム 2 とシステム 3 を再起動します。