Cluster Server 7.4.3 管理者ガイド - Linux
- 第 I 部 クラスタ化の概念と用語
- Cluster Server の概要
- Cluster Server について
- クラスタ制御のガイドラインについて
- VCS の物理コンポーネントについて
- VCS の論理コンポーネント
- クラスタトポロジーについて
- VCS 設定の概念
- Cluster Server の概要
- 第 II 部 管理 - VCS の利用方法
- VCS ユーザー権限モデルについて
- コマンドラインによるクラスタの管理
- コマンドラインでの VCS の管理について
- VCS ライセンスのインストールについて
- LLT の管理
- VCS の起動
- VCS エンジンと関連プロセスの停止
- VCS へのログイン
- VCS 設定ファイルの管理について
- コマンドラインによる VCS ユーザーの管理について
- VCS のクエリーについて
- サービスグループの管理について
- リソースの管理について
- リソースタイプの管理について
- クラスタの管理について
- VCS でのアプリケーションとリソースの設定
- VCS Simulator を使った VCS の動作の予測
- 第 III 部 VCS 通信と操作
- クラスタの通信、メンバーシップ、データ保護について
- クラスタ通信について
- クラスタメンバーシップについて
- メンバーシップアービトレーションについて
- データ保護について
- I/O フェンシングを使う VCS 操作の例
- I/O フェンシングを使わない、クラスタメンバーシップとデータ保護について
- I/O フェンシングを使わない VCS 動作の例
- I/O フェンシングの管理
- vxfentsthdw ユーティリティについて
- vxfentsthdw の -c オプションを使ったコーディネータディスクグループのテスト
- vxfenadm ユーティリティについて
- vxfenclearpre ユーティリティについて
- vxfenswap ユーティリティについて
- コーディネーションポイントサーバーの管理について
- IPv6 またはデュアルスタックをサポートする CP サーバーの設定について
- ディスクベースとサーバーベースのフェンシング設定間の移行について
- VCS の動作の制御
- リソース障害時の VCS の動作
- サービスグループレベルでの VCS 動作の制御について
- リソースレベルでの VCS 動作の制御について
- ストレージ接続消失時の VCS 動作
- サービスグループワークロード管理
- ワークロード管理を示した設定例
- サービスグループの依存関係のロール
- クラスタの通信、メンバーシップ、データ保護について
- 第 IV 部 管理 - 高度な操作
- VCS イベント通知
- VCS イベントトリガ
- イベントトリガのi使用
- イベントトリガの一覧
- Virtual Business Service
- 第 V 部 Veritas High Availability 設定ウィザード
- 第 VI 部 ディザスタリカバリ用のクラスタ設定
- クラスタの相互接続 - グローバルクラスタの作成
- コマンドラインによるグローバルクラスタの管理
- RDC の設定
- キャンパスクラスタの設定
- 第 VII 部 トラブルシューティングおよびパフォーマンス
- VCS パフォーマンスに関する注意事項
- クラスタコンポーネントの処理速度に対する影響
- クラスタ操作の処理速度に対する影響
- システムパニックのときの VCS の処理速度に関する注意事項
- スケジュールクラスと優先度の設定について
- VCS エージェントの統計機能
- VCS のチューニングパラメータについて
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- サイトのトラブルシューティング
- I/O フェンシングのトラブルシューティング
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- VCS クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- セキュア設定のトラブルシューティング
- ウィザードベースの設定に関する問題のトラブルシューティング
- [Veritas High Availability]ビューの問題のトラブルシューティング
- VCS パフォーマンスに関する注意事項
- 第 VIII 部 付録
リソースで障害が発生したときの VCS の処理速度に関する注意事項
リソースの障害または失敗の検出にかかる時間は、リソースタイプの MonitorInterval 属性によって異なります。リソースに障害が発生すると、次の monitor がこれを検出します。 ToleranceLimit 属性が 0 以外に設定されていると、monitor が一度だけ障害を検出しても、エージェントはこのリソースを faulted として宣言できません。 monitor 機能が、ToleranceLimit で設定された回数よりも多く offline を返した場合に初めて、エージェントがリソースを faulted と宣言します。ただし、リソースが ConfInterval 属性で指定された時間オンラインを続けた場合、それより前に返された offline の回数は ToleranceLimit にカウントされません。
エージェントは、リソースに障害が発生したことを確認すると、clean 機能(実装されている場合)を呼び出し、リソースが完全にオフラインであることを確認します。clean の次に実行される monitor によって、オフラインが確認されます。エージェントは、RestartLimit 属性に定義された数値に従ってリソースの再起動を試みます(この属性値がゼロでない場合)。それでもリソースの起動に失敗した場合は、リソースに障害があることを HAD に通知します。ただし、リソースが ConfInterval で指定された時間オンラインを続けた場合、それより前に行われた再起動の試行回数は RestartLimit にカウントされません。
ほとんどの場合、ToleranceLimit は 0 に設定されています。リソース障害の検出にかかる時間は、エージェントの monitor が障害を検出するまでにかかる時間と、clean 機能が実装されている場合はリソースがクリーンアップされるまでの時間を足したものになります。したがって、障害の検出にかかる時間は、MonitorInterval、monitor 機能と(実装されている場合)clean 機能の効率および(設定されている場合)ToleranceLimit によって異なります。
リソースがハングして障害となった場合、monitor もハングする場合があります。たとえば、データベースサーバーがハングしたときに、monitor がクエリーを実行しようとすると、monitor もハングします。 monitor 機能がハングすると、エージェントは最終的に、機能を実行しているスレッドを強制終了します。 デフォルトでは、エージェントは、60 秒後に monitor 機能をタイムアウトにします。この設定は、MonitorTimeout 属性を変更して調整することができます。 エージェントは、MonitorInterval に指定された時間が経過すると、monitor を再試行します。 monitor 機能が、FaultOnMonitorTimeouts 属性に指定された回数だけ連続してタイムアウトになると、エージェントはそのリソースを faulted として処理します。エージェントは、clean エントリポイントが実装されている場合にこれを呼び出します。FaultOnMonitorTimeouts のデフォルト値は 4 ですが、リソースタイプの属性値を変更することで調整することができます。このパラメータに大きい値を指定すると、リソースがハングした場合に障害の検出が遅れます。 リソースのハングに伴って monitor 機能がハングした場合、この障害を検出するまでの時間は、MonitorTimeout、FaultOnMonitorTimeouts および monitor と clean(実装されている場合)の効率によって異なります。