Cluster Server 7.3.1 管理者ガイド - Linux
- 第 I 部 クラスタ化の概念と用語
- Cluster Server の概要
- Cluster Server について
- クラスタ制御のガイドラインについて
- VCS の物理コンポーネントについて
- VCS の論理コンポーネント
- クラスタトポロジーについて
- VCS 設定の概念
- Cluster Server の概要
- 第 II 部 管理 - VCS の利用方法
- VCS ユーザー権限モデルについて
- コマンドラインによるクラスタの管理
- コマンドラインでの VCS の管理について
- VCS ライセンスのインストールについて
- LLT の管理
- VCS の起動
- VCS エンジンと関連プロセスの停止
- VCS へのログイン
- VCS 設定ファイルの管理について
- コマンドラインによる VCS ユーザーの管理について
- VCS のクエリーについて
- サービスグループの管理について
- リソースの管理について
- リソースタイプの管理について
- クラスタの管理について
- VCS でのアプリケーションとリソースの設定
- UNIX の VCS 付属エージェント
- NFS サービスグループの設定
- RemoteGroup エージェントの設定について
- Samba サービスグループの設定について
- HA ファイアドリルを使ったリソースフェールオーバーのテストについて
- InfoScale Enterprise を AWS で使用した HA および DR の設定
- Azure 環境での HA および DR の設定
- VCS Simulator を使った VCS の動作の予測
- 第 III 部 VCS 通信と操作
- クラスタの通信、メンバーシップ、データ保護について
- クラスタ通信について
- クラスタメンバーシップについて
- メンバーシップアービトレーションについて
- データ保護について
- I/O フェンシングを使う VCS 操作の例
- I/O フェンシングを使わない、クラスタメンバーシップとデータ保護について
- I/O フェンシングを使わない VCS 動作の例
- I/O フェンシングの管理
- vxfentsthdw ユーティリティについて
- vxfentsthdw の -c オプションを使ったコーディネータディスクグループのテスト
- vxfenadm ユーティリティについて
- vxfenclearpre ユーティリティについて
- vxfenswap ユーティリティについて
- コーディネーションポイントサーバーの管理について
- ディスクベースとサーバーベースのフェンシング設定間の移行について
- VCS の動作の制御
- リソース障害時の VCS の動作
- サービスグループレベルでの VCS 動作の制御について
- リソースレベルでの VCS 動作の制御について
- ストレージ接続消失時の VCS 動作
- サービスグループワークロード管理
- ワークロード管理を示した設定例
- サービスグループの依存関係のロール
- クラスタの通信、メンバーシップ、データ保護について
- 第 IV 部 管理 - 高度な操作
- VCS イベント通知
- VCS イベントトリガ
- イベントトリガの使用
- イベントトリガの一覧
- Virtual Business Services
- 第 V 部 Veritas High Availability 設定ウィザード
- 第 VI 部 ディザスタリカバリ用のクラスタ設定
- クラスタの相互接続 - グローバルクラスタの作成
- コマンドラインによるグローバルクラスタの管理
- RDC(Replicated Data Cluster)の設定
- キャンパスクラスタの設定
- 第 VII 部 トラブルシューティングおよび処理速度
- 処理速度に関する注意事項
- クラスタコンポーネントの処理速度に対する影響
- クラスタ操作の処理速度に対する影響
- システムパニックのときの VCS の処理速度に関する注意事項
- スケジュールクラスと優先度の設定について
- VCS エージェントの統計機能
- VCS のチューニングパラメータについて
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- トラブルシューティングのサイト
- I/O フェンシングのトラブルシューティング
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- VCS クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- セキュア設定のトラブルシューティング
- ウィザードベースの設定に関する問題のトラブルシューティング
- [Veritas High Availability]ビューの問題のトラブルシューティング
- 処理速度に関する注意事項
- 第 VIII 部 付録
クラスタ通信におけるベストプラクティスの概略
ここでは、適切なクラスタメンバーシップとデータ保護を最適にサポートするために推奨されるクラスタ通信のベストプラクティスを説明します。
クラスタの自動シーディングを行う前にシステムのサブセットだけでなくすべてのシステムを GAB メンバーシップに参加するように要求して、クラスタの適切なシーディングを行います。
すべてのシステムが含まれていない場合は、管理者が手動で介入し、スプリットブレイン状態の可能性を排除してからクラスタの手動シーディングを行う必要があります。
各クラスタシステム間に複数の独立した通信ネットワークリンクを設定します。
ネットワークに、共有のスイッチやイーサネットカードなどの単一点障害を設けないでください。
I/O フェンシングに関係なく、クラスタ内に低優先度の LLT リンクを設定することが推奨されます。 I/O フェンシングを使わないクラスタでは、これは非常に重要です。
メモ:
クラスタで、Cluster File System(CFS)または Oracle Real Application Cluster(RAC)と共にフェンシングを使用する場合はこのかぎりではありません。
理由は、通常、低優先度リンクでは共有のパブリックネットワークリンクが使用されるためです。 メインのクラスタ相互接続に障害が発生し、残ったリンクが低優先度リンクだけの場合、大量のデータが低優先度リンクに移動します。 これにより、パブリックネットワークのパフォーマンスが許容できないレベルにまで低下する可能性があります。 低優先度リンクを設定していない場合、このケースではメンバーシップアービトレーションが実行され、いくつかのシステムが停止する場合がありますが、残りのシステムはパブリックネットワークに影響を与えることなく実行を続けます。
I/O フェンシングを設定しないで、CFS または RAC を使用するクラスタを作成することは推奨されません。
コンソールアボートシーケンスを無効にします
ほとんどの UNIX システムでは、コンソールアボートシーケンスが提供されます。管理者はこれを使ってプロセッサを停止および続行できます。 プロセッサを停止した後に操作を続行するとデータが破損する場合があります。したがって、VCS はこれをサポートしません。
アボートシーケンスを使ってシステムを停止すると、システムはハートビートの作成を停止します。 そのシステムはクラスタ内の他のシステムから障害が発生したものとみなされ、そのサービスはテイクオーバーされます。 その後、別のコンソールシーケンスを使ってシステムが有効にされた場合、そのシステムのアプリケーションが別のシステムで再起動されていても、共有ストレージへの書き込みは引き続き以前と同じように実行されます。
Veritas Technologies は、コンソールアボートシーケンスを無効にするか、go コマンドを強制するエイリアスを作成して、I/O フェンシングが実行されていないシステムで再起動を行うことをお勧めします。
Veritas Technologies では、I/O フェンシングを設定するために少なくとも 3 つのコーディネーションポイントを設定することをお勧めします。コーディネーションディスク、CP サーバー、またはその 2 つの組み合わせを使うことができます。
可能なかぎり最小の LUN をコーディネータディスクとして使用するように選択します。 どのような設定でも、3 つを超えるコーディネータディスクは必要ありません。
ネットワーク分割後にクラスタ相互接続を再接続するには、分割されたクラスタの一方の側を必ずシャットダウンします。
通常この状況はテスト中に発生します。管理者は、クラスタ相互接続を切断してネットワーク分割を作成する場合があります。 相互接続ケーブルを再接続するタイミングによっては、予期しない動作が発生する可能性があります。