Cluster Server 7.3.1 管理者ガイド - Linux
- 第 I 部 クラスタ化の概念と用語
- Cluster Server の概要
- Cluster Server について
- クラスタ制御のガイドラインについて
- VCS の物理コンポーネントについて
- VCS の論理コンポーネント
- クラスタトポロジーについて
- VCS 設定の概念
- Cluster Server の概要
- 第 II 部 管理 - VCS の利用方法
- VCS ユーザー権限モデルについて
- コマンドラインによるクラスタの管理
- コマンドラインでの VCS の管理について
- VCS ライセンスのインストールについて
- LLT の管理
- VCS の起動
- VCS エンジンと関連プロセスの停止
- VCS へのログイン
- VCS 設定ファイルの管理について
- コマンドラインによる VCS ユーザーの管理について
- VCS のクエリーについて
- サービスグループの管理について
- リソースの管理について
- リソースタイプの管理について
- クラスタの管理について
- VCS でのアプリケーションとリソースの設定
- UNIX の VCS 付属エージェント
- NFS サービスグループの設定
- RemoteGroup エージェントの設定について
- Samba サービスグループの設定について
- HA ファイアドリルを使ったリソースフェールオーバーのテストについて
- InfoScale Enterprise を AWS で使用した HA および DR の設定
- Azure 環境での HA および DR の設定
- VCS Simulator を使った VCS の動作の予測
- 第 III 部 VCS 通信と操作
- クラスタの通信、メンバーシップ、データ保護について
- クラスタ通信について
- クラスタメンバーシップについて
- メンバーシップアービトレーションについて
- データ保護について
- I/O フェンシングを使う VCS 操作の例
- I/O フェンシングを使わない、クラスタメンバーシップとデータ保護について
- I/O フェンシングを使わない VCS 動作の例
- I/O フェンシングの管理
- vxfentsthdw ユーティリティについて
- vxfentsthdw の -c オプションを使ったコーディネータディスクグループのテスト
- vxfenadm ユーティリティについて
- vxfenclearpre ユーティリティについて
- vxfenswap ユーティリティについて
- コーディネーションポイントサーバーの管理について
- ディスクベースとサーバーベースのフェンシング設定間の移行について
- VCS の動作の制御
- リソース障害時の VCS の動作
- サービスグループレベルでの VCS 動作の制御について
- リソースレベルでの VCS 動作の制御について
- ストレージ接続消失時の VCS 動作
- サービスグループワークロード管理
- ワークロード管理を示した設定例
- サービスグループの依存関係のロール
- クラスタの通信、メンバーシップ、データ保護について
- 第 IV 部 管理 - 高度な操作
- VCS イベント通知
- VCS イベントトリガ
- イベントトリガの使用
- イベントトリガの一覧
- Virtual Business Services
- 第 V 部 Veritas High Availability 設定ウィザード
- 第 VI 部 ディザスタリカバリ用のクラスタ設定
- クラスタの相互接続 - グローバルクラスタの作成
- コマンドラインによるグローバルクラスタの管理
- RDC(Replicated Data Cluster)の設定
- キャンパスクラスタの設定
- 第 VII 部 トラブルシューティングおよび処理速度
- 処理速度に関する注意事項
- クラスタコンポーネントの処理速度に対する影響
- クラスタ操作の処理速度に対する影響
- システムパニックのときの VCS の処理速度に関する注意事項
- スケジュールクラスと優先度の設定について
- VCS エージェントの統計機能
- VCS のチューニングパラメータについて
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- サービスグループに関するトラブルシューティング
- リソースに関するトラブルシューティング
- トラブルシューティングのサイト
- I/O フェンシングのトラブルシューティング
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- CP サーバーのトラブルシューティング
- VCS クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- ライセンスに関するトラブルシューティング
- ライセンスのエラーメッセージ
- セキュア設定のトラブルシューティング
- ウィザードベースの設定に関する問題のトラブルシューティング
- [Veritas High Availability]ビューの問題のトラブルシューティング
- 処理速度に関する注意事項
- 第 VIII 部 付録
VCS キャンパスクラスタの動作
このトピックでは、VCS と VxVM の組み合わせにより、キャンパスクラスタ環境で高い可用性を提供する方法について説明します。
キャンパスクラスタの設定では、VxVM は複数のサイト間でボリュームを自動的にミラー化します。 読み取り処理速度を向上させるために、VxVM はアプリケーションが動作しているローカルサイトにある複数のプレックスから読み取りを行います。 VxVM は両方のサイトにあるプレックスに対して書き込みを行います。
どちらかのサイトでストレージエラーが発生した場合は、VxVM はエラーサイトに存在するすべてのディスクをディスクグループから切断し、データ一貫性を維持します。 エラーが発生したストレージがオンラインに復帰した時点で、VxVM は自動的にそのサイトをディスクグループに接続し、プレックスを修復します。
詳しくは、『 Storage Foundation Cluster File System High Availability 管理者ガイド』を参照してください。
サービスグループまたはシステムの障害が発生した時点で、クラスタ属性 SiteAware とサービスグループ属性 AutoFailOver に対して設定した値に基づいて、VCS はサービスグループをフェールオーバーします。
クラスタ属性を参照してください。
キャンパスクラスタを設定する場合、サイトを定義して、定義したサイトにシステムを追加する必要があります。 システムは 1 つのサイトにのみ属すことができます。 サイト定義は VCS 全体で同じです。サイト Veritas Operations Manager、および VxVM を定義できます。 同じサイト内部でフェールオーバーするには、接続したアプリケーションを制限するようにサイトの依存関係を定義します。
サイトは次を使って定義できます。
Veritas InfoScale Operations Manager
サイトの設定について詳しくは、『Veritas InfoScale Operations Manager ユーザーズガイド』の最新版を参照してください。
AutoFailOver 属性値に基づいた、VCS によるフェールオーバー動作は次のようになります。
0 |
VCS はサービスグループをフェールオーバーしません。 |
1 |
VCS はサービスグループを別の適切なノードにフェールオーバーします。 デフォルトでは、AutoFailOver 属性の値は 1 に設定されています。 |
2 |
同じサイト内に他の適切なノードが存在する場合、VCS はサービスグループをフェールオーバーします。 それ以外の場合、VCSは管理者が対処し、他のサイト内に存在する適切なノードに対してサービスグループのフェールオーバーを実行するまで待機します。 この設定を使用するには、HA/DR ライセンスを有効にしておく必要があります。 AutoFailOver 属性の値を 2 に設定することをお勧めします。 |
VCS の main.cf 内では、これらのサービスグループの属性に関するサンプルの定義は次のようになります。
cluster VCS_CLUS ( PreferredFencingPolicy = Site SiteAware = 1 ) site MTV ( SystemList = { sys1, sys2 } ) site SFO ( Preference = 2 SystemList = { sys3, sys4 } )
hybrid_group を AutoFailover = 1 に、failover_group を AutoFailover = 2 にした設定例は次のようになります。
hybrid_group ( Parallel = 2 SystemList = { sys1 = 0, sys2 = 1, sys3 = 2, sys4 = 3 } ) failover_group ( AutoFailover = 2 SystemList = { sys1 = 0, sys2 = 1, sys3 = 2, sys4 = 3 } )
表: キャンパスクラスタでのエラーのシナリオ に、考えられるいくつかのエラーシナリオと、VCS キャンパスクラスタがそれらのエラーからの修復を実行する方法を示します。
表: キャンパスクラスタでのエラーのシナリオ
エラー |
説明とリカバリ |
---|---|
ノードエラー |
AutoFailOver 属性の値が 0 に設定されている場合、どちらのノードエラーが発生した状況でも、VCS は管理者が対処してフェールオーバーを実行することを必要とします。 |
アプリケーションエラー |
動作は、ノードエラーの場合と同等です。 |
ストレージエラー - 一方のサイトで 1 台以上のディスクのエラーが発生 |
ストレージでエラーが発生しても VCS はサービスグループをフェールオーバーしません。 ディスクのエラーが発生したサイトで、ディスクグループに属するボリュームのいずれかが有効なプレックスを 1 つも所有していない場合、VxVM はそのサイトをディスクグループから切断します。 次の状況では、VxVM はサイトをディスクグループから切断しません。
エラーが発生したディスクのうち数台のみがオンラインに復帰し、vxrelocd デーモンが動作している場合、VxVM はエラーが発生した残りのディスクを、利用可能な任意のディスクに再配置します。 その後、VxVM は自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。 エラーが発生したディスクすべてがオンラインに復帰した場合、VxVM は自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。 |
ストレージエラー - 両方のサイトですべてのディスクのエラーが発生 |
VCS は、DiskGroup エージェントの PanicSystemOnDGLoss 属性の値に基づいて動作します。 詳しくは、『Cluster Server 付属エージェントリファレンスガイド』を参照してください。 |
サイトエラー |
一方のサイトですべてのノードとストレージのエラーが発生しました。 AutoFailOver 属性値に基づいて、VCS はサービスグループを次のようにフェールオーバーします。
エラーが発生したサイトにあるストレージはアクセス不可能なので、VCS はアプリケーションサービスグループにディスクグループをインポートし、エラーが発生したサイトに存在しているすべてのデバイスに対して NODEVICE というマークを付けます。 エラーが発生したサイトに存在しているストレージがオンラインに復帰した場合、VxVM は自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。 |
ネットワークエラー(LLT 相互接続のエラー) |
各サイトに存在しているノードが、もう一方のサイトに存在しているノードに対する接続を失います。 ノード間のすべてのプライベート相互接続でエラーが発生した場合、スプリットブレインのシナリオが生じてデータが破損する可能性があります。 スプリットブレインを発生させる可能性のある他の原因と、I/O フェンシングが共有データの破損を防止する方法を参照してください。
キャンパスクラスタ内でのデータの破損を防止するために I/O フェンシングを設定することをお勧めします。 クラスタ属性 PreferredFencingPolicy の値を Siteに設定すると、コーディネーションポイントの獲得処理の間、フェンシングドライバは、優先度が高いサイトが存在するノードを優先します。VCS はサイトレベル属性の Preference を使ってノードの重みを判断します。
|
ネットワークエラー(LLT とストレージ相互接続のエラー) |
各サイトに存在しているノードが、ストレージおよびもう一方のサイトに存在しているノードに対する接続を失います。 スプリットブレインとシリアルスプリットブレインの条件を防止するために I/O フェンシングを設定することをお勧めします。
|