<book_title> を検索 ...

Cluster Server 7.3.1 管理者ガイド - Linux

Last Published: 2018-06-04

Product(s): InfoScale & Storage Foundation (7.3.1)

Platform: Linux

VCS キャンパスクラスタの動作

このトピックでは、VCS と VxVM の組み合わせにより、キャンパスクラスタ環境で高い可用性を提供する方法について説明します。

キャンパスクラスタの設定では、VxVM は複数のサイト間でボリュームを自動的にミラー化します。読み取り処理速度を向上させるために、VxVM はアプリケーションが動作しているローカルサイトにある複数のプレックスから読み取りを行います。 VxVM は両方のサイトにあるプレックスに対して書き込みを行います。

どちらかのサイトでストレージエラーが発生した場合は、VxVM はエラーサイトに存在するすべてのディスクをディスクグループから切断し、データ一貫性を維持します。エラーが発生したストレージがオンラインに復帰した時点で、VxVM は自動的にそのサイトをディスクグループに接続し、プレックスを修復します。

詳しくは、『 Storage Foundation Cluster File System High Availability 管理者ガイド』を参照してください。

サービスグループまたはシステムの障害が発生した時点で、クラスタ属性 SiteAware とサービスグループ属性 AutoFailOver に対して設定した値に基づいて、VCS はサービスグループをフェールオーバーします。

クラスタ属性を参照してください。

キャンパスクラスタを設定する場合、サイトを定義して、定義したサイトにシステムを追加する必要があります。システムは 1 つのサイトにのみ属すことができます。サイト定義は VCS 全体で同じです。サイト Veritas Operations Manager、および VxVM を定義できます。同じサイト内部でフェールオーバーするには、接続したアプリケーションを制限するようにサイトの依存関係を定義します。

サイトは次を使って定義できます。

Veritas InfoScale Operations Manager
サイトの設定について詳しくは、『Veritas InfoScale Operations Manager ユーザーズガイド』の最新版を参照してください。

AutoFailOver 属性値に基づいた、VCS によるフェールオーバー動作は次のようになります。

VCS はサービスグループをフェールオーバーしません。

VCS はサービスグループを別の適切なノードにフェールオーバーします。

デフォルトでは、AutoFailOver 属性の値は 1 に設定されています。

同じサイト内に他の適切なノードが存在する場合、VCS はサービスグループをフェールオーバーします。それ以外の場合、VCSは管理者が対処し、他のサイト内に存在する適切なノードに対してサービスグループのフェールオーバーを実行するまで待機します。

この設定を使用するには、HA/DR ライセンスを有効にしておく必要があります。

AutoFailOver 属性の値を 2 に設定することをお勧めします。

VCS の main.cf 内では、これらのサービスグループの属性に関するサンプルの定義は次のようになります。

cluster VCS_CLUS (
        PreferredFencingPolicy = Site
        SiteAware = 1
        )
site MTV (
        SystemList = { sys1, sys2 }
        )
site SFO (
        Preference = 2
        SystemList = { sys3, sys4 }
        )

hybrid_group を AutoFailover = 1 に、failover_group を AutoFailover = 2 にした設定例は次のようになります。

hybrid_group (
    Parallel = 2
    SystemList = { sys1 = 0, sys2 = 1, sys3 = 2, sys4 = 3 }
)

failover_group (
    AutoFailover = 2
    SystemList = { sys1 = 0, sys2 = 1, sys3 = 2, sys4 = 3 }
)

表: キャンパスクラスタでのエラーのシナリオに、考えられるいくつかのエラーシナリオと、VCS キャンパスクラスタがそれらのエラーからの修復を実行する方法を示します。

表: キャンパスクラスタでのエラーのシナリオ

エラー	説明とリカバリ
ノードエラー	一方のサイトで 1 台のノードエラーが発生しました。 AutoFailOver 属性の値が 1 に設定されている場合、VCS は、クラスタに対して定義された同じサイト内、または SystemZones 属性の中で定義されているか、Veritas InfoScale Operations Manager で定義された同じサイト内にある別のシステムにサービスグループをフェールオーバーします。一方のサイトですべてのノードのエラーが発生しました。 AutoFailOver 属性の値が 0 に設定されている場合、どちらのノードエラーが発生した状況でも、VCS は管理者が対処してフェールオーバーを実行することを必要とします。
アプリケーションエラー	動作は、ノードエラーの場合と同等です。
ストレージエラー - 一方のサイトで 1 台以上のディスクのエラーが発生	ストレージでエラーが発生しても VCS はサービスグループをフェールオーバーしません。ディスクのエラーが発生したサイトで、ディスクグループに属するボリュームのいずれかが有効なプレックスを 1 つも所有していない場合、VxVM はそのサイトをディスクグループから切断します。次の状況では、VxVM はサイトをディスクグループから切断しません。エラーが発生したディスク上でプレックスがまったく設定されていない。エラーが発生したディスク上でいくつかのプレックスが設定済みであり、各サイトで少なくとも 1 つのボリュームに対応するプレックスが存続している。エラーが発生したディスクのうち数台のみがオンラインに復帰し、vxrelocd デーモンが動作している場合、VxVM はエラーが発生した残りのディスクを、利用可能な任意のディスクに再配置します。その後、VxVM は自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。エラーが発生したディスクすべてがオンラインに復帰した場合、VxVM は自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。
ストレージエラー - 両方のサイトですべてのディスクのエラーが発生	VCS は、DiskGroup エージェントの PanicSystemOnDGLoss 属性の値に基づいて動作します。詳しくは、『Cluster Server 付属エージェントリファレンスガイド』を参照してください。
サイトエラー	一方のサイトですべてのノードとストレージのエラーが発生しました。 AutoFailOver 属性値に基づいて、VCS はサービスグループを次のようにフェールオーバーします。値が 1 に設定されている場合、VCS はサービスグループをシステムにフェールオーバーします。値が 2 に設定されている場合、VCS は管理者が対処して、他のサイトにあるシステムにサービスグループのフェールオーバーを実行することを必要とします。エラーが発生したサイトにあるストレージはアクセス不可能なので、VCS はアプリケーションサービスグループにディスクグループをインポートし、エラーが発生したサイトに存在しているすべてのデバイスに対して NODEVICE というマークを付けます。エラーが発生したサイトに存在しているストレージがオンラインに復帰した場合、VxVM は自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。
ネットワークエラー（LLT 相互接続のエラー）	各サイトに存在しているノードが、もう一方のサイトに存在しているノードに対する接続を失います。ノード間のすべてのプライベート相互接続でエラーが発生した場合、スプリットブレインのシナリオが生じてデータが破損する可能性があります。スプリットブレインを発生させる可能性のある他の原因と、I/O フェンシングが共有データの破損を防止する方法を参照してください。キャンパスクラスタ内でのデータの破損を防止するために I/O フェンシングを設定することをお勧めします。クラスタ属性 PreferredFencingPolicy の値を Siteに設定すると、コーディネーションポイントの獲得処理の間、フェンシングドライバは、優先度が高いサイトが存在するノードを優先します。VCS はサイトレベル属性の Preference を使ってノードの重みを判断します。
ネットワークエラー（LLT とストレージ相互接続のエラー）	各サイトに存在しているノードが、ストレージおよびもう一方のサイトに存在しているノードに対する接続を失います。スプリットブレインとシリアルスプリットブレインの条件を防止するために I/O フェンシングを設定することをお勧めします。 I/O フェンシングが設定されている場合の動作: 制御権を獲得できなかったサイトでは、システムパニックが発生します。ネットワーク接続をユーザーが修復した場合、VxVM はエラーが発生していたサイトに存在しているストレージを検出し、自動的にサイトをディスクグループに再接続し、プレックスを再同期化してボリュームを修復します。 I/O フェンシングが設定されていない場合の動作: そのようなエラーが発生している間、アプリケーションサービスグループがサイト A でオンライン状態だった場合、そのアプリケーションサービスグループは同じサイト上でオンライン状態にとどまります。ストレージはアクセス不可能なので、VxVM はエラーが発生していたサイトに存在しているディスクをディスクグループから切断します。サイト B ではアプリケーションサービスグループはオフライン状態なので、VCS はこのアプリケーションサービスグループをオンライン化し、ディスクグループをインポートし、サイト A に存在しているすべてのデバイスに対して NODEVICE というマークを付けます。したがって、アプリケーションサービスグループは両方のサイトでオンライン状態になり、各サイトはローカルストレージを使用します。この結果、互いに整合性のない複数のデータコピーが発生し、サイト単位のスプリットブレインにつながります。ユーザーがこれらのサイト間でネットワーク接続を復元した段階で、シリアルスプリットブレインが存在する可能性があります。シリアルスプリットブレイン条件からの復元について詳しくは、『 Storage Foundation 管理者ガイド』を参照してください。

詳細情報

サービスグループ属性

データ保護について

キャンパスクラスタでの I/O フェンシングについて