Veritas NetBackup™ for Hadoop 管理者ガイド

Last Published:
Product(s): NetBackup & Alta Data Protection (9.1)
  1. 概要
    1.  
      NetBackup を使用した Hadoop データの保護
    2.  
      Hadoop データのバックアップ
    3.  
      Hadoop データのリストア
    4.  
      NetBackup for Hadoop の用語
    5.  
      制限事項
  2. NetBackup 用 Hadoop プラグインの前提条件の検証
    1.  
      Hadoop プラグインの配備について
    2. Hadoop プラグインの前提条件
      1.  
        オペレーティングシステムとプラットフォームの互換性
      2.  
        NetBackup サーバーおよびクライアントの要件
      3.  
        NetBackup の Hadoop プラグインのライセンス
    3.  
      Hadoop クラスタの準備
    4.  
      Hadoop プラグインを配備するためのベストプラクティス
  3. NetBackup for Hadoop の構成
    1.  
      NetBackup for Hadoop の構成について
    2. バックアップホストの管理
      1.  
        NetBackup マスターサーバーの許可リストに NetBackup クライアントを含める
      2.  
        バックアップホストとしての NetBackup アプライアンスの設定
    3.  
      NetBackup での Hadoop クレデンシャルの追加
    4. Hadoop 構成ファイルを使用した Hadoop プラグインの構成
      1.  
        高可用性 Hadoop クラスタ用の NetBackup の構成
      2.  
        Hadoop クラスタのカスタムポートの設定
      3.  
        バックアップホストのスレッド数の設定
      4. NetBackup および Hadoop クラスタ間での SSL 対応 (HTTPS) 通信の設定
        1.  
          NetBackup サーバーとクライアントの ECA_TRUST_STORE_PATH
        2.  
          NetBackup サーバーとクライアントの ECA_CRL_PATH
        3.  
          サーバーとクライアントの HADOOP_SECURE_CONNECT_ENABLED
        4.  
          NetBackup サーバーとクライアントの HADOOP_CRL_CHECK
        5.  
          bp.conf ファイルのパラメータ値の例
    5.  
      Kerberos を使用する Hadoop クラスタの設定
    6. Hadoop プラグインの NetBackup ポリシーの構成
      1. BigData バックアップポリシーの作成
        1. NetBackup 管理コンソールを使用した BigData ポリシーの作成
          1.  
            Hadoop クラスタの BigData ポリシーを作成するためのポリシーの設定ウィザードの使用
          2.  
            Hadoop クラスタ用の BigData ポリシーを作成するための NetBackup ポリシーユーティリティの使用
        2.  
          Hadoop クラスタ用の BigData ポリシーを作成するための NetBackup コマンドラインインターフェース (CLI) の使用
    7.  
      Hadoop クラスタのディザスタリカバリ
  4. Hadoop のバックアップとリストアの実行
    1. Hadoop クラスタのバックアップについて
      1.  
        Kerberos 認証を使用する Hadoop クラスタのバックアップおよびリストア操作実行の前提条件
      2.  
        Hadoop クラスタのバックアップを作成するためのベストプラクティス
      3.  
        Hadoop クラスタのバックアップ
    2. Hadoop クラスタのリストアについて
      1.  
        Hadoop クラスタをリストアするためのベストプラクティス
      2. 同じ Hadoop クラスタ上での Hadoop データのリストア
        1.  
          同じ Hadoop クラスタに Hadoop データをリストアするためのリストアウィザードの使用
        2.  
          同じ Hadoop クラスタに Hadoop データをリストアするための bprestore コマンドの使用
      3.  
        代替の Hadoop クラスタ上での Hadoop データのリストア
  5. トラブルシューティング
    1.  
      NetBackup for Hadoop の問題のトラブルシューティングについて
    2.  
      NetBackup for Hadoop のデバッグログについて
    3. Hadoop データのバックアップ問題のトラブルシューティング
      1.  
        バックアップ操作がエラー 6609 で失敗する
      2.  
        バックアップ操作がエラー 6618 で失敗した
      3.  
        バックアップ操作がエラー 6647 で失敗する
      4.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      5.  
        バックアップ操作がエラー 6654 で失敗する
      6.  
        バックアップ操作が bpbrm エラー 8857 で失敗する
      7.  
        バックアップ操作がエラー 6617 で失敗する
      8.  
        バックアップ操作がエラー 6616 で失敗する
      9.  
        コンテナベースの NetBackup Appliance を再起動した後、NetBackup 構成ファイルおよび証明書ファイルが保持されない
      10.  
        バックアップイメージの選択でイメージが表示されているにもかかわらず、リストア時に増分バックアップイメージが表示されない
      11.  
        子バックアップジョブの 1 つがキューに投入された状態になる
    4. Hadoop データのリストア問題のトラブルシューティング
      1.  
        リストアが 2850 エラーコードで失敗する
      2.  
        NetBackup の Hadoop のリストアジョブが部分的に完了する
      3.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      4.  
        Hadoop プラグインファイルがバックアップホスト上にない場合、リストア操作が失敗する
      5.  
        リストアが bpbrm エラー 54932 で失敗する
      6.  
        リストア操作が bpbrm エラー 21296 で失敗する
      7.  
        ディザスタリカバリ後に構成ファイルがリカバリされない
  6.  
    索引

Hadoop データのバックアップ

Hadoop データは並列ストリームでバックアップされ、バックアップ時に Hadoop DataNodes はデータブロックを同時に複数のバックアップホストに対してストリームします。

メモ:

Hadoop バックアップ対象で指定されたすべてのディレクトリは、バックアップ前にスナップショット対応に設定する必要があります。

次の図は、バックアップフローの概要を示しています。

図: バックアップフロー

バックアップフロー

次の図に示されているようになります。

  1. スケジュールされたバックアップジョブはマスターサーバーからトリガされます。

  2. Hadoop データのバックアップジョブは複合ジョブです。バックアップジョブがトリガされると、最初に検出ジョブが実行されます。

  3. 検出中に、最初のバックアップホストは NameNode と接続し、検出を実行して、バックアップする必要があるデータの詳細を取得します。

  4. 作業負荷検出ファイルは、バックアップホストに作成されます。作業負荷検出ファイルには、さまざまな DataNodes からバックアップする必要があるデータの詳細が含まれています。

  5. バックアップホストは作業負荷検出ファイルを使用し、作業負荷が複数のバックアップホスト間でどのように分散されるかを決定します。作業負荷分散ファイルは、バックアップホストごとに作成されます。

  6. バックアップホストごとに個別の子ジョブが実行されます。作業負荷分散ファイルで指定されたデータがバックアップされます。

  7. データブロックは、異なる DataNodes から複数のバックアップホストに同時にストリームします。

すべての子ジョブが完了するまで、複合バックアップジョブは完了しません。子ジョブが完了すると、NetBackup は NameNode からすべてのスナップショットをクリーンアップします。クリーンアップ活動が完了した後にのみ、複合バックアップジョブは完了します。

Hadoop クラスタのバックアップについてを参照してください。