Veritas NetBackup™ for Hadoop 管理者ガイド
- 概要
- NetBackup 用 Hadoop プラグインの前提条件の検証
- NetBackup for Hadoop の構成
- NetBackup for Hadoop の構成について
- バックアップホストの管理
- NetBackup での Hadoop クレデンシャルの追加
- Hadoop 構成ファイルを使用した Hadoop プラグインの構成
- Kerberos を使用する Hadoop クラスタの設定
- Hadoop プラグインの NetBackup ポリシーの構成
- Hadoop クラスタのディザスタリカバリ
- Hadoop のバックアップとリストアの実行
- トラブルシューティング
- NetBackup for Hadoop の問題のトラブルシューティングについて
- NetBackup for Hadoop のデバッグログについて
- Hadoop データのバックアップ問題のトラブルシューティング
- バックアップ操作がエラー 6609 で失敗する
- バックアップ操作がエラー 6618 で失敗した
- バックアップ操作がエラー 6647 で失敗する
- Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
- バックアップ操作がエラー 6654 で失敗する
- バックアップ操作が bpbrm エラー 8857 で失敗する
- バックアップ操作がエラー 6617 で失敗する
- バックアップ操作がエラー 6616 で失敗する
- コンテナベースの NetBackup Appliance を再起動した後、NetBackup 構成ファイルおよび証明書ファイルが保持されない
- バックアップイメージの選択でイメージが表示されているにもかかわらず、リストア時に増分バックアップイメージが表示されない
- 子バックアップジョブの 1 つがキューに投入された状態になる
- Hadoop データのリストア問題のトラブルシューティング
- 索引
Hadoop データのバックアップ
Hadoop データは並列ストリームでバックアップされ、バックアップ時に Hadoop DataNodes はデータブロックを同時に複数のバックアップホストに対してストリームします。
メモ:
Hadoop バックアップ対象で指定されたすべてのディレクトリは、バックアップ前にスナップショット対応に設定する必要があります。
次の図は、バックアップフローの概要を示しています。
次の図に示されているようになります。
スケジュールされたバックアップジョブはマスターサーバーからトリガされます。
Hadoop データのバックアップジョブは複合ジョブです。バックアップジョブがトリガされると、最初に検出ジョブが実行されます。
検出中に、最初のバックアップホストは NameNode と接続し、検出を実行して、バックアップする必要があるデータの詳細を取得します。
作業負荷検出ファイルは、バックアップホストに作成されます。作業負荷検出ファイルには、さまざまな DataNodes からバックアップする必要があるデータの詳細が含まれています。
バックアップホストは作業負荷検出ファイルを使用し、作業負荷が複数のバックアップホスト間でどのように分散されるかを決定します。作業負荷分散ファイルは、バックアップホストごとに作成されます。
バックアップホストごとに個別の子ジョブが実行されます。作業負荷分散ファイルで指定されたデータがバックアップされます。
データブロックは、異なる DataNodes から複数のバックアップホストに同時にストリームします。
すべての子ジョブが完了するまで、複合バックアップジョブは完了しません。子ジョブが完了すると、NetBackup は NameNode からすべてのスナップショットをクリーンアップします。クリーンアップ活動が完了した後にのみ、複合バックアップジョブは完了します。
Hadoop クラスタのバックアップについてを参照してください。