NetBackup™ 故障排除指南

Last Published:
Product(s): NetBackup & Alta Data Protection (11.0)
  1. 介绍
    1.  
      有关 NetBackup 日志记录和状态码信息的其他资源
    2.  
      对问题进行故障排除
    3.  
      用于技术支持的问题报告
    4.  
      关于收集有关 NetBackup-Java 应用程序的信息
  2. 故障排除过程
    1.  
      关于故障排除过程
    2. 对 NetBackup 问题进行故障排除
      1.  
        在 UNIX 或 Linux 服务器上验证所有进程是否正在运行
      2.  
        在 Windows 服务器上验证是否所有进程正在运行
    3.  
      对安装问题进行故障排除
    4.  
      对配置问题进行故障排除
    5.  
      设备配置问题解决方法
    6.  
      测试主服务器和客户端
    7.  
      测试介质服务器和客户端
    8.  
      解决与 UNIX 客户端相关的网络通信问题
    9.  
      解决与 Windows 客户端相关的网络通信问题
    10. vnetd 代理连接故障排除
      1.  
        vnetd 代理连接要求
      2.  
        从何着手对 vnetd 代理连接进行故障排除
      3.  
        验证 vnetd 进程及其代理是否处于活动状态
      4.  
        验证主机连接是否已设置代理
      5.  
        测试 vnetd 代理连接
      6.  
        检查连接和接受进程的日志文件
      7.  
        查看 vnetd 代理日志文件
    11. 安全证书吊销故障排除
      1.  
        对云提供商的已吊销 SSL 证书问题进行故障排除
      2.  
        对云提供商的 CRL 下载问题进行故障排除
      3.  
        主机的 CRL 如何影响证书吊销故障排除
      4.  
        NetBackup 作业因证书已被吊销或 CRL 不可用而失败
      5.  
        NetBackup 作业由于明显的网络错误而失败
      6.  
        NetBackup 作业由于资源不可用而失败
      7.  
        主服务器安全证书已吊销
      8.  
        确定 NetBackup 主机的证书状态
      9.  
        外部 CA 签名证书吊销问题故障排除
    12.  
      关于网络和主机名故障排除
    13. 验证 NetBackup 中的主机名和服务条目
      1.  
        UNIX 主服务器和客户端上主机名和服务条目的示例
      2.  
        UNIX 主服务器和介质服务器上主机名和服务条目的示例
      3.  
        UNIX PC 客户端上主机名和服务条目的示例
      4.  
        连接到多个网络的 UNIX 服务器上主机名和服务条目的示例
    14.  
      关于 bpclntcmd 实用程序
    15.  
      使用主机属性访问配置设置
    16.  
      解决磁盘已满的问题
    17. 冻结的介质故障排除注意事项
      1.  
        对冻结的介质进行故障排除时可参考的日志
      2.  
        关于导致介质冻结的情况
    18. 对 NetBackup Web 服务问题进行故障排除
      1.  
        查看 NetBackup Web 服务日志
      2.  
        配置外部 CA 后的 Web 服务问题故障排除
    19.  
      对 NetBackup Web 服务器证书问题进行故障排除
    20. 解决 PBX 问题
      1.  
        检查 PBX 安装
      2.  
        检查 PBX 是否正在运行
      3.  
        检查 PBX 是否已正确设置
      4.  
        访问 PBX 日志
      5.  
        对 PBX 安全性进行故障排除
      6.  
        确定 PBX 后台驻留程序或服务是否可用
    21. 远程主机验证问题故障排除
      1.  
        查看与主机验证相关的日志
      2.  
        启用与 NetBackup 8.0 和更低版本主机的不安全通信
      3.  
        批准待定的主机 ID-主机名映射
      4.  
        清除主机缓存
    22. 自动映像复制故障排除
      1.  
        用于执行自动映像同步复制 (A.I.R.) 和 SLP 的主服务器的规则
      2. 使用外部证书配置时,目标 A.I.R. 可信主服务器操作失败
        1.  
          对添加或更新信任关系进行故障排除
        2.  
          对删除信任关系进行故障排除
      3.  
        关于对 SLP 组件管理的自动导入作业进行故障排除
    23.  
      对网络接口卡性能进行故障排除
    24.  
      关于 bp.conf 文件中的 SERVER 条目
    25.  
      关于存储单元不可用的问题
    26.  
      解决 Windows 上的 NetBackup 管理操作失败
    27.  
      在 UNIX 计算机上解析 NetBackup 管理控制台中显示的乱码文本
    28.  
      对 NetBackup Web UI 和 NetBackup 管理控制台中的错误消息进行故障排除
    29.  
      “NetBackup 管理控制台”需要有额外的磁盘空间来存储日志和临时文件
    30.  
      在配置外部 CA 后,无法登录 NetBackup 管理控制台
    31.  
      基于文件的外部证书问题故障排除
    32.  
      对外部证书配置问题进行故障排除
    33.  
      Windows 证书存储库问题故障排除
    34.  
      备份失败故障排除
    35.  
      对 NAT 客户端或 NAT 服务器的备份失败问题进行故障排除
    36.  
      对 NetBackup Messaging Broker(或 nbmqbroker)服务问题进行故障排除
    37.  
      对 Windows 系统的电子邮件通知问题进行故障排除
    38.  
      对 KMS 配置问题进行故障排除
    39.  
      对由于密钥较大而导致的 NetBackup CA 迁移启动问题进行故障排除
    40.  
      对非特权用户(服务用户)帐户的相关问题进行故障排除
    41.  
      对 auth.conf 文件中的组名称格式问题进行故障排除
    42.  
      VxUpdate 软件包添加过程故障排除
    43.  
      对 FIPS 模式问题进行故障排除
    44.  
      对恶意软件扫描问题进行故障排除
    45.  
      对启用传输中数据加密的 NetBackup 作业相关问题进行故障排除
    46.  
      对非结构化数据即时访问问题进行故障排除
    47.  
      对多重身份验证问题进行故障排除
    48.  
      对多人授权问题进行故障排除
    49.  
      对与 NetBackup 横向扩展关系数据库的连接进行故障排除
    50.  
      对私钥加密问题进行故障排除
    51.  
      对安全配置风险功能问题进行故障排除
    52.  
      对基于风险引擎的异常检测选项问题进行故障排除
  3. 使用 NetBackup 实用程序
    1.  
      关于 NetBackup 故障排除实用程序
    2.  
      关于 NetBackup 调试日志分析实用程序
    3.  
      关于日志记录助理
    4.  
      关于网络故障排除实用程序
    5. 关于 NetBackup 支持实用程序 (nbsu)
      1.  
        NetBackup 支持实用程序 (nbsu) 的输出
      2.  
        NetBackup 支持实用程序 (nbsu) 的进度显示示例
    6. 关于 NetBackup 一致性检查实用程序 (NBCC)
      1.  
        NetBackup 一致性检查实用程序 (NBCC) 的输出
      2.  
        NBCC 进度显示的示例
    7.  
      关于 NetBackup 一致性检查修复 (NBCC) 实用程序
    8.  
      关于 nbcplogs 实用程序
    9. 关于机械手测试实用程序
      1.  
        在 UNIX 环境下进行机械手测试
      2.  
        在 Windows 环境下进行机械手测试
    10. 关于 NetBackup 智能诊断 (nbsmartdiag) 实用程序
      1.  
        使用 nbsmartdiag 实用程序进行 NetBackup 主机通信的工作流程
    11.  
      关于按作业 ID 收集日志
  4. 灾难恢复
    1.  
      关于灾难恢复
    2.  
      推荐的备份方法
    3.  
      有关灾难恢复的要求和注意事项
    4.  
      灾难恢复软件包
    5.  
      关于灾难恢复设置
    6. 关于适用于 UNIX 和 Linux 的磁盘恢复过程
      1. 关于恢复 Linux 上的主服务器磁盘
        1.  
          在根文件系统完好无损的情况下恢复主服务器
        2.  
          在根分区丢失的情况下恢复主服务器
      2.  
        关于恢复 UNIX 的 NetBackup 介质服务器磁盘
      3.  
        在 UNIX 客户端工作站上恢复系统磁盘
    7. 关于 UNIX 和 Linux 上的群集 NetBackup 服务器恢复
      1.  
        替换 UNIX 或 Linux 群集上的故障节点
      2.  
        恢复整个 UNIX 或 Linux 群集
    8. 关于适用于 Windows 的磁盘恢复过程
      1. 关于恢复 Windows 的主服务器磁盘
        1.  
          在 Windows 完好无损的情况下恢复主服务器
        2.  
          恢复主服务器和 Windows
      2.  
        关于恢复 Windows 的 NetBackup 介质服务器磁盘
      3.  
        恢复 Windows 客户端磁盘
    9. 关于 Windows 上的群集 NetBackup 服务器恢复
      1.  
        替换 Windows VCS 群集上的故障节点
      2.  
        恢复 Windows VCS 群集上的共享磁盘
      3.  
        恢复整个 Windows VCS 群集
    10.  
      灾难恢复安装后在群集主服务器上生成证书
    11.  
      关于 DR_PKG_MARKER_FILE 环境变量
    12.  
      在 Windows 上还原灾难恢复软件包
    13.  
      在 Linux 上还原灾难恢复软件包
    14. NetBackup 目录库的恢复选项
      1. 恢复 NetBackup 目录库或 NetBackup 目录库映像文件的前提条件
        1.  
          在目录库恢复之前建立与 NAT 介质服务器的连接
      2.  
        关于在 Windows 计算机上执行 NetBackup 目录库恢复
      3.  
        关于从磁盘设备执行 NetBackup 目录库恢复
      4.  
        关于 NetBackup 目录库恢复和符号链接
      5.  
        NetBackup 灾难恢复电子邮件示例
      6. 关于恢复整个 NetBackup 目录库
        1.  
          使用 NetBackup 目录库恢复向导恢复整个 NetBackup 目录库
        2.  
          使用 bprecover -wizard 恢复整个 NetBackup 目录库
        3.  
          在目录库恢复之后指定 NetBackup 作业 ID 编号
      7. 关于恢复 NetBackup 目录库映像文件
        1.  
          使用 NetBackup 目录库恢复向导恢复 NetBackup 目录库映像文件
        2.  
          使用 bprecover -wizard 恢复 NetBackup 目录库映像文件
      8. 关于恢复 NetBackup 数据库
        1.  
          从备份恢复 NetBackup 数据库
        2.  
          从暂存目录恢复 NetBackup 数据库
        3.  
          关于在暂存目录中处理 NetBackup 数据库
        4.  
          终止数据库连接
      9.  
        在配置 NetBackup Access Control 时恢复 NetBackup 目录库
      10.  
        从目录库备份的非主副本恢复 NetBackup 目录库
      11.  
        不使用灾难恢复文件恢复 NetBackup 目录库
      12.  
        从命令行恢复 NetBackup 用户控制的联机目录库备份
      13.  
        从 NetBackup 联机目录库备份还原文件
      14.  
        取消冻结 NetBackup 联机目录库恢复介质
      15.  
        在目录库恢复期间出现退出状态 5988 时要执行的步骤

对恶意软件扫描问题进行故障排除

无法从 NetBackup 恶意软件实用程序获得响应

适用于扫描主机 RHEL 8.x 和 NFS 版本 4.x)扫描大型备份(约 2 亿个文件)时,Web UI 上显示以下错误,表示作业失败:

Failed to get response from NetBackup malware utility.

在扫描主机上进行扫描时,无法从扫描主机访问 NFS 装入点。扫描作业仍在进行中,将在两天后超时。可以访问存储服务器上的 NFS 导出。

解决办法:通过在扫描主机上的 /etc/nfsmount.conf 文件中设置以下配置,确保使用 NFS 版本 3 通过 NFS 在扫描主机上装入 IA 装入:

# grep Defaultvers /etc/nfsmount.conf Defaultvers=3

无法连接到扫描主机

从介质服务器到扫描主机的 SSH 连接失败。

解决办法:验证以下扫描主机凭据:

  • RSA (SHA256) 密钥

  • 用户名

  • 密码

有关扫描主机配置,请参考《NetBackup Web UI 管理指南》。

无法确定扫描主机操作系统

错误可能是由于扫描主机不受支持所致。

解决办法:有关扫描主机的支持平台的完整列表,请参考“软件兼容性列表”文档。

无法将 NetBackup 恶意软件实用程序复制到扫描主机
  • 扫描主机上没有足够的可用空间。

  • SSH 用户无权访问扫描主机上的所需目录。

解决办法

  • 在 Windows 扫描主机上,检查 C:\ 文件夹是否有可用空间。

  • 在 Linux 扫描主机上,检查 /tmp 文件夹是否有可用空间。

无法获取扫描主机凭据

介质服务器无法从主服务器获取用于访问扫描主机的凭据。

解决办法:检查是否已指定扫描主机的凭据。

扫描期间发生超时

默认情况下,扫描操作在两天后超时。扫描时间可能因工作负载类型、网络带宽、备份大小等因素而异。

解决办法:扫描超时是可配置的,可以通过设置 MALWARE_SCAN_OPERATION_TIMEOUT 配置项进行更改。

  • 最小值:1 小时

  • 最大值:30 天

无法从 NetBackup 恶意软件实用程序获得响应

nbmalwareutil 二进制文件与 ScanManager 不匹配

解决办法

请与 NetBackup 支持联系。

无法启动扫描程序

特定于恶意软件扫描程序的故障消息。

解决办法:对于无代理主机类型池,请参考介质服务器上的 nbmalwarescanner 日志,或者如果是基于代理的扫描,请参考扫描主机上的 nbmalwarescanner 日志。

无法装入备份映像

无法从扫描主机访问 IA 共享。

解决办法:检查存储服务器上的 IA 配置。验证活动监视器上的 IA 作业是否成功。

无法卸载备份映像

IA 共享繁忙或不可访问。

解决办法:对于无代理主机类型池,请参考介质服务器上的 nbmalwarescanner 日志,或者如果是基于代理的扫描,请参考扫描主机上的 nbmalwarescanner 日志。

无法运行扫描

在扫描备份映像期间发生常规故障。

解决办法:对于无代理主机类型池,请参考介质服务器上的 nbmalwarescanner 日志,或者如果是基于代理的扫描,请参考扫描主机上的 nbmalwarescanner 日志。

即时访问装入已创建,但未被恶意软件扫描删除

在扫描备份映像期间发生常规故障。

解决办法

  • 验证是否正在进行任何扫描。

  • 如果未进行任何扫描,则从以下目录获取此类即时访问装入的列表,其中包含使用 GET IA API 创建的即时访问装入的 ID:

    /netbackup/recovery/workloads/{workload}/instant-access-mounts

  • 使用 DELETE API 删除即时访问装入:

    /netbackup/recovery/workloads/{workload}/instant-access-mounts/{mounId}

所有装入驱动器均已用完

Windows 扫描主机上只能同时装入五个备份映像。

解决办法

  • 确保扫描主机不属于多个 NetBackup 域。

  • 通过运行 net use 来检查扫描主机上是否存在任何失效装入。

  • 以下驱动器盘符用于在 Windows 扫描主机上装入 IA 共享。确保它们未在使用中。 L:\ M:\ N:\ O:\ P:\

未安装 Windows Defender,或者未设置环境变量

Microsoft Windows Defender 未安装在扫描主机上或者配置错误。

解决办法:确保扫描主机上已安装 Microsoft Windows Defender。

有关扫描主机配置,请参考《NetBackup Web UI 管理指南》。

未安装 Symantec Protection Engine,或者未设置环境变量

Symantec Protection Engine 未安装在扫描主机上或者配置错误。

解决办法:确保扫描主机上已安装 Symantec Protection Engine。

有关扫描主机配置,请参考《NetBackup Web UI 管理指南》。

无法对备份映像执行恶意软件扫描

扫描失败的常规错误。

解决办法:请联系 NetBackup 支持。

NetBIOS 名称的长度最多为 15 个字符

为支持 SMB 共享,存储服务器主机名不能超过 15 个字符。

如果使用 Windows Server 2016 设置 Active Directory 域,则不允许连接到主机名长度超过 15 个字符的存储服务器。

解决办法:确保字符限制不超过 15 个字符。

无法运行扫描

在扫描备份映像期间发生常规故障。

解决办法:检查是否出现以下错误:

  • 对于无代理主机类型池,请参考介质服务器上的 nbmalwarescanner 日志,或者如果是基于代理的扫描,请参考扫描主机上的 nbmalwarescanner 日志。

  • 检查介质服务器存储上的空间。

  • 检查介质服务器上的 NFS 服务故障。

所选时间范围内的受感染文件过多

查看 nbmalwarescanner 以查看所选日期范围内备份映像的受感染文件列表。

解决办法:更新日期范围或恢复文件和文件夹选择,以减少受感染文件的数量。重试该操作。还可以执行以下操作之一:

  • 选择“允许恢复受恶意软件感染的文件”选项,该选项可用于恢复可选择的干净文件。

  • 从恢复中跳过该备份映像。

大量受感染的文件
  • 所选扫描结果中的受感染文件过多。如果扫描结果中受感染的文件超过 5000 个,将显示以下消息:

    Large number of infected files. To view the complete list of infected files, export the list.

    解决办法:以 .csv 格式导出受感染文件的列表并下载该列表以进行查看。

  • 所选扫描结果中存在许多受感染文件,或者受感染文件路径太长,无法在数据库中捕获。将显示以下错误消息:

    Large number of infected files.

    解决办法:无法导出或查看此结果。

    :由于无法导出或直接查看结果,可从扫描日志查看所选扫描结果中受感染文件的详细列表。

扫描操作分为多个部分

对于大型备份,扫描操作分为多个部分。例如,如果备份中的文件总数为 1,000,000 个,扫描操作将分为两部分,每个部分 500,000 个文件。

每个部分将分别创建和扫描。可以为每个部分分配不同的扫描主机。恶意软件检测 UI 只显示一个备份条目。

解决办法:使用 REST API 可以获取每个划分部分的详细信息。

缺少 NB_MALWARE_SCANNER_PATH 环境变量

使用扫描主机上安装的 NetBackup 恶意软件扫描程序执行恶意软件扫描操作时,操作失败并显示以下错误消息:

Missing environment variable NB_MALWARE_SCANNER_PATH

解决办法:确保已安装 NetBackup 恶意软件扫描程序。记下安装位置。

使用在主服务器上进行扫描主机配置期间提供的相同用户凭据以用户身份登录扫描主机。将以下行添加到 ~/.bashrc

export NB_MALWARE_SCANNER_PATH=<installLocation>/savapi-sdk-linux64/bin

export PATH=$PATH:$NB_MALWARE_SCANNER_PATH

未能在 Windows 扫描主机上执行恶意软件扫描

如果安装了 cygwin mks 工具包,则 Windows 扫描主机上的恶意软件扫描可能会失败。

解决办法:已安装 UNIX 实用程序,但是定义的 scanuser 不能在 PATH 变量中包含这些 UNIX 实用程序。

与扫描主机上的空间和目录访问相关的问题

错误/问题

描述

解决方法

  • 打开文件失败。

  • 无法创建目录。

  • 无法生成结果文件。

  • 无法打开输出文件。

  • 无法为结果文件创建目录。

  • 无法打开结果文件。

  • 无法创建装入目标目录。

  • 无法为日志文件创建目录。

  • 扫描主机上没有足够的可用空间。

  • SSH 用户无权访问扫描主机上的所需目录。

  • 在 Windows 扫描主机上,检查 C:\ 中是否有可用空间

  • 在 Linux 扫描主机上,检查 /tmp 中是否有可用空间

与 NAS-Data-Protection 相关的问题

在选择了以下选项的情况下将 NetBackup 从早期版本升级到 NetBackup 10.3 或更高版本时,将显示 No images match the search criteria 消息:

选项

字段

搜索依据:备份映像

策略类型:NAS-Data-Protection

副本:Copy2

恶意软件扫描状态:未扫描(默认值)

搜索依据:资产 (按策略类型)

策略类型:NAS-Data-Protection

副本:Copy2

扫描程序主机池:选择所需的扫描程序主机池。

恶意软件扫描状态:未扫描(默认值)

解决办法

要查看备份的映像,请确保在“恶意软件扫描状态”选项中选择“全部”,以扫描在早期版本的 NetBackup 介质服务器上创建的 NAS-Data-Protection 备份映像。

扫描性能问题

在 10.3 之前的 NetBackup 版本中,将即时访问装入点用于恶意软件扫描(传统恶意软件扫描)时,出现了性能问题。

解决办法:升级到 NetBackup 介质和存储服务器 10.3 或更高版本。NetBackup 10.3 引入了“动态扫描”功能。这样可以缩短即时访问时间以及提高扫描性能。

下表提供了传统恶意软件扫描和动态扫描之间的差异:

关键扫描过程

使用即时访问装入点的传统恶意软件扫描

动态扫描

即时访问阶段。

分析 tar 流并生成每个文件头和盘区映射文件(LMDB 数据库),对于备份中存在大量文件的情况,这会非常耗时。

从片段还原 TIR(目录库数据库)和 IM(映像元数据)信息。

已装入即时访问共享 (NFS/SMB),并且用户尝试列出或访问该文件。

访问它的头文件并从中读取属性。

查询目录库数据库中的目录,以获取此目录下的所有文件和目录。它还可以查询输出中的每个文件和目录属性。

扫描主机打开文件

打开并加载 LMDB 数据库。

在内存中生成索引并直接从数据容器读取。

  • 通过查找和读取 tar 文件头并分析内容来获取文件的盘区。

  • 通过从片段 FP 映射中搜索 SO 列表来获取 SO 列表(仅限 PureDisk)

  • 通过插入 SO 列表生成映射表(仅限 PureDisk)

扫描主机读取文件

从 LMDB 数据库搜索并从数据容器中读取。

如果存储服务器是第三方存储供应商,它将直接通过 OST 接口读取数据。如果存储服务器是 PureDisk,它将从映射表中搜索并从数据容器读取数据。

错误的日志文件位置的详细信息

下表提供了要查看的相应日志文件的详细信息,具体取决于用例:

表:使用无代理扫描主机时的日志文件位置

用例

主服务器上的组件

介质服务器上的组件

日志文件路径

配置

nbwebservice

ncfnbcs

对于主服务器:

  • /usr/openv/logs/nbwebservice

  • /usr/openv/netbackup/logs/​bprd/

对于介质服务器:

  • /usr/openv/logs/ncfnbcs

  • /usr/openv/netbackup/​logs/nbmalwarescanner/

扫描进程

nbwebservice

bprd

ncfnbcs

nbmalwarescanner

恢复

nbwebservice

bprd

表:使用 NetBackup 客户端作为扫描主机时的日志文件位置

用例

主服务器上的组件

扫描主机客户端上的组件

日志文件路径

配置

nbwebservice

nbsubscriber

  • /usr/openv/netbackup/logs/nbscanhostconfigcmd/

  • /usr/openv/logs/nbsubscriber/

扫描进程

nbwebservice

bprd

nbsubscriber

恢复

nbwebservice

bprd

SSH 登录默认处于禁用状态

对于 VMWare VM 备份扫描,请确保使用 uid=0 的扫描用户。SSH 登录默认处于禁用状态,出于安全原因,用户可能无法将其启用。

解决办法

在上述情况下,请执行以下操作:

如果禁用 root 用户的 SSH 登录,则可以将非 root 扫描用户添加到组 0 (root),以便能够扫描所有文件。

例如,uid=1001(scanuser) gid=1001(scanuser) groups=1001(scanuser),0(root)