Veritas NetBackup™ OpsCenter 管理指南
- NetBackup OpsCenter 概述
- 安装 OpsCenter
- 关于计划 OpsCenter 安装
- 在 Windows 和 UNIX 上安装 OpsCenter
- 关于 Windows 和 UNIX 上的 OpsCenter 升级
- 关于安装后任务
- 关于在 Windows 和 UNIX 上卸载 OpsCenter
- 关于构建 OpsCenter 群集
- OpsCenter 入门
- 管理 OpsCenter
- 了解 OpsCenter 设置
- 设置用户首选项
- 关于管理许可证
- 在 OpsCenter 服务器上配置数据清除期限
- 配置 OpsCenter 的 SMTP 服务器设置
- 在 OpsCenter 中添加主机别名
- 在 OpsCenter 中合并对象(主机)
- 在 OpsCenter 中修改磁带库信息
- 在 OpsCenter 中复制用户配置文件
- 在 OpsCenter 中设置报告导出位置
- 关于在 OpsCenter 中管理对象类型
- 关于管理 OpsCenter 用户
- 关于在 OpsCenter 中管理收件人
- 关于管理 OpsCenter Analytics 的成本分析和成本分摊
- 了解数据收集
- 关于配置 NetBackup 的数据收集
- 关于“分解作业”选项
- 查看主服务器的详细信息和数据收集状态
- 关于配置 NetBackup 的数据收集
- 管理 OpsCenter 视图
- 使用 OpsCenter 监视 NetBackup
- 控制“监控”视图的范围
- 关于使用“概览”选项卡监视 NetBackup
- 关于监视 NetBackup 作业
- “监控”>“服务”视图
- 关于监控审核跟踪
- 使用 OpsCenter 管理 NetBackup
- 支持 OpsCenter 中的 Replication Director
- 了解和配置 OpsCenter 警报
- OpsCenter 中的报告
- 附录 A. NetBackup 数据的属性
- 附录 B. CLI 手册页
- 附录 C. 使用 CSV、TSV 和 XML 文件创建视图
- 附录 D. OpsCenter 中的错误消息
OpsCenter 警报条件
OpsCenter 中带有一组预定义的警报条件。根据这些警报条件,您可以创建警报策略以检测您的 NetBackup 环境中何时出现故障并对 NetBackup 进行故障排除。警报可以帮助您在出现问题之前预测并处理问题。通过登录到 OpsCenter 或通过发送电子邮件或 SNMP 陷阱,您可以接收这些警报。创建警报策略时,您可以指定电子邮件和 SNMP 收件人。
警报条件可分为以下类别:
基于事件的警报条件 |
对于这些警报条件,OpsCenter 根据来自 NBSL 的通知从 NetBackup 中检索数据。 |
定期警报条件 |
对于这些警报条件,OpsCenter 根据等待时间(最多 15 分钟)从 NetBackup 中检索数据。 |
表:OpsCenter 中的警报条件列出了警报条件、警报类别和描述。
表:OpsCenter 中的警报条件
警报类型 |
警报条件 |
警报类别 |
描述 |
---|---|---|---|
作业 |
作业失败率上限值 |
基于事件 |
作业失败率超过指定比率时会生成警报。 |
已挂起作业 |
定期 |
选定策略或客户端的作业挂起(运行时间超过指定时间)指定的一段时间时会生成警报。每 15 分钟检查一次“已挂起作业”条件。根据作业在检查周期中的启动时间,可能不会出现警报。 对于“已挂起作业”警报,您可以将 OpsCenter 配置为忽略作业处于排队状态的时间。检查“已挂起作业”条件时,OpsCenter 默认情况下会考虑作业的开始时间。这也包括作业处于排队状态的时间。作业启动后并非始终处于活动状态。由于资源不可用,作业在变为活动状态之前会首先处于排队状态。 如果将 OpsCenter 配置为忽略作业的排队时间,则 OpsCenter 在检查“已挂起作业”条件时,会考虑作业变为活动状态的时间。请注意应考虑第一次尝试的活动状态开始时间。 例如,假设创建一个作业阈值为 25 分钟的策略。作业在第一个检查周期后的 10 分钟开始,在第三个检查周期完成后的 13 分钟结束。这将总共执行 33 (5 + 15 + 13) 分钟,但不会引发警报。 这种情况下,将检查策略四次。在第一次检查期间该作业尚未启动,在第二次检查(作业持续时间 = 5 分钟)和第三次检查(作业持续时间 = 20 分钟)期间运行时间小于阈值,和在第四次检查前作业完成(作业持续时间 = 33)。 如果作业在第一次检查后 4 分钟启动,则第三次检查会引发警报,因为作业已执行 26 分钟(11 + 15 分钟)。 | |
已完成作业 |
基于事件 |
指定策略或客户端的指定类型的作业以指定的状态结束时会生成警报。 | |
未完成的作业 |
基于事件 |
指定策略或客户端的指定类型的作业的状态为“未完成”时会生成警报。 | |
介质服务器 |
冻结的介质 |
基于事件 |
任一选定介质已冻结时会生成警报。 |
暂停的介质 |
基于事件 |
任一选定介质已暂停时会生成警报。 | |
超出了最多介质装入数 |
基于事件 |
介质超出装入阈值时会生成警报。 | |
还原必需介质 |
基于事件 |
还原操作需要介质时会生成警报。还原操作可能需要包含要还原的特定映像的特定介质。 | |
可用介质下限值 |
定期 |
可用介质数低于预定义的阈值时会生成警报。 注意: 从“视图”下拉列表中选择“所有主服务器”时,可用介质下限值警报将引发“所有主服务器”中列出的所有主服务器的单独警报。例如:如果“所有主服务器”视图中有 5 个主服务器,OpsCenter 将针对每个主服务器引发 5 个警报。 | |
已暂停介质上限值 |
定期 |
已暂停介质的百分比超出预定义的阈值时会生成警报。 | |
已冻结介质上限值 |
定期 |
已冻结介质的百分比超出预定义的阈值时会生成警报。 | |
剩余清洗次数为零 |
基于事件 |
清洗磁带剩余清洗次数为零时会生成警报。 | |
目录库 |
目录库空间下限值 |
定期 |
目录的可用空间低于阈值或大小时会生成警报。对于“目录库空间下限值”条件,您可以以百分比、字节、千字节 (KB)、兆字节 (MB)、吉字节 (GB)、兆兆字节 (TB) 或千兆兆字节 (PB) 为单位为特定策略指定阈值并生成警报。生成的警报还显示可用的目录库空间(使用上述单位)。 |
目录库未备份 |
定期 |
在预定义的时间段内没有发生目录库备份时会生成警报。 这不一定意味着,如果您未收到此警报就说明目录库备份已成功。 | |
目录库备份已禁用 |
定期 |
禁用所有目录库备份策略时会生成警报。如果已为服务器组定义了策略,则将为满足此条件的组中的每台主服务器生成警报。如果主服务器不存在任何目录库备份策略,则不会生成警报。 | |
设备 |
装入请求 |
基于事件 |
处理介质装入请求时会生成警报。 |
无清洗磁带 |
定期 |
无清洗磁带时会生成警报。 | |
驱动器已关闭 |
基于事件 |
选定服务器上下文中指定机械手或介质服务器中的驱动器关闭时会生成警报。 | |
关闭驱动器上限值 |
定期 |
关闭驱动器的百分比超出预定义的阈值时会生成警报。 | |
OpenStorage |
基于事件 |
NetApp 设备中发生特定事件时会生成警报。 请参见关于“打开存储”警报条件。 请参见添加警报策略 。 | |
磁盘 |
磁盘池已满 |
基于事件 |
当磁盘池达到高位标记时将生成警报。仅当磁盘池的已使用容量达到高位标记时,基于“磁盘池已满”条件的警报策略才会生成警报。 |
磁盘卷已关闭 |
基于事件 |
选定的磁盘卷已关闭时会生成警报。 | |
磁盘卷容量不足 |
定期 |
磁盘卷容量低于阈值限制时会生成警报。 | |
主服务器不可访问 |
基于事件 |
OpsCenter 与主服务器失去联系时会生成警报。此警报条件意味着 OpsCenter 和受控 NetBackup 主服务器之间的连接丢失。它不一定表示 NetBackup 备份不可用。 | |
与介质服务器失去联系 |
基于事件 |
OpsCenter 与介质服务器失去联系时会生成警报。 | |
设备硬件故障 |
基于事件 |
在 OpsCenter 设备硬件发生故障时会生成警报。 | |
其他 |
服务已停止 |
基于事件 |
选定的设备硬件发生故障时会生成警报。 可以设置该警报条件来监视 NetBackup 或重复数据删除设备硬件。 |
作业策略更改 |
基于事件 |
某个作业策略的策略属性更改时会生成警报。如果更改了作业策略的多个属性,将生成多个警报 请参见关于作业策略更改条件的其他信息。 如果选择特定的作业策略,则将仅监视所选作业策略的更改。如果未选择任何作业策略,则监视所有作业策略的更改。 | |
OpsCenter 优化 |
基于事件 |
当前分配的内存参数小于建议的值时,将生成警报。 |