Flashduty帮助文档
  1. 故障管理
Flashduty帮助文档
  • Flashduty
    • 入门介绍
      • 介绍
      • 快速开始
      • 常见问题
      • 状态页
    • 访问控制
      • 成员管理
      • 权限控制
      • 团队管理
      • 账户设置
      • 单点登录
        • 配置Keycloak登录
        • 配置Authing登录
    • 值班管理
      • 值班规则
      • 值班示例
    • 故障管理
      • 协作空间
      • 接入告警
      • 处理告警
      • 分派策略
      • 通知方式
      • 告警降噪
      • 通知模板
    • 集成指引
      • 集成概览
      • 告警事件
        • 自定义事件集成
        • 邮件 Email 集成
      • 变更事件
      • 即时消息
    • 数据分析
      • 分析数据
    • 自动化
  1. 故障管理

处理告警

故障概览#

故障详情中可以看到告警的全部信息,如描述、标签、操作记录、处理动作等
如果是聚合后的故障,可以在关联告警中看到所有与该故障相关联的告警(告警详情中可以进一步看到操作记录、关联事件等)
在时间线中可以看到故障的发生、分派通知、静默、聚合等信息,其中分派通知会显示具体的通知渠道及通知结果
历史变更是通过自定义变更事件推送到FlashDuty的,如有相关推送,可以在这里看到与该故障关联的变更事件
shijianxian.png

状态与处理#

处理流程#

分派->认领->处理->关闭

处理动作#

认领: 认领后的故障,状态会变更为处理中,并会发送相应的消息通知,如zhangsan认领了该故障
关闭: 关闭故障即表示该故障已经处理完毕,对该卡片进行关闭
提示
关闭状态区分人为关闭和系统自动关闭
人为关闭:即处理人员手动关闭
系统关闭:故障自动恢复、协作空间配置了超时关闭等会触发系统自动关闭
暂缓: 只有未认领的故障才可以暂缓处理,目前支持最多24小时的暂缓,暂缓处理期间该故障不会再触发新的通知和其他操作, 待暂缓期过后会恢复原状态(可手动取消暂缓)
升级: 如分派策略有配置多环节处理,且当前认领人需将故障升级至其他环节,可以通过该操作处理,升级后故障状态会恢复为未认领状态,需要被升级环节的处理人介入处理
重新分派: 如当前通知环节无法处理该故障,可以通过重新分派选择其他人或值班表进行接收处理,如果分派前故障状态是待处理且重新分派的人员中不包括当前处理人,那么状态会恢复为未认领
添加处理人: 在现有处理人的基础上添加其他处理人进行处理,添加处理人不会变更故障的状态
更多操作: 故障合并和自定义操作
合并:支持将该故障与其他故障合并,合并后,该故障会关闭(可以重新打开),可以前往被合并的故障中进行处理
自定义操作:支持通过webhook自定义自动化操作,如通过调用相关API接口执行自动化脚本或创建工单等操作
自定义字段: 需要先创建自定义字段,该字段是全局的,即所有故障中都会展示已创建的字段,一般用于标记优先级、是否误报等场景
提示
关闭、暂缓处理和暂缓取消、升级等动作一般都会有消息通知
修改于 2024-04-19 09:13:30
上一页
接入告警
下一页
分派策略
Built with