故障概览#
故障详情中可以看到告警的全部信息,如描述、标签、操作记录、处理动作等
如果是聚合后的故障,可以在关联告警中看到所有与该故障相关联的告警(告警详情中可以进一步看到操作记录、关联事件等)
在时间线中可以看到故障的发生、分派通知、静默、聚合等信息,其中分派通知会显示具体的通知渠道及通知结果
历史变更是通过自定义变更事件推送到FlashDuty的,如有相关推送,可以在这里看到与该故障关联的变更事件

状态与处理#
处理流程#
处理动作#
认领: 认领后的故障,状态会变更为处理中,并会发送相应的消息通知,如zhangsan认领了该故障
关闭: 关闭故障即表示该故障已经处理完毕,对该卡片进行关闭
系统关闭:故障自动恢复、协作空间配置了超时关闭等会触发系统自动关闭
暂缓: 只有未认领的故障才可以暂缓处理,目前支持最多24小时的暂缓,暂缓处理期间该故障不会再触发新的通知和其他操作, 待暂缓期过后会恢复原状态(可手动取消暂缓)
升级: 如分派策略有配置多环节处理,且当前认领人需将故障升级至其他环节,可以通过该操作处理,升级后故障状态会恢复为未认领状态,需要被升级环节的处理人介入处理
重新分派: 如当前通知环节无法处理该故障,可以通过重新分派选择其他人或值班表进行接收处理,如果分派前故障状态是待处理且重新分派的人员中不包括当前处理人,那么状态会恢复为未认领
添加处理人: 在现有处理人的基础上添加其他处理人进行处理,添加处理人不会变更故障的状态
合并:支持将该故障与其他故障合并,合并后,该故障会关闭(可以重新打开),可以前往被合并的故障中进行处理
自定义操作:支持通过webhook自定义自动化操作,如通过调用相关API接口执行自动化脚本或创建工单等操作
自定义字段: 需要先创建自定义字段,该字段是全局的,即所有故障中都会展示已创建的字段,一般用于标记优先级、是否误报等场景
关闭、暂缓处理和暂缓取消、升级等动作一般都会有消息通知