不能先追查问题根源, 首先应该止损
,不让问题进一步扩大,代码回滚
、服务降级
等都可以起到止损的效果。
对于止损有一个比较好的实践,新业务或者重构业务上线时,可以加一个 配置开关
控制是否启用逻辑,在发现有损时,可以及时关掉业务逻辑,比重新上线要快特别多
在问题发生之后,要及时对处理问题的过程进行通告
。特别是应对线上有损的问题时,更应该及时通告。在内部群中,简单描述一下问题与可能的原因,处理的进度。而在外部群里,可以只说一下处理的进度。如果有必要,可以将问题上诉到领导,如果还解决不了问题,可以逐级继续上诉。
现象
:业务报错、线上报错日志等原因
:
有损
的判断:质疑
所有数据:日志
的熟悉,从日志中能看到具体的问题,比如 nginx 日志 php 日志等配置
更要做到心中有数细节
的追查,每次都更细一些,这样才能获得更多的信息基本功
,有时问题追查不下去,不是没有线索,而是追查到了一个未知的领域,没有相关的知识,无法追查工具
文档
如果问题解决之后,我们就不再跟进了,那么我们就沦为了解决问题的工具,问题也随之越来越多,解决不完。
那么,我们可以通过思考以下几点来提升自己
最基本的
)落到追查文档
)解决方案
)防患未然
)举一反三
)根本原因
)原文:https://www.cnblogs.com/wudanyang/p/14689204.html