yzsl有些线上问题,真的不是看代码能看出来的 中发帖

刚转运维那会儿有个挺明显的习惯,到现在偶尔还会犯:服务一出问题,第一反应就是是不是代码又写崩了。可能跟之前做测试有关系,那时候基本所有问题最后都能落到代码上,久了就会下意识这么想。 
但干久一点之后发现,有些问题你把代码翻几遍其实没什么用。 
之前遇到过一个事还挺典型的。有个服务发完版之后开始偶尔超时,不是一直挂,就是那种隔一阵来一下的,很烦。当时第一反应肯定是代码问题,刚发版嘛,然后就很自然去看改动、怀疑某段逻辑,甚至都准备回滚了。结果回滚完还是会偶尔出现,当时就有点懵。 
更离谱的是日志也没啥明显异常,就那种你感觉不对,但又说不上哪不对。那段时间其实来回看代码好几遍,也没什么新发现,有点钻牛角尖了。 
后面也是没办法了,才开始往别的方向看,去看机器、连接数、一些运行时状态。最后才发现是连接数在某些时间段被打满了,新请求卡在建连上,看起来就像接口超时。这种东西你要是一开始就死盯代码,其实...
 
 
Back to Top