跑到Godaddy申请了一个域名,brofive.org,价格还真不贵,上去开通的时候也没查资料,第一下没搞定,就直接配置了一个域名跳转,把brofive.org的域名直接跳转到了IP地址。此后就发现了非常奇怪的现象:(1)访问网站的速度特别慢(2)跟踪客户端的域名解析(ipconfig /flushdns),发现域名在3个IP地址之间轮换…
于是回身继续检查域名服务器配置,首先是删除了跳转,然后就发现A记录配置了通配符,指向了IP地址,担心不够,又配置了www. 发现还是无效,最后才发现,Godaddy配置了一条A记录,为”Parked“通配符。果断删除,过了一会儿,域名速度就正常了,而且域名解析也没有出现不知名的IP地址了!
在面对故障的时候,工程化思维往往是赶快抢通,不求甚解。简单抢通,有时候并不能真的解决问题,而且可能埋下更难解决的隐患。这时候多思考一会儿,不要着急,在现象之间建立关联性,就会找到真正的原因。在经验积累到一定程度以后,正确地解决问题更快,特别是针对重复的问题。但每次面临新问题的时候,还是要认真分析。
在这种场景下,可以得出两个推论:
推论1:复杂分布式系统,由于造成故障的因素更多,因素之间因为时间先后不同,会造成更复杂的现象,因此分布式系统的故障根因分析(RCA)更为复杂。
推论2:复杂分布式系统的根因分析对人员要求更高,而人工智能针对分布式系统的故障根因分析的意义更为重大(AIOps)