BGP路由从不稳定到直接中断,和中国电信的工程师共同排查后修复

三地都是简陋的网络环境,却出人意料地采用BGP连接,昂贵的月租费,几年下来,什么样的路由器和防火墙都能买了,何必吊死在BGP上呢?

这不,BGP一旦出问题,还得劳烦中国电信来处理,沟通成本也挺高的,中国电信的工程师,可不是随时在线处理问题的,要找到合适的人,电话得转好几下,同样的故障描述,我得说好几遍才行。珠海和苏州之间的故障,报故障的电话竟然需要我打到上海去,也是没谁了。

前几天,陆续接到客户的报怨,说是珠海经常无法访问苏州的服务器,于是远程珠海的电脑进行排查,可是又突然自动恢复了,还没来得及吐槽的呢,不到10分钟又断了,第一天报了电信故障后,没反馈。


第二天早上,客户的另外一位员工也来反应问题了


这时候,电信也联系上了,但是苏州的工程师,要求我拨打一个400电话,重新报故障


这个400电话,竟然是上海的,而且他回电话的时候,直接就是021的号码了,好说歹说,总算是勉强加了我的微信,要不然电话沟通可费劲了


问题来了, 他竟然不能远程登录思科路由器,还说这个设备不属于他们维护,是客户自维护的。

我就奇了怪了,上次出故障的时候,苏州、珠海、南京,把路由器都换了,而且我只是提供了地址,电信配置好了直接快递给客户的,这还不叫他们的设备?而且我根本没密码啊,我怎么登录?

然后又打苏州电信沟通了一番,这边是按规定不能把密码给我,与上海电信的话自相矛盾。可是他又不在电脑面前,无法帮我登录路由器排查故障。

“那我怎么办?投诉吗?”

投诉这两个字,还是很敏感的,立刻安排个徒弟,把密码查询给我了,徒弟能力有限,只能帮着查个密码,排查故障还嫩了点。

有密码就好办了,咱们自己动手吧,登录路由器后,输入命令:sh ip route ,如下图所示,珠海的路由器里面,根本没有苏州的网段(192.168.0.0/24),怎么可能通讯呢?


反馈之后,按照要求提供了trace route截图,然后就是电信那边一通猛如虎的操作


答复是路由表有冲突了,其他地方有配置问题,影响到珠海和苏州之间的BGP路由了,我汗。。。本以为找到问题,网络就能恢复了,然后,奇怪的问题又出现了,珠海只能访问苏州的一台服务器,另外一台则无法访问,也不能ping通。

这时候,就要登录客户用来上网的那台路由器来排查了,登录之后发现,这竟然不是我公司给客户的那台路由器!肯定是搬迁之后,把原来的tplink路由器插上去了,那台路由器更新固件后,静态路由功能失效了,无法配置,由于不支持添加静态路由,只能每台电脑配置两个IP地址,一个是用来上网的IP,另一个IP是配置在与思科路由器同一网段,以便于访问苏州的服务器,这种做法非常地不规范,也经常会出莫名其妙的问题,所以当时为他们找了一台,又便宜,又能配置静态的路由器:dlink DIR823,肯定是搬迁之后,插错路由器了,远程看过之后,果然如此



赶紧让他们把路由器换回去,然后,再次登录电信的思科路由器上,路由表显示,已经学习到苏州的网段了,而且已经能够通信了。




换回路由器之后,让客户全部把IP地址改回自动获取,问题才得到真正的解决——上网、异地访问两不误


又问了一下苏州电信,原来上海是网管专家,只负责监控,并不负责直接处理问题,呵呵


最后,再贴一下拓扑图和苏州飞鱼星路由器配置的静态路由,这个静态路由,三地的上网路由器里面必须都要配置,否则服务器无法互相访问



举报
评论 0