对那些整天喊着“玩大的,玩狠的”口号的人来说,Intel万兆网卡背靠背连接ping不通那点事儿,根本就不算个事儿。所以,如果你正好是喜欢喊口号的朋友,就不要往下看了,因为我要讲述的,你可能不感兴趣,也很可能看不懂。
今天,是我加入I公司3个多月以来最有成就感的一天,因为打赢了一个硬仗。1个多月以前,我所在的项目小组给我分配了一个bug, 该bug可简单描述为:两张Intel 82599的万兆网卡,通过光纤背靠背连接后,彼此ping不通。从接受任务到今天,一共持续了33天,其间多次被各种杂事儿所打断,但总的投入时间累计也至少有8个工作日。直到今天,我才真正定位了这个bug的root cause(I公司称之为根因 Orz),真是“山重水复疑无路,蓦然回首,那人却在灯火阑珊处”。 既然玩不了大的,也玩不了狠的,咱就玩点实在的吧。
1. 问题概述
存储结点Ann与应用主机结点Ben上各有一张Intel 82599万兆网卡(ixgbe), 网卡与网卡之间使用光纤背靠背连接。在A结点和B结点都给网卡的Interface配置上IPv4地址,彼此无法ping通。
[NODE Ann] eth1: 00:25:64:ba:8d:be : 192.168.53.110 eth2: 00:25:64:ba:8d:bd : 192.168.54.110 [NODE Ben] eth1: 00:25:63:ba:8d:be : 192.168.53.100 eth2: 00:25:63:ba:8d:be : 192.168.54.100
2. 定位过程
原文:http://www.cnblogs.com/idorax/p/7197101.html