文档详情

(tcpdump抓包丢失问题.doc

发布：2017-01-17约字共5页下载文档

文本预览下载声明

1 近日用tcpdump抓包，发现有大量的丢包出现(packets dropped by kernel), 如下： tcpdump -i eth0 dst port?1234 and udp -s 2048 -X -tt a.pack 264 packets captured3043 packets received by filter2706 packets dropped by kernel 丢包原因：经过google以及分析，造成这种丢包的原因是由于libcap抓到包后，tcpdump上层没有及时的取出，导致libcap缓冲区溢出，从而覆盖了未处理包，此处即显示为dropped by kernel，注意，这里的kernel并不是说是被linux内核抛弃的，而是被tcpdump的内核，即libcap抛弃掉的，上层监听到 1234端口的server可以正常的获取数据。解决方法：根据以上分析，可以通过改善tcpdump上层的处理效率来减少丢包率，下面的几步根据需要选用，每一步都能减少一定的丢包率 1.最小化抓取过滤范围，即通过指定网卡，端口，包流向，包大小减少包数量 2. 添加-n参数，禁止反向域名解析 tcpdump -i eth0 dst port?1234 and udp -s 2048 -n -X -tt a.pack 大多数情况这样就可以解决了可以通过改善tcpdump上层的处理效率来减少丢包率 3. 将数据包输出到cap文件 tcpdump -i eth0 dst port?1234 and udp -s 2048 -n -X -tt? -w a.cap 用了这一步，基本上所有的网络server都可以搞定了 4. 用sysctl修改SO_REVBUF参数，增加libcap缓冲区长度这一步是绝招了，由于设计内核参数修改，尽量不要使用，要用了不行，那就没办法了 ^_^ 通过tcpdump抓包时，结束后tcpdump会给出如下统计信息：　　1552 packets captured　　1586 packets received by filter　　34 packets dropped by kernel　　　　其中“captured”的计数指的是应用层捕获到的数据，“received by filter”和“dropped by kernel”的计数由内核维护，应用层通过getsockopt来获取。收到一个包，“received by filter”会加1，如果sock的接收buffer被填满时，则把这个数据包丢弃，将“dropped by kernel”加1。　　if (atomic_read(sk-sk_rmem_alloc) + skb-truesize = (unsigned)sk-sk_rcvbuf){　　 spin_lock(sk-sk_receive_queue.lock);　　 po-stats.tp_drops++;　　 spin_unlock(sk-sk_receive_queue.lock);　　}　　通过调节/proc/sys/net/core/rmem_default和/proc/sys/net/core/rmem_max能够改变sk_rcvbuf的大小。　　　　正常“captured”加上“dropped by kernel”应该等于“received by filter”的大小，有的时候出现不等的情况应该是还有一些数据包在sk_rcvbuf中，还没有被应用层收到的原因。tcpdump做pcap丢包一直用tcpdump做pcap，忽然从某一天开始做的pcap稍微大一点，就开始丢包，给出的哦信息大概是”xxxx packets dropped by kernel”，可能出问题的也就是vmware/linux kernel/libpcap/tcpdump，这里边的每一个我都经常升级，太复杂了，不知道是哪个引入的问题。于是就一直得过且过，大文件就凑合着在windows上用wireshark。今天实在是想搞清楚怎么回事，就仔细看了一下。仔细想想，首先排除vmware的问题，因为所有网络程序都正常工作，没有理由vmware或者tcp/ip本身出问题。所以大概就只是libpcap和 tcpdump的问题。搜到一篇文章，大概的意思就是是因为内核skb的buffer太小，tcpdump还没有来得及取下一个包，这个就已经被内核里边来的下边的包给覆盖掉了。试着改了一下还是不行，那看来不是内核缓存的问题，应该就是libpcap或者tcpdump取包比较慢。起了GUI用wireshark抓了一下，NND也是正常的，那就只可能是tcpdump的问题了。仔细看了

显示全部

相似文档