中小互联网企业需要更多的接入带宽

问题分析

Panabit上线后,随即发现服务器区(网桥2)的异常:网桥2上行流量稳定在比较低的水平,下行流量异常之大,极大地挤占了办公网带宽,造成出口拥塞,从而导致抖动与丢包。基本可以判定,之前办公网上网体验差,就是因为这个原因造成的。

如果不加以限制,服务器区对下行带宽的占用可达到十几兆,并且持续时间较长。我们在Panabit上对网桥2制订了限速策略,发现无论将下行带宽限制为1M、3M、5M还是10M,都可以轻松跑满。另一个值得注意的情况是,网桥2发生较高带宽占用的时间往往出现在白天,对办公网影响极大。

4

而从流量的应用归属看,Panabit上线11天的分析结果表明,服务器区(网桥2)的GRE累计流量达到174.67G,占到超过60%的比例;SSH累计流量达到67.43G,占比达到23.5%。经过确认,此为研发/运维部门的正常业务操作。不过,服务器区流量中仍有部分疑似普通上网流量,经过确认,是部分员工用某台服务器做网关上网造成,属于历史遗留问题。

5

在将服务器区(网桥2)上下行带宽限制为3M的基础上,我们对办公网(网桥1)的流量情况进行了观察,发现出口上行带宽比较充裕,下行带宽经常跑满(16M左右,飞鱼星网关的智能流控功能会预留少量带宽做优化,以防剧烈抖动或丢包)。

6

7

此时通过Panabit观察,可以看到在飞鱼星网关固定流控功能的作用下,办公网用户享有的下行带宽根据不同业务需要被很好地均分。但由于总带宽的限制,员工虽然反应上网体验比之前有了很大提升(至少不会出现图片、网页打开不全的情况),但整体速度还是偏慢。在上网高峰期(10am-12am;2pm-4pm),上网体验仍然不能令人满意。实测过的极端情况包括:完整打开新浪汽车网站大约需要8秒;完整打开公司某业务平台网站大约需要12秒。

8

而在某些非工作时段(如:午饭及午休),由于使用网络的人数较少,人均带宽有了显著提高,员工反应上网体验令人满意。

9

从Panabit提供的流量应用归属情况看,W公司办公网流量并不像大量中小企业那样以P2P下载和在线视频流量为主,还是正常业务流量居多,相对比较纯净(迅雷流量至少有20G由链路质量测试及流控效果测试产生,属于临时流量)。

10

也正因如此,即便我们稍后关闭了飞鱼星网关的4层固定流控功能,使用Panabit对员工上网带宽进行基于应用的精准限制后,上网体验的提升也相对有限。基本可以认为,20M互联网接入带宽对于W公司目前的业务需求来说,已经成为瓶颈。

11

截至目前,W公司的网络运行在可调整的最优水平:服务器区(网桥2)的上下行带宽限制为1M,办公网(网桥1)可用到的带宽为19M。飞鱼星网关开启智能流控做拥塞时的优化,再用Panabit对每个员工的网络访问行为进行严格控制。即便如此,还是有部分员工反应打开某些复杂网页时速度缓慢(如公司某业务平台网站),而这又是业务需要。

12

13

经过观察,在上网高峰期,由于大量员工同时访问网络,针对单IP制定的限速策略很少被触发。应用分析结果又显示,网络流量又以业务应用为主,所以基本可以肯定带宽瓶颈是造成上网体验不佳的最直接因素。

发表评论