PTN承载LTE基站FTP测速低问题分析
摘 要
FTP下载速率作为考核LTE基站无线达标率的KPI指标,FTP下载测试速率不达标分析原因为在FTP测试中存在流量的突发情况,瞬间超过了PTN承载网配置的PIR峰值带宽。针对上述问题本文从不同专业角度提出了解决方案,为LTE基站测速提供了重要依据。
【关键词】FTP QOS
1 引言
随着IP业务发展,经常出现业务丢包、下载速率慢等问题,解决此问题需要查看链路情况、网络对接模式、QOS配置等。本文通过某城市移动PTN承载LTE基站FTP测试速率不达标分析原因为在FTP测试中存在流量的突发情况,瞬间超过了PTN承载网配置的PIR峰值带宽。针对上述问题本文从不同专业角度提出了解决方案,为LTE基站测速提供了重要依据。
2 问题背景
2016年上半年某地市移动进行拉网测试,出现很多基站FTP下载速率低的问题,最低速率在6-8Mbps。Enodeb和SAEGW之间均由华为PTN承载。该地市按集团规范对PTN端到端隧道限速为440Mbps(PIR)时,手机speedtest软件测试速率达不到30Mbps,经无线反馈FTP下载速率低的基站均在市区,市区Enodeb及核心网SGW为均爱立信厂家,且SGW为新设备,老SGW不存在此类问题。
2.1 原因分析
2.1.1 测速不达标分析
经对SPEEDTEST测速过程进行抓包分析,发现LTE测速过程中流量存在严重的瞬间突发,在1毫秒这个粒度上检查速率,最高速率约为600000/0.001S = 600M/S,严重超过了PTN配置的峰值带宽PIR值,这势必会造成FTP下载丢包,导致滑动窗口缩小,影响整体平局测试速率。
由于Speedtest手机版本的软件下载时,和服务器端协商出来的瞬时速率超过PTN上的带宽限速440M,因此超过的部分会出现丢包的可能,进而肯定影响下载速率。
2.1.2 FTP测速原理
FTP下载实际是是基于TCP原理进行下载的,当TCP发送端发送数据时,如果采用“发一个包--等待ACK--再发一个包”,这种形式,效率会很低。TCP一般是一次发X个包,然后等待ACK,这个X就是‘窗口’。
TCP的实际窗口大小,是客户端和服务器协商决定的。而在FTP服务器和客户端网卡、以及FTP服务器软件上,都提供了窗口设置开关,以此来提升单次发包数量,进而提升TCP协商后的窗口大小TCP的窗口实际上决定了传输速率,窗口越大传输速率越快;反之,如果传输速率慢了,那肯定是窗口变小了。
2.1.3 影响FTP测速问题分析
FTP服务器与客户端的网卡窗口:现网应用中,公网服务器窗口有专业人员,根据自身业务情况进行维护和优化,不同的公网服务器,优化程度和其所处的网络质量不相同,因此,下载速率各不一样;
FTP服务器软件窗口和缓存:一般的FTP服务器软件,如Filezilla、Server-U、IIS等,都会提供应用软件层面上的窗口和缓存大小设置入口。同时,不同的FTP服务器软件实现机制不一样,下载效果上会有一些差异。
中间途径设备和网络的带宽限制和缓存能力:FTP测速下载的一般都是大文件,下载的时候,下行突发带宽都以端口线速发送(如GE端口,线速为1G),流量到达中间设备的时候,如果有PIR限速,则会造成拥塞丢包,TCP重传,重新协商窗口大小,从而影响下载速率。
网络固有的时延:TCP报文对时延非常敏感。时延超过一定程度,TCP收不到ACK,就会TCP重传,最终影响下载速率。因此,现网的时延对TCP报文传输影响很大。
其它因数:其他除上述四个基本因素之外,服务器硬件、客户端硬件、不同的客户端下载终端和软件、硬盘读写速度等等,都可能对下载速率有影响。
以上分析得出FTP测速不达标的原因为:测速过程中流量存在严重的瞬间突发,超过了PTN承载网配置的PIR峰值带宽。
2.2 解决思路
(1)采用标准化测试软件—由于部分软件本身的原因,导致其发送速率非常大,超过PTN 配置的峰值PIR而被丢弃,造成测试效果不好。公网上的大型网站服务器一般经过优化,下载速率较高,但小型网站不能保证,因此在测试、验收、演示等场景,采用标准化测试软件进行测试。
(2)传送网优化—针对突发大流量的冲击,传送网可在设置隧道PIR限速的前提下,进一步采取端口限速、增大缓存等方式规避突发大流量引起的丢包。
(3)核心网优化—通过TCP加速或UGW/SGW 的下行流量整形,平滑速率,减低突发,可减少超过PTN峰值带宽,避免超过PIR丢包。
(4)无线侧优化—无线基站开通ACK控制(TPE增强)功能,协商出平滑的下载速率,避免突发导致丢包。
2.3 传送网优化方案
2.3.1 优化方案
(1)增加PTN 设备硬件缓存,将单个队列的缓存尽力提升,通过缓存吸纳业务侧的突发流量。
(2)改大PTN的PIR,用更大的预留带宽容纳业务侧的突发流量。
(3)采用简单QOS策略,不部署H-QOS,在业务接入口做CAR,将PBS值配置最大,容忍更大的突发。
2.3.2 负面因素
(1)设备硬件缓存是有限的,加大缓存会增加时延的问题,同时也会减少支持的突发基站数量,缓存越大、支持突发的基站数量越少。目前LTE手机用户数量相对不大,基站流量模型不确定,盲目调整缓存存在不可预知的风险。
(2)如果将PIR由目前的440M/每接入环提升到640M/每接入环,那么目前比较普遍采用的GE接入环的接入能力就大打折扣,且不符合集团的配置规范。
(3)采用简单QOS策略,不部署H-QOS,缺点是无法做到端到端保证每条业务的CIR带宽,带宽层层校验实现难度大。在网络轻载时入口做CAR对提升测速效果明显,但在网络重载时car是无法确保每基站的CIR。
3 总结
FTP下载速率作为考核LTE基站达标率的KPI指标,出现类似问题,应该从多专业、多角度解决问题,协调相关技术部门对此问题进行研究,站在全网及端到端的角度,确定此问题的最优解决方案。
参考文献
[1]吴英.计算机网络应用软件编程技术[M].北京:机械工业出版社,2010.
[2]单滤斌,虞有池.PTN的QoS技术应用研究[J].邮电设计技术,2011(04):51-55.