為了防止網(wǎng)絡(luò)的擁塞現(xiàn)象,TCP提出了一系列的擁塞控制機制。最初由V.Jacobson在1988年的論文中提出的TCP的擁塞控制由“慢啟動(Slowstart)”和“擁塞避免(Congestionavoidance)”組成,后來TCPReno版本中又針對性的加入了“快速重傳(Fastretransmit)”、“快速恢復(fù)(FastRecovery)”算法,再后來在TCPNewReno中又對“快速恢復(fù)”算法進行了改進,近些年又出現(xiàn)了選擇性應(yīng)答(selectiveacknowledgement,SACK)算法,還有其他方面的大大小小的改進,成為網(wǎng)絡(luò)研究的一個熱點。
TCP的擁塞控制主要原理依賴于一個擁塞窗口(cwnd)來控制,在之前我們還討論過TCP還有一個對端通告的接收窗口(rwnd)用于流量控制。窗口值的大小就代表能夠發(fā)送出去的但還沒有收到ACK的最大數(shù)據(jù)報文段,顯然窗口越大那么數(shù)據(jù)發(fā)送的速度也就越快,但是也有越可能使得網(wǎng)絡(luò)出現(xiàn)擁塞,如果窗口值為1,那么就簡化為一個停等協(xié)議,每發(fā)送一個數(shù)據(jù),都要等到對方的確認才能發(fā)送第二個數(shù)據(jù)包,顯然數(shù)據(jù)傳輸效率低下。TCP的擁塞控制算法就是要在這兩者之間權(quán)衡,選取最好的cwnd值,從而使得網(wǎng)絡(luò)吞吐量最大化且不產(chǎn)生擁塞。
由于需要考慮擁塞控制和流量控制兩個方面的內(nèi)容,因此TCP的真正的發(fā)送窗口=min(rwnd,cwnd)。但是rwnd是由對端確定的,網(wǎng)絡(luò)環(huán)境對其沒有影響,所以在考慮擁塞的時候我們一般不考慮rwnd的值,我們暫時只討論如何確定cwnd值的大小。關(guān)于cwnd的單位,在TCP中是以字節(jié)來做單位的,我們假設(shè)TCP每次傳輸都是按照MSS大小來發(fā)送數(shù)據(jù)的,因此你可以認為cwnd按照數(shù)據(jù)包個數(shù)來做單位也可以理解,所以有時我們說cwnd增加1也就是相當(dāng)于字節(jié)數(shù)增加1個MSS大小。
慢啟動:最初的TCP在連接建立成功后會向網(wǎng)絡(luò)中發(fā)送大量的數(shù)據(jù)包,這樣很容易導(dǎo)致網(wǎng)絡(luò)中路由器緩存空間耗盡,從而發(fā)生擁塞。因此新建立的連接不能夠一開始就大量發(fā)送數(shù)據(jù)包,而只能根據(jù)網(wǎng)絡(luò)情況逐步增加每次發(fā)送的數(shù)據(jù)量,以避免上述現(xiàn)象的發(fā)生。具體來說,當(dāng)新建連接時,cwnd初始化為1個最大報文段(MSS)大小,發(fā)送端開始按照擁塞窗口大小發(fā)送數(shù)據(jù),每當(dāng)有一個報文段被確認,cwnd就增加1個MSS大小。這樣cwnd的值就隨著網(wǎng)絡(luò)往返時間(RoundTripTime,RTT)呈指數(shù)級增長,事實上,慢啟動的速度一點也不慢,只是它的起點比較低一點而已。我們可以簡單計算下:
開始 --->cwnd=1
經(jīng)過1個RTT后--->cwnd=2*1=2
經(jīng)過2個RTT后---> cwnd=2*2=4
經(jīng)過3個RTT后---> cwnd=4*2=8
如果帶寬為W,那么經(jīng)過RTT*log2W時間就可以占滿帶寬。
擁塞避免:從慢啟動可以看到,cwnd可以很快的增長上來,從而最大程度利用網(wǎng)絡(luò)帶寬資源,但是cwnd不能一直這樣無限增長下去,一定需要某個限制。TCP使用了一個叫慢啟動門限(ssthresh)的變量,當(dāng)cwnd超過該值后,慢啟動過程結(jié)束,進入擁塞避免階段。對于大多數(shù)TCP實現(xiàn)來說,ssthresh的值是65536(同樣以字節(jié)計算)。擁塞避免的主要思想是加法增大,也就是cwnd的值不再指數(shù)級往上升,開始加法增加。此時當(dāng)窗口中所有的報文段都被確認時,cwnd的大小加1,cwnd的值就隨著RTT開始線性增加,這樣就可以避免增長過快導(dǎo)致網(wǎng)絡(luò)擁塞,慢慢的增加調(diào)整到網(wǎng)絡(luò)的最佳值。
上面討論的兩個機制都是沒有檢測到擁塞的情況下的行為,那么當(dāng)發(fā)現(xiàn)擁塞了cwnd又該怎樣去調(diào)整呢?
首先來看TCP是如何確定網(wǎng)絡(luò)進入了擁塞狀態(tài)的,TCP認為網(wǎng)絡(luò)擁塞的主要依據(jù)是它重傳了一個報文段。上面提到過,TCP對每一個報文段都有一個定時器,稱為重傳定時器(RTO),當(dāng)RTO超時且還沒有得到數(shù)據(jù)確認,那么TCP就會對該報文段進行重傳,當(dāng)發(fā)生超時時,那么出現(xiàn)擁塞的可能性就很大,某個報文段可能在網(wǎng)絡(luò)中某處丟失,并且后續(xù)的報文段也沒有了消息,在這種情況下,TCP反應(yīng)比較“強烈”:
1.把ssthresh降低為cwnd值的一半
2.把cwnd重新設(shè)置為1
3.重新進入慢啟動過程。
從整體上來講,TCP擁塞控制窗口變化的原則是AIMD原則,即加法增大、乘法減小??梢钥闯鯰CP的該原則可以較好地保證流之間的公平性,因為一旦出現(xiàn)丟包,那么立即減半退避,可以給其他新建的流留有足夠的空間,從而保證整個的公平性。
其實TCP還有一種情況會進行重傳:那就是收到3個相同的ACK。TCP在收到亂序到達包時就會立即發(fā)送ACK,TCP利用3個相同的ACK來判定數(shù)據(jù)包的丟失,此時進行快速重傳,快速重傳做的事情有:
1.把ssthresh設(shè)置為cwnd的一半
2.把cwnd再設(shè)置為ssthresh的值(具體實現(xiàn)有些為ssthresh+3)
3.重新進入擁塞避免階段。
后來的“快速恢復(fù)”算法是在上述的“快速重傳”算法后添加的,當(dāng)收到3個重復(fù)ACK時,TCP最后進入的不是擁塞避免階段,而是快速恢復(fù)階段。快速重傳和快速恢復(fù)算法一般同時使用。快速恢復(fù)的思想是“數(shù)據(jù)包守恒”原則,即同一個時刻在網(wǎng)絡(luò)中的數(shù)據(jù)包數(shù)量是恒定的,只有當(dāng)“老”數(shù)據(jù)包離開了網(wǎng)絡(luò)后,才能向網(wǎng)絡(luò)中發(fā)送一個“新”的數(shù)據(jù)包,如果發(fā)送方收到一個重復(fù)的ACK,那么根據(jù)TCP的ACK機制就表明有一個數(shù)據(jù)包離開了網(wǎng)絡(luò),于是cwnd加1。如果能夠嚴格按照該原則那么網(wǎng)絡(luò)中很少會發(fā)生擁塞,事實上擁塞控制的目的也就在修正違反該原則的地方。
具體來說快速恢復(fù)的主要步驟是:
1.當(dāng)收到3個重復(fù)ACK時,把ssthresh設(shè)置為cwnd的一半,把cwnd設(shè)置為ssthresh的值加3,然后重傳丟失的報文段,加3的原因是因為收到3個重復(fù)的ACK,表明有3個“老”的數(shù)據(jù)包離開了網(wǎng)絡(luò)。
2.再收到重復(fù)的ACK時,擁塞窗口增加1。
3.當(dāng)收到新的數(shù)據(jù)包的ACK時,把cwnd設(shè)置為第一步中的ssthresh的值。原因是因為該ACK確認了新的數(shù)據(jù),說明從重復(fù)ACK時的數(shù)據(jù)都已收到,該恢復(fù)過程已經(jīng)結(jié)束,可以回到恢復(fù)之前的狀態(tài)了,也即再次進入擁塞避免狀態(tài)。
快速重傳算法首次出現(xiàn)在4.3BSD的Tahoe版本,快速恢復(fù)首次出現(xiàn)在4.3BSD的Reno版本,也稱之為Reno版的TCP擁塞控制算法。
可以看出Reno的快速重傳算法是針對一個包的重傳情況的,然而在實際中,一個重傳超時可能導(dǎo)致許多的數(shù)據(jù)包的重傳,因此當(dāng)多個數(shù)據(jù)包從一個數(shù)據(jù)窗口中丟失時并且觸發(fā)快速重傳和快速恢復(fù)算法時,問題就產(chǎn)生了。因此NewReno出現(xiàn)了,它在Reno快速恢復(fù)的基礎(chǔ)上稍加了修改,可以恢復(fù)一個窗口內(nèi)多個包丟失的情況。具體來講就是:Reno在收到一個新的數(shù)據(jù)的ACK時就退出了快速恢復(fù)狀態(tài)了,而NewReno需要收到該窗口內(nèi)所有數(shù)據(jù)包的確認后才會退出快速恢復(fù)狀態(tài),從而更一步提高吞吐量。
SACK就是改變TCP的確認機制,最初的TCP只確認當(dāng)前已連續(xù)收到的數(shù)據(jù),SACK則把亂序等信息會全部告訴對方,從而減少數(shù)據(jù)發(fā)送方重傳的盲目性。比如說序號1,2,3,5,7的數(shù)據(jù)收到了,那么普通的ACK只會確認序列號4,而SACK會把當(dāng)前的5,7已經(jīng)收到的信息在SACK選項里面告知對端,從而提高性能,當(dāng)使用SACK的時候,NewReno算法可以不使用,因為SACK本身攜帶的信息就可以使得發(fā)送方有足夠的信息來知道需要重傳哪些包,而不需要重傳哪些包。
編輯:hfy
-
TCP
+關(guān)注
關(guān)注
8文章
1381瀏覽量
79342 -
數(shù)據(jù)包
+關(guān)注
關(guān)注
0文章
267瀏覽量
24519 -
SACK
+關(guān)注
關(guān)注
0文章
2瀏覽量
7436
發(fā)布評論請先 登錄
相關(guān)推薦
TCP BBR擁塞控制算法深度解析
![<b class='flag-5'>TCP</b> BBR<b class='flag-5'>擁塞</b><b class='flag-5'>控制</b><b class='flag-5'>算法</b>深度解析](https://file.elecfans.com/web1/M00/CE/50/o4YBAF-krTuAP4P0AABzrKWlroQ709.png)
基于衛(wèi)星網(wǎng)絡(luò)的TCP擁塞控制算法
MANET網(wǎng)絡(luò)TCP非擁塞控制識別序列與恢復(fù)
基于RED算法的非線性擁塞控制
Linux中傳輸控制協(xié)議的擁塞控制分析
高速網(wǎng)絡(luò)中TCP擁塞控制算法的研究
TCP擁塞控制算法的組合策略研究
基于模糊控制和壓縮感知的無線傳感網(wǎng)絡(luò)擁塞算法
![基于模糊<b class='flag-5'>控制</b>和壓縮感知的無線傳感<b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>擁塞</b><b class='flag-5'>算法</b>](https://file.elecfans.com/web2/M00/49/87/poYBAGKhwMOAB69CAAAR7u7cQE8665.jpg)
具有預(yù)測與自我調(diào)節(jié)能力的擁塞控制算法
![具有預(yù)測與自我調(diào)節(jié)能力的<b class='flag-5'>擁塞</b><b class='flag-5'>控制</b><b class='flag-5'>算法</b>](https://file.elecfans.com/web1/M00/45/0F/o4YBAFpgWKCAIXgpAABy362DuhQ139.jpg)
如何用eBPF寫TCP擁塞控制算法?
Linux內(nèi)核網(wǎng)絡(luò)擁塞控制算法的具體實現(xiàn)框架(一)
![Linux內(nèi)核<b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>擁塞</b><b class='flag-5'>控制</b><b class='flag-5'>算法</b>的具體實現(xiàn)框架(一)](https://file1.elecfans.com/web2/M00/8E/28/wKgZomTDNfOAdB5pAAB4figiDl8815.jpg)
Linux內(nèi)核網(wǎng)絡(luò)擁塞控制算法的實現(xiàn)框架(二)
![Linux內(nèi)核<b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>擁塞</b><b class='flag-5'>控制</b><b class='flag-5'>算法</b>的實現(xiàn)框架(二)](https://file1.elecfans.com/web2/M00/8E/2A/wKgaomTDNrmAPwYfAAALMleszuk747.jpg)
Linux內(nèi)核網(wǎng)絡(luò)擁塞控制算法的實現(xiàn)框架(三)
![Linux內(nèi)核<b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>擁塞</b><b class='flag-5'>控制</b><b class='flag-5'>算法</b>的實現(xiàn)框架(三)](https://file1.elecfans.com/web2/M00/8E/28/wKgZomTDN0-AMwhlAAA_WWXInXw174.jpg)
評論