“三次握手,四次揮手”你確定你了解么?(之一)
記得剛畢業(yè)找工作面試的時候,經(jīng)常會被問到:你知道“3次握手,4次揮手”嗎?這時候我會“胸有成竹”地“背誦”前期準備好的“答案”,第一次怎么怎么,第二次……答完就沒有下文了,面試官貌似也沒有深入下去的意思,深入下去我也不懂,皆大歡喜!
作為程序員,要有“刨根問底”的精神。知其然,更要知其所以然。這篇文章希望能抽絲剝繭,還原背后的原理。
什么是“3次握手,4次揮手”
TCP是一種面向連接的單播協(xié)議,在發(fā)送數(shù)據(jù)前,通信雙方必須在彼此間建立一條連接。所謂的“連接”,其實是客戶端和服務器的內(nèi)存里保存的一份關于對方的信息,如ip地址、端口號等。
TCP可以看成是一種字節(jié)流,它會處理IP層或以下的層的丟包、重復以及錯誤問題。在連接的建立過程中,雙方需要交換一些連接的參數(shù)。這些參數(shù)可以放在TCP頭部。
TCP提供了一種可靠、面向連接、字節(jié)流、傳輸層的服務,采用三次握手建立一個連接。采用4次揮手來關閉一個連接。
TCP服務模型
在了解了建立連接、關閉連接的“三次握手和四次揮手”后,我們再來看下TCP相關的東西。
一個TCP連接由一個4元組構(gòu)成,分別是兩個IP地址和兩個端口號。一個TCP連接通常分為三個階段:啟動、數(shù)據(jù)傳輸、退出(關閉)。
當TCP接收到另一端的數(shù)據(jù)時,它會發(fā)送一個確認,但這個確認不會立即發(fā)送,一般會延遲一會兒。ACK是累積的,一個確認字節(jié)號N的ACK表示所有直到N的字節(jié)(不包括N)已經(jīng)成功被接收了。這樣的好處是如果一個ACK丟失,很可能后續(xù)的ACK就足以確認前面的報文段了。
一個完整的TCP連接是雙向和對稱的,數(shù)據(jù)可以在兩個方向上平等地流動。給上層應用程序提供一種雙工服務
。一旦建立了一個連接,這個連接的一個方向上的每個TCP報文段都包含了相反方向上的報文段的一個ACK。
序列號的作用是使得一個TCP接收端可丟棄重復的報文段,記錄以雜亂次序到達的報文段。因為TCP使用IP來傳輸報文段,而IP不提供重復消除或者保證次序正確的功能。另一方面,TCP是一個字節(jié)流協(xié)議,絕不會以雜亂的次序給上層程序發(fā)送數(shù)據(jù)。因此TCP接收端會被迫先保持大序列號的數(shù)據(jù)不交給應用程序,直到缺失的小序列號的報文段被填滿。
TCP頭部
源端口和目的端口在TCP層確定雙方進程,序列號表示的是報文段數(shù)據(jù)中的第一個字節(jié)號,ACK表示確認號,該確認號的發(fā)送方期待接收的下一個序列號,即最后被成功接收的數(shù)據(jù)字節(jié)序列號加1,這個字段只有在ACK位被啟用的時候才有效。
當新建一個連接時,從客戶端發(fā)送到服務端的第一個報文段的SYN位被啟用,這稱為SYN報文段,這時序列號字段包含了在本次連接的這個方向上要使用的第一個序列號,即初始序列號ISN
,之后發(fā)送的數(shù)據(jù)是ISN加1,因此SYN位字段會消耗
一個序列號,這意味著使用重傳進行可靠傳輸。而不消耗序列號的ACK則不是。
頭部長度(圖中的數(shù)據(jù)偏移)以32位字為單位,也就是以4bytes為單位,它只有4位,最大為15,因此頭部最大長度為60字節(jié),而其最小為5,也就是頭部最小為20字節(jié)(可變選項為空)。
ACK —— 確認,使得確認號有效。
RST —— 重置連接(經(jīng)??吹降膔eset by peer)就是此字段搞的鬼。
SYN —— 用于初如化一個連接的序列號。
FIN —— 該報文段的發(fā)送方已經(jīng)結(jié)束向?qū)Ψ桨l(fā)送數(shù)據(jù)。
當一個連接被建立或被終止時,交換的報文段只包含TCP頭部,而沒有數(shù)據(jù)。
狀態(tài)轉(zhuǎn)換
三次握手和四次揮手的狀態(tài)轉(zhuǎn)換如下圖。