深入理解TCP/IP协议栈之TCP协议

简介: 摘要:本文简单介绍了TCP面向连接理论知识,详细讲述了TCP报文各个字段含义,并从Wireshark俘获分组中选取TCP连接建立相关报文段进行分析。
摘要:
本文简单介绍了TCP面向连接理论知识,详细讲述了TCP报文各个字段含义,并从Wireshark俘获
分组中选取TCP连接建立相关报文段进行分析。
  www.2cto.com  
一、概述
TCP是面向连接的可靠传输协议,两个进程互发数据之前需要建立连接,这里的连接只不过是端系
统中分配的一些缓存和状态变量,中间的分组 交换机不维护任何连接状态信息。连接建立整个过程
如下(即三次握手协议):
首先,客户机发送一个特殊的TCP报文段;
其次,服务器用另一个特殊的TCP报文段来响应;
最后,客户机再用第三个特殊报文段作为响应。
图1 三次握手协议示意图[1]
二、TCP报文格式
2.1 概述
为了提供可靠的数据传输,TCP报文首部字段有较多的字段,TCP报文格式如下图:
图2 TCP报文格式
源和目标端口
用于多路复用/多路分解来自或送至上层应用的数据,可以这样理解,端口用来标识
同一台计算机的不同进程。
序列号和确认号
这两个字段是TCP可靠传输服务的关键部分,序列号是该报文段首字节的字节流编号
(TCP把数据看成是有序的字节流,TCP隐式地对数据流的每个字节进行编号)。这样理
解可能更直观,当报文被分解成多个报文段时,序列号就是报文段首字节在整个报文的
偏移量。确定号指定下一个期待的字节。TCP是全双工的,假设从主机A接收到主机B
的数据,则主机A填充进报文段的确认号是主机A期望从主机B收到的下一个字节序号。
还没理清这两者的关系?见下图(三次握手):
图3 正常情况下TCP连接建立过程
首部长度(4位)
因为选项是不定长的,这就需要标识整个首部字段的长度(单位是32位字),即5+选项
个数。4位,单位是32位字,所以首部最长是15*4=60字节,即选项最长是40字
节(10个选项)。
标志
URG
指示报文段里存在着被发送方的上层实体标记为"紧急"数据,当URG=1时,其后的紧
急指针指示紧急数据在当前数据段中的位置(相对于当前序列号的字节偏移量),TCP接
收方必须通知上层实体。
ACK
当ACK=0时,表示该数据段不包含确认信息,当ACK=1时,表示该报文段包括一个对
已被成功接收报文段的确认。
PSH
当PSH=1时,接收方在收到数据后立即将数据交给上层,而不是直到整个缓冲区满。
RST
用于重置一个已经混乱的连接(如主崩溃),也可用于拒绝一个无效的数据段或者拒绝
一个连接请求。一般而言,如果你得到的数据段被设置了RST位,那说明你这一
端有问题了。
SYN
用于建立连接过程,在连接请求中,SYN=1和ACK=0表示该数据段没有使用捎带
的确认域,而连接应答捎带一个确认,即SYN=1和ACK=1。
注:捎带是指对客户机到服务器数据的确认被装载在一个承载服务器到客户机的数
据报文段中。
FIN
用于释放一个连接,表示发送方已经没有数据要传输了。此时,接收方可能继续接
收数据,好在SYN和FIN数据段都有序列号,从而保证了这两种数据段以正确
顺序被处理。
窗口大小
用于流控制(确保连接的任何一方都不会过快地发送过量的分组而淹没另一方),窗口
大小指定了从被确认的字节算起可以发送多少个字节。
校验和
提供了额外可靠性,在计算检验和的时候,TCP的Checksum域设为0,如果数据域
的字节数为奇数,则数据域填补一个额外的0字节。校验和算法:将所有的16位字按
1的补码形式累加起来,取累加结果的补码。因此,当接收方执行同样计算时(包括
Checksum域),结果应该是0。
紧急指针
参考标志字段的URG位。
选项
选项部分是为了适合复杂网络环境和更好地服务于应用层设计的。TCP选项最长
是40字节。详情见2.2。
数据
无任何数据的TCP段也是合法的,通常用于确认和控制信息。
2.2 选项字段[2]
TCP选项部分很好出现在已经建立连接的会话中,只要出现在TCP连接建立阶段,
即三次握手。TCP选项部分实际运用有以下几种:
(1)最大报文传输段(MMS, Maximum Segment Size)
用于发送发与接收方协商最大报文段长度(仅仅是净荷数据,不包括TCP首部字段)。
TCP在三次握手中,每一方都会通告期望收到的MSS(MSS只出现在SYN数据包中),
如果一方不接受另一方的MSS值,则使用默认的536字节净荷数据,即主机能够接
受20+536字节的TCP报文段。
(2)窗口扩大选项(Window scaling)
TCP报文的窗口大小字段占16位,即最大值是65535,但随着时延和带宽比较大的
通信产生(如卫星通信),需要更大的窗口满足性能和吞吐率,这就是窗口扩大选项
存在的意义。例子见参考资料[2]。
Windows scaling占3个字节,最后一个字节是移位值(Shift count),即首部的窗口
位数16向左移动,如移位值为14,则新的窗口最大值增大到65535*(2^14)。
窗口扩大选项是在TCP建立之初进行协商,如果已实现了窗口扩大,当不再需要
扩大窗口时,发送移位值=0就可以恢复到原窗口大小,即65535。
(3)选择确认选项(SACK, Selective Acknowledgements)
考虑这样情况,主机A发送报文段12345,主机B收到135且报文无差错,SACK用来
确保只重传缺少的报文段,而不是重传所有报文段。
SACK选项需要2个功能字节,一个用来指明使用SACK选项(SACK Permission),
另一指明这个选项占多少字节。
那怎么形容丢失的报文段2,说明2的左右边界分别是1、3。TCP的数据报文是有
字块边界的,而这种边界是由序列号表示的。
  www.2cto.com  
最多能指明多少个字节块的边界信息呢?答案是4个。这是因为选项字段最大是40
字节,去除2个功能字节,序列号是32位即4字节,并且需要左右边界,所以
(40-2)/8 = 4。
(4)时间戳选项(timestamps)
时间戳选项用来计算往返时间RTT,发送方在发送报文段时把当前时钟的时间值
放入时间戳字段,接收方将该时间戳字段的值复制到确认报文中,当接收方收到
确认报文,对比确认报文的时间戳(等于发送方发送报文段的时间戳)和现在的时钟,
即可算出RTT。
时间戳选项还可用于防止回绕序号PAWS。序列号只有32位,每2^32个序列号就会
回绕(想想环形队列),采用时间戳选项很容易区分相同序列号的报文段。
(5)NOP(NO-Operation)
TCP的头部必须是4字节的倍数,而大多数选项不是4字节倍数,不足的用NOP填充。
除此之外,NOP也用于分割不同的选项数据,如窗口扩大选项和SACK之间使用NOP
隔离(下面的实例将看到这一点)。
 
三、实例解析
3.1 概述
还是以访问百度首页为例,首先用DNS协议将URL解析成IP地址,接着在客户机和服务
器间建立TCP连接,用Wireshark俘获的分组如下图:
图4 Wireshark俘获建立TCP连接分组
你一看会觉得有些奇怪,理论上应该是3个分组的,怎么有6个分组?先不急,先把这6个
报文收发示意图作出来(结合时间和报文含义),如下:
图5 TCP连接建立实例
从图可知,连接建立伊始,客户机发了两个报文段,这也许是为了更快建立连接(假设有
个请求报文段丢失,也不至于要等一段时间,重发报文)。接下来,以19、21、22(上图
红色线条所示)分析TCP连接建立过程。
3.1 第一次握手19
Wireshark俘获TCP连接第一次握手的报文段如下:
图6 TCP连接第一次握手实例
这里主要挑几个字段分析:
标志字段,SYN=1、ACK=0表示该数据段没有使用捎带的确认域。
最大报文段长度(MMS)1460是怎么来的,链路层的以太网物理特性决定数据帧长度为
1500(即MTU,最大传输单元),1460=1500-20(IP首部长度)-20(TCP首部长度)。不要被
该报文首部长度32字节所迷惑,这只是建立连接过程。MSS与MTU关系见下图[2]:
图7 MSS与MTU关系
NOP字段,可以作为不足4倍数字节填充,也可作为选项间分隔,该报文段出现了3个
NOP,具体功能见下图:
图8 TCP报文NOP字段
3.3 第二次握手21
服务器响应客户端TCP报文段,此时确认号为1了,SYN=1、ACK=1表明连接应答捎
带一个确认,Wireshark俘获分组如下:
图9 TCP连接第二次握手实例
为什么MSS是1452而不是1460?这是因为使用PPPoE(Point-to-Point over Ethernet,
可以使以太网的主机通过一个简单的桥接设备连到一个无端的接入集中器上[3])拨号上网,
PPoP首部是8个字节,所以PPPoE的MTU是1492,MSS也就为1492-40=1452。
那么,TCP连接建立后数据传输的MSS是多少呢,1460 or 1452 or 536 ?我的理解是
默认值536,这样理解对吗?求指点!
  www.2cto.com  
3.4 第三次握手22
客户机再次服务器的报文段,此时序列号和确认号都为1,没有选项字段,Wireshark
俘获的分组信息如下:
图10 TCP连接第三次握手实例
值得注意的,因为窗口扩展大小协商未果,所以就不扩大窗口了,即窗口大小最大
为65535。
 
如此,TCP连接建立:-)
 
 
相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
5月前
|
缓存 网络协议 Linux
手把手实现tcp/ip用户态协议栈,帮你实践网络知识(网络必备,面试项目)
手把手实现tcp/ip用户态协议栈,帮你实践网络知识(网络必备,面试项目)
|
2天前
|
网络协议 Java API
深度剖析:Java网络编程中的TCP/IP与HTTP协议实践
【4月更文挑战第17天】Java网络编程重在TCP/IP和HTTP协议的应用。TCP提供可靠数据传输,通过Socket和ServerSocket实现;HTTP用于Web服务,常借助HttpURLConnection或Apache HttpClient。两者结合,构成网络服务基础。Java有多种高级API和框架(如Netty、Spring Boot)简化开发,助力高效、高并发的网络通信。
|
4月前
|
网络协议 Java 程序员
java网络编程什么是TCP/IP协议栈?
java网络编程什么是TCP/IP协议栈?
32 2
|
5月前
|
存储 网络协议 安全
深入解析TCP/IP协议栈:了解网络通信的核心
深入解析TCP/IP协议栈:了解网络通信的核心
|
5月前
|
存储 网络协议 API
网络编程必备:深入理解TCP/IP协议栈(含posix API实现)(下)
网络编程必备:深入理解TCP/IP协议栈(含posix API实现)
|
5月前
|
网络协议 算法 API
网络编程必备:深入理解TCP/IP协议栈(含posix API实现)(上)
网络编程必备:深入理解TCP/IP协议栈(含posix API实现)
|
5月前
|
缓存 网络协议 Unix
最详细的Linux TCP/IP 协议栈源码分析
最详细的Linux TCP/IP 协议栈源码分析
|
11月前
|
消息中间件 网络协议 安全
TCP/IP 应用层常用协议
TCP/IP 应用层常用协议
291 0
|
网络协议
TCP/IP 协议栈是干什么的?底层原理是什么?
TCP/IP 协议栈是干什么的?底层原理是什么?
179 0
|
负载均衡 网络协议 网络安全
TCP/IP:有层次的协议栈
TCP/IP:有层次的协议栈
175 0
TCP/IP:有层次的协议栈