Socket理论知识
网络七层,由上到下分别是:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。(物数网传会表应)
其中物理层、数据链路层和网络层通常被称作媒体层,是网络工程师所研究的对象;
传输层、会话层、表示层和应用层则被称作主机层,是用户所面向和关心的内容。
- http协议对应于应用层
- tcp/udp协议对应于传输层
- ip协议对应于网络层
三者本质上没有可比性。
HTTP协议是基于TCP连接的。
TCP/IP是传输层协议,主要解决数据如何在网络中传输;
而HTTP是应用层协议,主要解决如何包装数据。
我们在传输数据时,可以只使用传输层(TCP/IP),但是那样的话,由于没有应用层,便无法识别数据内容,如果想要使传输的数据有意义,则必须使用应用层协议,应用层协议很多,有HTTP、FTP、TELNET等等,也可以自己定义应用层协议。
WEB使用HTTP作传输层协议,以封装HTTP文本信息,然后使用TCP/IP做传输层协议将它发送到网络上。
Socket是对TCP/IP协议的封装,Socket本身并不是协议,而是一个调用接口(API),通过Socket,我们才能使用TCP/IP协议。
什么是Socket
Socket又被称之为“套接字”,是系统提供的用于网络通信的方法。即网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端,称之为Socket。
它的实质并不是一种协议,没有规定计算机应当怎么样传递消息,只是给程序员提供了一个发送消息的接口,程序员使用这个接口提供的方法,发送与接收消息。
Socket描述了一个IP、端口对。它简化了程序员的操作,知道对方的IP以及PORT就可以给对方发送消息,再由服务器端来处理发送的这些消息。所以,Socket一定包含了通信的双方,即客户端(Client)与服务端(server)。
网络通信里的要素
- 网络上的请求就是通过Socke来建立连接,然后互相通信的。
- IP地址(网络上主机设备的唯一标识)
- 端口号(定位程序)
- 用于标示进程的逻辑地址,不同的进程的标示
- 有效端口:065535,其中01024是系统使用或是保留端口,开发使用1024以上
- 传输协议
- 常见协议:TCP、UDP
TCP(传输控制协议)
- 建立连接,形成传输数据的通道
- 在连接中进行大数据传输(数据大小不受限制)
- 通过三次握手完成连接,是可靠协议,安全送达
- 必须建立连接,效率会低
TCP是面向连接的、传输可靠(保证数据正确性且保证数据顺序)、用于传输大量数据(流模式)、速度慢,建立连接需要开销较多(时间,系统资源)。
TCP是一种流模式的协议,是面向连接的,也就是说,在连接持续的过程中,socket中收到的数据都是由同一台主机发出的(劫持什么的不考虑),因此,知道保证数据是有序的到达就行了,至于每次读取多少数据不关心。
要建立连接的方式,就是TCP方式(http)
TCP三次握手
所谓三次握手(Three-way Handshake),是指建立一个TCP连接时,需要客户端和服务器总共发送3个包。三次握手的目的是连接服务器指定端口,建立TCP连接,并同步连接双方的序列号和确认号并交换TCP窗口大小信息。在socket编程中,客户端执行connect()时,将触发三次握手(图片来源于网络):
SYN(synchronous)是同步标志;ACK (Acknowledgement)是确认标志,seq是序列号。
- 第一次握手:客户端发送一个TCP的SYN标志位置1的包,指明客户打算连接的服务器的端口,以及初始序号X,保存在包头的序列号字段里。
- 第二次握手:服务器发回确认包(ACK)应答。即SYN标志位和ACK标志位均为1同时,将确认序号设置为客户的序列号加1以,即X+1。
- 第三次握手:客户端再次发送确认包(ACK) SYN标志位为0,ACK标志位为1。并且把服务器发来ACK的序号字段+1,放在确定字段中发送给对方.并且在数据段放写序列号的+1。
比如:A给B打电话,B:喂(第一次响应)A:喂(第二次响应)老王啊。。。(第三次响应)
TCP客户端-服务器程序设计基本框架
UDP(用户数据报协议)
- 将数据及源和目的封装成数据包中,不需要建立连接
- 每个数据报的大小限制在64K之内
- 无需连接(不通过三次握手),因策是不可靠协议
- 不需要建立连接,速度快
UDP是面向无连接、传输不可靠、用于传输少量数据(数据包模式)、速度快的传输层协议。注意,UDP传输的是数据报包,而TCP是流。
UDP是面向无连接的协议,只要知道接收端的IP和端口,且网络是可达的,任何主机都可以向接收端发送数据。这时候,如果一次能读取超过一个报文的数据,则会乱套。
比如,主机A向发送了报文P1,主机B发送了报文P2,如果能够读取超过一个报文的数据,那么就会将P1和P2的数据合并在了一起,这样的数据是没有意义的。
UDP的使用,比如广播
UDP客户端-服务端程序设计基本框架
Socket通信过程
每一个应用或是服务都有一个端口。比如DNS的端口号53,http的端口号80都是对应一个应用或者服务的端口。我们能由DNS请求到查询信息,是因为DNS服务器时时刻刻都在监听53端口,当收到我们的查询请求以后,就能够返回我们想要的IP信息。所以,从程序设计上来讲,应该包含以下步骤:
- 服务端利用Socket监听端口
- 客户端发起连接
- 服务端返回信息,建立连接,开始通信
- 客户端,服务端断开连接
Socket原理
Socket是通讯的根本,是支持TCP/IP协议的网络通信的基本操作单元。它是网络通信过程中端点的抽象表示,包含进行网络通信必须的五种信息:连接使用的协议,本地主机地址的IP地址,本地进程的协议端口,远地主机的IP地址,远地进程的协议端口。
应用层通过传输层进行数据通信时,TCP会遇到同时为多个应用程序进程提供并发服务的问题。
多个TCP连接或多个应用程序进程可能需要通过同一个TCP协议端口传输数据。
为了区别不同的应用程序和连接,许多计算机操作系统为应用程序与TCP/IP协议交互提供了Socket接口。
应用层可以和传输层通过Socket接口,区分来自不同应用程序进程或网络连接的通信,实现数据传输的并发服务。
Socket连接
建立Socket连接至少需要一对套接字,其中一个运行与客户端,称之为ClientSocket;另一个运行于服务端,称之为ServerSocket。
Socket之间的连接过程分为三个步骤:
- 服务器监听:服务器端套接字并不定位具体的客户端套接字,而是处于等待连接的状态,实时监控网络状态,等待客户端的连接请求
- 客户端请求:指客户端的套接字提出连接请求,要连接的目标是服务器端的套接字。为此,客户端的套接字必须首先描述它要连接的服务器的套接字,指出服务器端套接字的地址和端口号,然后就向服务器端套接字提出连接请求
- 连接确认:当服务器端套接字监听到或者说接收到客户端套接字的连接请求时,就响应客户端套接字的请求,建立一个新的线程,把服务器端套接字的描述发给客户端,一旦客户端确认了此描述,双方就正式建立连接。而服务器端套接字继续处于监听状态,继续接收其他客户端套接字的连接请求