十一、我所理解的 Socket

Socket 理解

参考:
书籍《TCP / IP 协议族》
https://blog.csdn.net/u014306335/article/details/81277547
http://www.ruanyifeng.com/blog/2012/05/internet_protocol_suite_part_i.html

0. 前言

提起 Socket ,大家都说是什么 套接字、进程间通信、对 TCP / IP 协议进行封装的编程调用接口 balabala 的,说真的,刚接触的时候,真的是一脸懵逼,实在是不理解套接字到底是什么意思。然而最近的我貌似懂了点,也有可能是以前根本没认真看书吧。现在至少能理解它究竟是个什么东西了。

想要理解 Socket,我们得先弄懂一些网络的基础知识,要不然是无法理解的。比如两台电脑究竟是怎样通信的,希望你能先去看看 阮一峰老师的 互联网协议入门
我相信你看完后再理解 Socket 应该是不难的了。

1. 网络基础

1.1 计算机网络分层

看了阮一峰老师的 互联网协议入门,我相信你已经知道计算机网络分为五层:物理层、数据链路层、网络层、运输船、应用层

TCPIP五层网络架构.png

其中:

  • 物理层 :把电脑连接起来的物理手段,用于传送 0 和 1 的电信号。
  • 数据链路层 :由于单纯的 0 和 1 电信号没有任何意义,因此出现了 以太网协议,它将这些电信号分组,一组电信号构成一个数据包,叫做 ,并且我们还知道这一层会把 MAC 地址 包含在 帧 的标头(Head)。
  • 网络层 :在数据链路层,我们可以通过广播的方式发送数据,但是规定收发双方得在同一个 子网络,那不同子网络的两台计算机是无法通过广播通信的。因此网络层的诞生就是为了使我们区分不同的计算机是否属于同一个子网络,它引进了新的地址概念,叫做网络地址,即网址。 规定网络地址的协议叫做 IP 协议。那么我们此时拥有了 IP 地址。
  • 运输层 :有了 MAC 地址IP 地址 我们已经可以在互联网上任意两台计算机之间建立通信了。但是运行在不同计算机上的两个程序还无法通信。也就是说,我们还需要一个参数,表示这个数据包到底供哪个程序(进程)使用。这个参数就叫做"端口"(port),它其实是每一个使用网卡的程序的编号。每个数据包都发到主机的特定端口,所以不同的程序就能取到自己所需要的数据。既然要往数据包加 端口信息,那就需要新的协议了,最简单的就是 **UDP 协议 **了,当然还有我们的 TCP 协议
  • 应用层 :规定应用程序的数据格式。

1.2 套接字地址

有了这些基础知识,那我们现在来讲讲这个 套接字地址 了。

TCP 协议在建立连接时,需要在连接的两端同时使用 IP 地址 和 端口号。
IP 地址端口号 的组合就称为 套接字地址(socket address)

客户套接字地址 唯一的定义了一个客户进程。
服务器套接字地址 唯一的定义了一个服务器进程。

现在你知道当客户进程和服务器进程通信时,为什么可以用 socket 了吧,通过 TCP 协议,我们可以知道两端的哪两个进程需要通信,然后再通过网络层、数据链路层、物理层 完成我们的通信。

套接字地址.png

2. Socket 的理解

网络分层协议是很有意思的,我们现在知道一个数据包在网络中是怎样传输的,而分层协议,让我们只需专注于本层的任务即可,当一个数据包从应用层传到运输层时,诶,没错,你的疑惑来了,一个数据包怎么从应用层传到运输层??? 我们把应用层理解为我们的进程哈,比如我们的 java 程序,方便理解哈,不用较真。

问题是 我们怎么把数据从 java 程序 传给运输层呢? 只要我们的数据传给运输层了,运输层自然会把数据接着一层一层往下传,这些就不是我们关心的了,它们对我们应用层是透明的了。

首先 我们知道一个计算机程序就是一组预先定义的指令,它们告诉计算机要做什么。比如一个计算机程序中有用于数学运算的指令集合,有用于处理字符的指令集合,也有处理 输入/输出 访问的指令集合。 如果想让一个程序与运行在另一台主机上的程序之间能够通信,我们就需要定义一个 新的指令集和 来告诉运输层打开连接,发送数据、接收数据,关闭连接等操作。这种类型的指令集合通常被称为接口。

接口 就是为了两个实体之间的交互而设计的指令集合。

所幸,人们已经为计算机通信设计了若干接口,其中有三个接口是通用的:套接字接口(socket interface)、运输层接口(transport layer interface)、STREAM。

套接字接口 位于操作系统和应用程序之间,所以,应用程序如果想要接入由 TCP/IP 协议族提供的服务,就必须使用在套接字接口中定义的指令,即 socket 编程。

套接字位置.png

3. Socket 数据结构与函数

现在你已经知道了为什么要用 套接字接口 以及 套接字地址 的概念。 那么它在你眼中已经并不那么神秘了,无非就是个接口而已,说白了理解起来就是个 API 嘛,直接调用就好了。为什么要调这个 API? 为了将数据传给运输层,利用 TCP 协议进行通信。

接下来我们再剥一剥,socket 到底是个什么结构定义。

3.1 数据结构

这里讲的是 C 语言中定义的数据结构。

struct socket
{
    int family;        //族
    int type;          //类型
    int protocol;      //协议
    socketaddr local;  //本地套接字地址
    socketaddr remote; //远程套接字地址
}

是的,这就是 socket 的数据结构的定义,对,就是这么简单。

  • 族 :这个字段定义了一个协议组:IPv4、IPv6、UNIX 主域协议等。在 TCP/IP 中我们使用的族类型的定义是:用常量 IF_INET 来表示 IPv4 协议,用常量 IF_INET6 来表示 IPv6 协议。
  • 类型 :定义了四种类型的套接字:SOCK_STREAM(用于 TCP),SOCK_DGRAM(用于 UDP),SOCK_SEQPACKET(用于 SCTP),SOCK_RAW(用于直接使用 IP 服务的应用),如下图所示。
  • 协议 :这个字段定义了接口使用的协议。对于 TCP/IP 协议族,它被设置为 0 。
  • 本地套接字地址 :就是前面讲的 套接字地址的概念,即 IP 地址 和 端口号 的组合。
  • 远程套接字地址 :同上。
套接字类型.png
3.2 函数

socket 有很多函数,这里只说说函数名和一点作用,函数参数就不贴了,当然也是基于 C 语言的。

  • socket 函数 : 创建套接字
  • bind 函数 : 将本地计算机和本地端口绑定到该套接字
  • connect 函数 : 用于向套接字结构中添加远程套接字地址
  • listen 函数 : 只能被 TCP 服务端调用。 在 TCP 创建并绑定好套接字后,它必须通知操作系统说套接字已经准备好,可以接收客户的请求了
  • accept 函数 : 是一个阻塞函数,一旦被调用后,会阻塞自己,直到客户的连接建立起来。
  • fork 函数 : 被进程用来复制自己,创建子进程
  • send 和 recv 函数 : 发送数据、接收数据,用于 TCP
  • sendto 和 recvfrom 函数 : 发送数据、接收数据,用于 UDP
  • close 函数 : 关闭一个套接字

4. TCP

前面说了很多,相信你对 socket 有了一定的了解,那么你也知道 socket 是针对应用层和运输层之间的接口调用函数,而运输层有好几种协议,所以针对每种协议,调用 socket 的函数也是不一样的,用的最多的当然是 TCP 和 UDP 了。 这里不详细讲解了,因为 TCP 协议可不是一篇博客能讲完的,而且网络上有很多优秀的资料了。这里就简单的阐述下 理解报文段的注意点吧。

首先我们知道 TCP 是面向连接的协议,所以传输需要经过三个阶段:连接建立、数据传输和连接终止。

当我们学习 连接建立 时需要注意的地方:

  • TCP 报文段的首部中 有两个字段叫做 序号确认号
  • 三次握手发送的报文段中, seq 就是序号ack 就是确认号
  • TCP 报文段的首部中 还有个字段叫 控制字段 或 标志,它定义了 6 种不同的控制位,如下所示
  • 所以在别人描述的三次握手过程中,看到 SYN = 1,ACK = 1 就知道其实是将 标志位 置 1
tcp控制字段.png

连接终止

大多数 TCP 实现允许在连接终止时有两种选择:三次握手和 具有半关闭的四次握手。

使用三次握手的连接终止:

  • 连接双方会立即停止 收发 数据。

使用四次握手的连接终止:

  • 连接的一方可以停止发送数据,但仍然可以接收数据,这就称为 半关闭

最后放上 连接建立和半关闭终止的时间线图。

TCP 连接.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容

  • 什么是Socket Socket是进程通讯的一种方式,即调用这个网络库的一些API函数实现分布在不同主机的相关进程...
    onlyHalfSoul阅读 665评论 0 1
  • 1.1 TCP/IP协议组 TCP/IP协议(传输控制协议)由网络层的IP协议和传输层的TCP协议组成 IP层负责...
    F麦子阅读 2,786评论 0 25
  • 文章首发于个人blog欢迎指正补充,可联系lionsom_lin@qq.com原文地址:《网络是怎样连接的》阅读整...
    lionsom_lin阅读 14,141评论 6 31
  • 一、网络各个协议:TCP/IP、SOCKET、HTTP等 网络七层由下往上分别为物理层、数据链路层、网络层、传输层...
    杯水救车薪阅读 2,262评论 0 17
  • 1. echo是PHP中的输出语句,可以把字符串输出(字符串用双引号括起来)。 如下代码: <?php echo ...
    jiegiser阅读 261评论 0 1