一、Socket概述
Socket通信是大家耳熟能详的一种进程间通信方式(IPC Inter-Process Communication),它是一种全双工的通信方式.
Socket是一种终端,可以使同一台操作系统上的两个或多个进程进行数据通信。
1、Internet domain socket
用于主机间(不同主机或同一主机)的通信
只需对方的ip地址和端口就可以通信
通信是基于网络协议栈的。
类似打电话一样只要知道对方手机号就可以通话。
2、Unix domain socket
用于一台主机的进程间通信
但它不使用网络底层协议来通信
基于文件(相同的文件路径)来进行通信
此文件是操作系统的实体文件
Unix Domain Socket是Unix系统下重要的本地进程间通信(IPC)机制之一,
在 DDE、GNOME、KDE 等 Linux 桌面环境中常见的进程间通信方式。
二、Socket详解
1、什么是Socket
进程通信的方法有管道、命名管道、信号、消息队列、共享内存、信号量,这些方法都要求通信的两个进程位于同一个主机。但是如果通信双方不在同一个主机又该如何进行通信呢?通过使用tcp/ip协议族来进行相应的通信,如下图(图片来源于《tcp/ip协议详解卷一》第一章1.3)
直接和各个不同协议进行通信时就要使用不同的接口,还需处理不同协议的各种细节,开发难度大大增加,不易扩展。于是UNIX BSD就发明了socket这种东西,socket屏蔽了各个协议的通信细节,无需关注协议本身,直接使用socket提供的接口来进行互联的不同主机间的进程的通信。
举个例子:类似我们业务开发中不同业务渠道调用api网关接口,api网关自动为我们匹配不同的路由逻辑来处理不同的业务。
Socket就实现了这种功能,提供了Tcp/Ip协议的抽象,对外提供了一套接口,同过这个接口就可以统一的使用Tcp/Ip协议的功能了。
2、什么是文件描述符
文件描述符(file descriptor)通常是一个小的非负整数,内核用以标识一个特定进程正在访问的文件。当打开一个现有文件或创建一个新文件时,内核向进程返回一个文件描述符。当读、写一个文件时,使用 open 或 create 返回的文件描述符标识该文件,将其作为参数传送给 read 或 write。
每个进程在PCB(Process Control Block)中保存着一份文件描述符表,文件描述符就是这个表的索引,每个表项都有一个指向已打开文件的指针。
传递文件描述符还是有它的必要性的。
一方面,文件描述符代表的不只是一个文件,它还包含了文件打开的状态,比如 seek 的位置等,有点进程之于可执行程序的意思,拿到文件描述符也就拿到了这些动态的信息;
一方面,文件描述符不只对应于本地文件,它为了一众可读写对象提供了统一的读写接口,包含什么呢?本地文件、(匿名)管道、标准输入输出、甚至于 Socket 本身等……可以让你完全不关心文件描述符背后的实现是什么而方便实现自己的逻辑代码。
3、socket细节设计
unix的哲学: 一切皆文件。socket被理所当然的设计成了文件,通过描述符我们可以定位到具体的file结构体,file结构体中有个f_type属性,标识了文件的类型,如图,DTYPE_VNODE表示普通的文件DTYPE_SOCKET表示socket,当然还有其他的类型,比如管道、设备等,这里我们只关心socket类型。如果是socket类型,那么f_ops域指向的就是相应的socket类型的驱动,而f_data域指向了具体的socket结构体,socket结构体关键域有so_type,so_pcb。
Socket工作模式, so_type常见的值有:
SOCK_STREAM 提供有序的、可靠的、双向的和基于连接的字节流服务,当使用Internet地址族时使用TCP。
SOCK_DGRAM 支持无连接的、不可靠的和使用固定大小(通常很小)缓冲区的数据报服务,当使用Internet地址族使用UDP。
SOCK_RAW 原始套接字,允许对底层协议如IP或ICMP进行直接访问,可以用于自定义协议的开发。
so_pcb表示socket控制块,其又指向一个结构体,该结构体包含了当前主机的ip地址(inp_laddr),当前主机进程的端口号(inp_lport),发送端主机的ip地址(inp_faddr),发送端主体进程的端口号(inp_fport)。
so_pcb是socket类型的关键结构,不亚于进程控制块之于进程,在进程中,一个pcb可以表示一个进程,描述了进程的所有信息,每个进程有唯一的进程编号,该编号就对应pcb;socket也同时是这样,每个socket有一个so_pcb,描述了该socket的所有信息,而每个socket有一个编号,这个编号就是socket描述符。
三、Nginx中fastcgi_pass的配置方式
Nginx中fastcgi_pass的2种配置方式: unix domain socket和TCP Socket
- TCP Socket:网络地址进行寻址和访问的套接字【ip:port】, 可以跨服务器
- UNIX Domain Socket:文件系统进行寻址和访问的套接字【.sock文件】
其中NIX Domain Socket只能用于Nginx跟PHP-FPM都在同一服务器的场景.
Unix domain socket和Tcp socket,在性能上没有显著差距。
当访问压力较小时,可以使用UnixSocket,因为不会占用额外的端口、且理论上效率较高。
当高并发的时候,Tcp Socket能表现出更高的稳定性,且性能并不差于Unix Socket,缺点是会占用大量的临时端口,需要用内核参数优化。
参考
1、unix domain socket
2、unix domain sockets vs. internet sockets
3、socket Linux Programmer's Manual
4、unix domain sockets vs. internet sockets
5、nginx、php-fpm默认配置与性能–TCP socket还是unix domain socket