网络编程主要关注3个半事件:连接建立(client连接/连接第三方服务);连接断开,消息达到,消息发送完毕。
TCP网络服务模型,redis,nginx,memcached
1 阻塞,非阻塞区别:
- 阻塞io阻塞在哪? 阻塞在网络线程
- 什么决定阻塞?fcntl函数设置阻塞
- 具体内部差异: 网络io分为两个流程,数据准备阶段(网卡拷贝到内核空间),数据拷贝阶段(内核空间拷贝到用户空间),非阻塞是在数据准备阶段返回,但是在第二个阶段也还是阻塞的。
2 epoll
为何又多路复用?用一个线程检查多个io事件。
水平触发:io即可是阻塞也可以是非阻塞
边沿触发:只能是非阻塞
流程图:
epoll数据结构:
struct eventpoll {
// ...
struct rb_root rbr; // 管理 epoll 监听的事件
struct list_head rdllist; // 保存着 epoll_wait 返回满⾜条件的事件
// ...
};
struct epitem {
// ...
struct rb_node rbn; // 红⿊树节点
struct list_head rdllist; // 双向链表节点
struct epoll_filefd ffd; // 事件句柄信息
struct eventpoll *ep; // 指向所属的eventpoll对象
struct epoll_event event; // 注册的事件类型
// ...
};
struct epoll_event {
__uint32_t events;
epoll_data_t data; // 保存 关联数据
};
typedef union epoll_data {
void *ptr;
int fd;
uint32_t u32;
uint64_t u64;
}epoll_data_t;
接口
int epoll_create(int size);
size参数告诉内核这个epoll对象会处理的事件⼤致数量,⽽不是能够处理的事件的最⼤数。在现在linux版本中,这个size参数已经没有意义了;返回:epoll对象句柄;之后针对该epoll的操作需要通过该句柄来标识该epoll对象;
int epoll_ctl(int epfd, int op, int fd, struct epoll_event* event);
收集 epoll 监控的事件中已经发⽣的事件,如果 epoll 中没有任何⼀个事件发⽣,则最多等待 timeout 毫秒后返回。返回:表示当前发⽣的事件个数返回0表示本次没有事件发⽣;返回-1表示出现错误,需要检查errno错误码判断错误类型。
events 这个数组必须在⽤户态分配内存,内核负责把就绪事件复制到该数组中;maxevents 表示本次可以返回的最⼤事件数⽬,⼀般设置为 events 数组的⻓度;timeout表示在没有检测到事件发⽣时最多等待的时间;如果设置为0,检测到rdllist为空⽴刻返回;如果设置为-1,⼀直等待;
原理图
reactor
定义:
组成:⾮阻塞的io + io多路复⽤;
特征:基于事件循环,以事件驱动或者事件回调的⽅式来实现业务逻辑;
表述:将连接的io处理转化为事件处理;
单reactor模型
代表:redis 内存数据库 操作redis当中的数据结构
redis 6.0 多线程
单reactor模型 + 任务队列 + 线程池
代表 skynet
多reactor
应用: memcached accept(fd, backlog) one eventloop per thread
多进程
nginx
多reactor + 消息队列 + 线程池
业务场景中比较多 网络密集型 + 业务密集型
tcp转态图
epoll处理细节
个人推荐:
C/C++Linux服务器开发/后台架构师学习视频公开课
学习资料、教学视频和学习路线图(资料包括C/C++,Linux,golang技术,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享有需要的可以自行添加学习交流群