一、基础概念
1.内存分类
内存分为两部分,一部分分给内核使用,另一部分分给用户使用。为什么要这么划分,因为内核作为操作系统的核心,他理论上拥有更大的权限以及应该受到更高级别的保护,所以它使用的内存应该单独区分出来,以防app对其造成不必要的伤害。
元帅拥有自己的一支禁卫军,这支禁卫军非常值得信赖,完全不担心被策反(病毒感染)。相反,普通军队(用户内存)就比较容易被策反。这就是拥有一套自己的禁卫军的必要性。
2.进程切换
内核是整个系统的中心,所以他拥有对线程操作的权利,有能力挂起,也有能力恢复。
在对线程进行切换的时候,需要保存各种现场信息,为了方便对进程进行管理,将相关的数据、命令等进行封装,数据结构称之为PCB(process control block)。
当内核将一个进程在CPU上挂起,唤醒另一个进程执行的时候,需要处理大量的上下文切换,总之就是很繁琐,很复杂,很蛋疼。
元帅是所有军队的统领,拥有调度小分队是否继续,是否暂停,是否回复当前任务的权利。
当更换小分队执行任务的状态的时候,需要告诉小分队的头头,小分队的leader,小分队的供给部队,小分队的武器提供部队,小分队的监督部队,总之就是需要告诉方方面面。为了方便管理,就把这些部分统一管理起来,形成一个单元进行统一的操作,而不是东一榔头,西一棒槌,高效一些。这个单元就是PCB。
3.进程的阻塞
当进程的要求获得的一部分资源没有到位的时候,就会导致当前进程无法继续执行,这个时候,进程会自动执行阻塞原语,并且释放掉正在占用的CPU资源。
当小分队执行刺杀/绑架/解救任务的时候,发现武器资源/食品资源等资源没有到位,就只能暂停掉当前任务,并且把元首分配的任务符(CPU)还给元首,等资源到位了,再听元首的安排。
元首的任务符是有限的,因为元首的管理能力是有限的,不能无限制的增加正在执行任务的个数,这样子的话,容易导致任务失控。
4.文件描述符
文件描述符是一个非负的索引值,是内核所维护的关于一个进程操作一个文件的一份记录。
资源物品清单,是元首在分配每个行动的时候,为每个行动记录分配了怎样的人员、多少的装备和武器,所以也可以理解为任务详情表。也就是档案,比如某某年,某某月,派出了某某人手,带了哪些物资,刺杀了哪位要员。
5.缓存IO
缓存IO也称为标准IO,操作系统通过流方式读取文件时,一般会先把文件读取到页缓存中,而页缓存在内核内存中,当应用使用的时候,再把数据从内核内存读取到应用内存。所以缺点很明显,数据需要进行多次复制,且占用宝贵的内存资源,消耗CPU。
文件IO流,就可以理解为缴获的物资啊、情报啊、等等进项。有了这些好东西,当然要先紧着元首使用了,元首的优先级最高嘛,所以要先把缴获的物资等等,放到内核内存中,元首先处理,处理完了,再留给下级处理。
二、IO模型
正如上面所言,一个应用程序进程如果需要获取数据,
第一步:等待数据传输到内核内存中。
第二步:等待数据从内核内存中,copy到进程中。
因为以上两个步骤,所以产生了五种态度
- 阻塞IO
- 非阻塞IO
- I/O多路复用
- 异步IO
- 信号驱动IO
1. 阻塞IO
当数据从流中,拷贝到内核内存,再从内核内存拷贝到应用程序内存。这两段时间内,进程都会主动选择阻塞。
这个小分队比较无自主能动性且不积极,元首不给命令就不会干点别的准备动作,迂腐,垃圾。
2. 非阻塞IO
进程会轮询内核内存,数据是否准备ok。ok的话返回OK,不ok的话返回error。当进程收到error的时候,就继续轮询内核内存...子子孙孙无穷尽
非阻塞IO可烦人了,一直在不断地问问问,虽然能显出你积极,但是也可烦人消耗性能。
3. 多路复用IO
首先强调一点,多路复用IO是一个进程对应多个IO。进程首先会调用select,然后选择阻塞。调用select的目的就是,当对应的IO中有任何一个完成拷贝数据到内核内存的时候,就会return readable给进程,然后进程继续选择block,等到数据从内核内存拷贝到应用程序内存。
其实当IO连接数比较低的时候,多路复用IO的性能还可能比不上Block IO,但是multiplexing IO天生就是处理大场面的,处理多IO连接的场景。当IO数较大时,能够使得一个进程处理多个IO连接。棒棒哒。
类似于统筹,比如你要看十个视频,每个视频都有广告。当你看完一个视频,再去看下一个视频,你需要看十次广告。但是如果你先把所有的视频都点开,让广告同时播放,这样子你就只用浪费一个多广告的时间,就可以无广告的看完所有的十个视频,效率立判高下。
4. 异步IO
进程会发起aio_read命令,然后会立刻返回,这样进程不会选择阻塞,而是继续执行。内核在收到aio_read命令后,会主动的把数据进行两次拷贝,然后通过signal告诉进程,完成了。
这样的进程就相当于高级小分队,任务比较忙耽误不得,并且有一个秘书负责信息的接受,秘书接受完信息后,会通知小分队。而在这期间,小分队继续执行其他任务。
注意
同步异步IO指的是数据从内核内存拷贝到用户内存的过程中,进程的状态。所以 block IO、non-block IO、multiplexing IO都属于同步IO,只有asynchronous IO,属于真正的异步IO。