一. 背景
计算机中的所有内容都会用二进制来表示,我们在使用js的时候很少去直接处理assets(网页端由浏览器来处理).
但对服务器来说比较麻烦, 服务器处理的本地文件类型较多, 比如说保存文本的文件并不是使用utf-8进行编码的, 而使用GBK, 那么我们必须读取到他们的二进制数据, 再通过GKB转换成对应的文字.
比如我们需要读取一张图片数据(二进制), 再通过某些手段对图片数据进行二次的处理(裁剪转换等等), Node中有一个Sharp的库, 就是读取图片或者传入图片的Butter对其在进行处理.
比如Node中通过TCP建立长链接, TCP传输的是字节流, 我们需要将数据转成字节在进行传入, 并且需要知道串数字内的大小(客户端需要根据大小来判断读取多少内容).
二. Buffer
Buffer中存储的是二进制数据, 我们可以将Buffer看成是一个存储二进制的数组. 其中每一项可以保存8位二进制数据, 0000 0000.
-
如何将一个字符串放入到Buffer中呢 ?
创建一个Buffer
// 这里可以直接引用buffer来进行修改
const buffer = Buffer.alloc(8);
buffer[0] = 88;
buffer[1] = 136;
buffer[2] = 0x88;
-
处理图片
三. 事件循环和异步IO
可以将其理解为我们的js代码和浏览器/Node之间的一个桥梁.
浏览器的时间循环是js代码和浏览器API调用(setTimeout/AJAX/事件监听等)的一个桥梁, 桥梁之间他们通过毁掉函数进行沟通.
Node 的事件循环是js代码和系统调用(file system, network等)之间的一个桥梁, 通过回调函数进行沟通.
四. 线程和进程
复习下相关概念.
进程(process): 计算机中已经运行的程序;
线程(thread): 操作系统能够运行运算调度的最小单元
可以之间理解为, 进程是线程的容器.
打个比方: 工厂(计算机) — 车间(进程) — 工人(线程)
CPU运算速度非常快, 可以在多个进程之际嗯迅速切换, 当进程中的线程获取到时间片的时候, 就可以快速执行我们的代码.
js是单线程的, 它的进程容器就是浏览器或者是Node.
五. 浏览器的事件循环
简单介绍一下, 如果在执行js的时候有异步操作, 这时候调用站中的main容器已经弹出, 为什么setTimeout没有被影响呢?
-
setTimeout是调用了web api, 在合适的时机, 会将timer函数加入到一个事件队列中, 其中的函数会被放入到调用栈中, 在调用栈中被执行.
下面的图来自coderwhy老师, 其中涉及到了事件队列与宏任务(macrotask)微任务(microtask)队列.
宏任务队列: ajax, setTimeout, setInterval, DOM监听, UI Rendering
微任务队列: Promise的then, Mutation Obsever API, queneMicrotask()等
先微后宏, 在宏任务中对涉及到的微任务加入到微任务队列中, 我们每个代码文件是一个宏任务.
六. 阻塞IO和非阻塞IO
- 操作文件需要通过 - 文件描述符, 先来打开文件. 实际上程序中的文件操作都是需要进行系统调用(操作系统的文件系统).
- os通常提供两种调用方式, 阻塞和非阻塞调用
- 阻塞式调用: 调用结果返回前, 线程处于阻塞态, 不会被分配时间片.
- 非阻塞式调用: 调用执行后, 当前线程不会停止执行, 只需要隔段时间检查返回结果.
- 开发中很多耗时操作都可以基于非阻塞式调用, 比如说Socket通信, Socket本身提供了select模型, 可以进行非阻塞方式的工作; 比如文件的IO操作, 我们可以使用操作系统提供的基于事件的回调机制.
非阻塞式IO的问题:
- 我们并没有读取到结果, 那就意味着我们需要通过轮询来进行数据完整性检测, 这样性能会降低.
- 开发中不只一个文件的读写, 而是多个文件.
libuv提供了一个线程池(worker pool):
线程池负责所有的相关操作, 通过轮询获取它方式等待结果; 当获取到结果时, 就能将对应的回调放到事件循环(某个时间队列)中; 事件循环就可以负责接管后续的回凋工作, 告知js执行后续操作.
七. 阻塞和非阻塞, 同步和异步的区别?
阻塞和非阻塞一般是针对被调用者来说的
-
系统调用为我们提供了阻塞调用和非阻塞调用;
同步和异步针对调用者来说的 - 我们在发起调用之后, 不会进行其他任何的操作, 只是等待结果.
- 我们在发起调用之后, 并不会等待结果, 继续完成其他的工作, 等到有回调时再去执行.
八. Node事件循环的阶段
相比浏览器事件循环要复杂一点, 浏览器中子进程, 文件读写少一点.
事件循环更像是桥梁, 是连接着应用程序的js和系统调用之间的桥梁.
- 无论文件IO, 数据库, 定时器, 子进程, 在完成前函数都会呗放到事件循环(任务队列)中.
一次完整的事件循环分为很多阶段:
- 定时器(timers): 本阶段执行已经被setTimeout()和setInterval()的调度回调函数.
- 待定回调(pending callback): 对某些系统操作(如TCP错误类型)执行回调, 比如TCP链接时接收到ECONNREFUSED.
- idle, prepare: 仅系统内部使用.
- 轮询(poll): 检索新的I/O事件; 执行与I/O相关的回调.
- 检测: setImmediate()回调函数在这执行.
- 关闭的回调函数: 一些关闭的回调函数, 如: socket.on('close', ...).
Node中有五个队列, 从上往下依次执行
- ticks:
- 其他微任务:
- timers队列(setTimeout):
- io队列:
- setimmediate:
具体的这里就不细讲了,有兴趣可以去官网看看, 或者和我交流.