Nginx+Openssl+Intel QAT异步密码调用研究

在我们还在关注网络IO的时候,Intel已经在搞密码IO了。不得不说老外在技术上确实比较NB。国内的密码应用比老外还是差了一截。

前段时间基于openssl(版本比较老,好像是1.0.x吧,等我做完已经1.1.1了)开发了个SSL产品,稍微考虑和实现了一下密码计算的IO问题。

技术的创新(如果这也算的话)都是逼出来的,大致上都与性能有关。在开发时,采用的是流水线工作方式,一个线程绑定一个核(Tilera平台)。最后发现一个问题:CPU核不够用。为啥:一个核对应了一路硬件资源(加解密),要把所有的硬件资源用起来,CPU核不够了。

于是先解决SSL加解密核不够用的问题,想法很简单:加解密不能阻塞。SSL调用加解密后,立即返回,后面再继续往下做。这样,每个核可以对应多个加解密硬件资源,减少核需求。

那么,问题来了:

问题1 :如何保存现场和恢复现场。怎么解决呢?现在想来还是有点幼稚(知识面还是窄),也很老土(后面有更好的方法),也是相当的麻烦,那就是:在SSL中添加数据结构,手工保存需要保存的一些变量。折腾了一下,也算完成。

问题2:什么时候去恢复现场?Openssl的SSL_read和SSL_write函数,在遇到网络IO时,会返回PENDING,然后需要用户二次调用。我也学它吧。修改源码,在加密和解密时会也返回一个ENC/DEC_PENGDING错误,加解密函数需要后面继续二次调用,才能完成。恢复现场的时机,在我这里其实变成了轮询。

当加解密搞完之后,本想把SSL握手过程也这么搞一遍。发现这是一个不可能完成的任务,因为握手里面的状态(以调用密码运算为分割点)太多了。

后来查了下网上的资料,发现intel已经搞定了。

如果密码接口这一层要改成异步的话,所有的上层调用都需要支持。

intel 提供QAT硬件,并开源了软件实现;

openssl从1.1.0开始,支持异步,很好的解决了保存现场,恢复现场,以及何时去恢复现场的问题;

intel 提供了qat的openssl引擎;

intel为nginx做了修改,基于事件驱动,将openssl引擎用了起来,支持异步。

先说说intel的QAT是如何支持异步的。他所有的密码运算接口,都有一个回调函数和上下文。当密码运算完成时,该回调函数会被调用。在intel 的qat引擎中,该函数会写一个由eventfd创建的句柄,通知fd监视者,这样就解决了“恢复时机”的问题。

至于保存和恢复现场,由openssl的异步接口实现:ASYNC_start_job和ASYNC_pause函数实现。ASYNC_start_job用于启动或者恢复任务。ASYNC_pause用于纤程切换,在将数据发给硬件之后,调用 ASYNC_pause,保存现场,返回到ASYNC_start_job,进而返回到上层。上层再次调用 ASYNC_start_job时,会恢复由ASYNC_pause所保存的现场,继续往下执行。

如下图所示:


过程如下:

1.nginx调用SSL_accept做握手,openssl用ASYNC_start_job启动握手过程,这时其实有个纤程切换,切换到具体的ssl握手函数;

2.握手函数执行硬件计算,调用qat引擎,最终调用qat的rsa密码函数(在之前会通过eventfd创建一个句柄)直接返回,然后调用ASYNC_pause,执行纤程切换,由回到ASYNC_start_job调用的地方,返回上层SSL_ERROR_WANT_ASYNC;

3.nginx发现密码运行处于pending状态,调用 ngx_ssl_async_process_fds,将前面eventfd创建的句柄加入到epoll的监视集合;并将其事件设置为ssl握手;

4.硬件完成后,调用rsa密码函数设置的回调函数,write一下那个fd;

5.nginx监视到该fd可读,读出数据,继续调用握手函数,进而调用ASYNC_start_job恢复由ASYNC_pause保存的现场,程序往下执行.

展望:intel的QAT看上去还是挺复杂的,需要制定一个类似pkcs11一样的比较简单的异步密码运算接口。目前主流的密码运算接口还都是阻塞式调用。在我实现的加解密接口中,参考了linux aio接口的命名方式。大致如下:

int AIO_sign(aioctx *ctx);

int AIO_verify(aioctx *ctx);

int AIO_encrypt(aioctx *ctx);

int AIO_decrypt(aioctx *ctx);

int AIO_return(aioctx *ctx);

int AIO_cancle(aioctx *ctx);

这里对内存有要求,输入输出内存必须是malloc出来的堆内存,以确保内存是有效内存。由于要支持加解密接口输入大数据,会多包发送,当有错误时,可通过AIO_cancle来取消后续的数据传输和计算(避免浪费硬件资源)。对于上下文的保存,可与硬件进行约定,预留8字节(void *),这样很容易恢复上下文(intel qat怎么做的不清楚)。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • https://nodejs.org/api/documentation.html 工具模块 Assert 测试 ...
    KeKeMars阅读 11,532评论 0 6
  • 加密与解密 对称密码体制的保密性主要取决于密钥的保密性,与算法的保密性无关 非对称加密算法与对称加密算法的区别: ...
    peerless_1024阅读 6,296评论 0 0
  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 13,902评论 1 32
  • 他依稀听见一支用口哨吹出的充满活力的歌在耳边回响。这是赞美青春和生命的歌。——《平凡的世界》 掩卷。啊,一百万字,...
    李晓欣阅读 5,110评论 18 21
  • 也可以使用电脑和可移动设备哦,这样也可以做出漂亮的手账。 有时候我们发现自己被困原地、裹足不前,其实我们离目标...
    up方方阅读 1,265评论 0 0

友情链接更多精彩内容