IM端到端加密-带你了解Signal协议

前言

通过对端到端加密技术的调研,我们通过研究海外主流App,包括WhatsApp, Signal, Telegram,Snapchat等。其中WhatsApp采用的是Signal的加密技术,Signal 起源于 Open Whisper Systems 这个组织,其前身是 Whisper Systems 公司,成立于2010年。Open Whisper Systems 成立后致力于加密通信方面的研究工作,其首个产品是名为 TextSecure 的 Android 平台短信加密应用程序,它采用 Signal Protocol 协议实现了端对端加密,然后最终演变为今天更广泛使用的 Signal 应用程序。通过研究Signal的加密技术,发现其他厂商在端到端加密技术上跟Signal的技术原理没有太大差别,本质上是一致的。

为了更好了了解端到端加密技术,在这里先简单介绍Signal是如何实现端到端加密的,其中的原理是怎么样的?

Signal协议包括单聊和群聊,两种会话类型的实现方式不太一样。但是Signal协议的目标主要就是保证信息只能在端上加解密,任何第三方包括传输链路中间的路由器或者服务器,都只能看到密文,而不能轻易的对信息进行解密。同时为了提供信息的安全性,对于单聊的加密还支持向前向后安全,群聊只有向前安全。


端到端加密

端是什么

端可以理解成是一个设备,一个设备就是一个端,可以是PC,也是可以手机端。在Signal协议中,端到端加密技术,本质上是设备跟设备之间的加密通讯,其他设备或者第三方通讯无法解密端到端之间的加密数据。

那么用什么来作为端的唯一标识呢?Signal是通过一个身份密钥对(Identity Key Pair)来标记一个端的唯一身份,每个端在启动的时候第一时间创建一个128的随机身份密钥对,用来作为端的唯一标识。密钥对生成主要采用了Curve25519算法,通过Curve25519算法可以计算得到一个共享密钥,也就是后面要讲的一个DH协议。

Curve25519算法

Curve25519是一种用于密码学的椭圆曲线。它於2005年由Daniel J. Bernstein提出。该曲线定义在GF(2^255 - 19)的素域上,因为它安全性高,效率高,因此被广泛地应用于密码学领域。

Curve25519是以它的素域命名的,该素域为一个稍小于2255的大素数。它的方程式为y2 = x^3 + 486662x^2 + x,其中x和y是曲线上的点。基点P在曲线上是以x,标为9的点。

Curve25519在密码学中有几个优点,比如它能够抵御离散对数问题等攻击,并且在各种硬件平台上都能够高效运行。因此,它被广泛地用于一些协议,例如TLS和Signal协议的加密通信。

什么是DH协议

DH协议(迪菲-赫尔曼密钥交换),由Curve25519算法生成的密钥对,双方交换彼此的公钥,根据自己的私钥和对方的公钥,是通过模数取幂的方式得出一个共享的秘密值,而这个结果对外界来说是不可知的,具体的数据原理就不展开了,有兴趣的小伙伴可以通过点击链接了解下。

DH协议

如上图,Alice和Bob各自创建了一个密钥对,然后彼此交换了公钥,双方根据对方的公钥和私钥计算得到了一个密钥,这个密钥就是共享密钥,在这期间只需要暴露交换公钥,结合自己的私钥就能够计算得到相同的共享密钥。通过DH协议就能够在不安全的网络情况下,通过交换彼此的公钥,协商计算出相同的共享密钥。

DH协议是没有防止中间人攻击和回放能力的,中间人可以分别对双方进行2次DH协商得到共享秘钥,从而导致信息泄露,因此需要其他安全机制来保证安全性,比如数字证书、数字签名或者安全通讯通道(TLS/SSL),通过其他安全机制增加对中间人攻击的保护。

中间人攻击

什么是端到端

通过上面的简单介绍,我们了解端的定义,也知道通过DH协议可以得到共享密钥,那么端到端在Signal中是什么概念?

要理解端到端加密,我们要先理解端到端,所谓的端到端,就是两个端完成公钥交换,然后协商出共享密钥的一个过程,而且该共享密钥只能在这两个端中使用,其他端无法单独使用。也就是说,如果该过程没有完成,就无法建立端到端加密通讯。

密钥协商

一、端到端如何完成协商的

首先,在Signal中,采用3XDH协议来完成实现共享密钥的协商。3XDH是在DH协议的基础上扩展出来的协议,本质上还是DH协议,只是多了几次DH协商。

3XDH协议需要以下三对基础密钥对和一个临时密钥对,包括如下:

IPK(Identity Key Pair): 身份密钥对,一个长期的符合DH协议的密钥对,用户注册时创建,与用户身份绑定(安装时候随机生成)

SPK(Signed Pre Key): 已签名的预共享密钥,一个中期的符合DH协议的密钥对,用户注册时创建,由身份密钥签名,并定期进行轮换,此密钥可能是为了保护身份密钥不被泄露;(SPK包含了身份校验签名)(默认7天更新)

OPK(One-Time Pre Keys): 一次性使用的 Curve25519 密钥对,安装时生成(默认100对),不足时补充。

EPK(Ephemeral Public Key): 临时的密钥对(回复消息时创建),跟OPK作用类似,棘轮过程中创建使用,用来向后安全保证,后续介绍棘轮的时候会展开。

3XDH

上图表达的意思是,Alice主动和Bob进行会话协商,计算出共享密钥S的过程。具体需要完成以下动作:

  1. Alice提供自己的两个私钥,IPK-Private(启动时创建) 和 EPK-Private(临时创建)

  2. Alice获取到Bob的三个公钥,IPK-Public、SPK-Public、OPK-Public(不足时没有)

  3. 分别计算出DH1、DH2、DH3、DH4

  4. 然后根据KDF算法计算得到一个共享密钥S

备注:其中DH4是通过Alice的EPK-Private和Bob的OPK-Public计算得到,由于OPK是由客户端随机生成上传到密钥服务器,只能使用一次,因此会有不足的情况,所以当OPK不足的时候也没有及时补充,就会导致OPK没有,这里不影响协商。

二、基础密钥对是怎么创建的

一般情况下,在首次安装启动的时候,会在端上根据协议要求用Curve25519创建一个IPK、一个SPK以及100个OPK密钥对,并且保存在端上,同时将IPK的公钥和SPK公钥以及100个OPK的公钥上传到公钥管理服务器。

沿用以上例子,Alice和Bob在首次安装的时候,就会在本地使用urve25519算法创建以下密钥对。

同时把密钥对的公钥上传到了公钥管理服务器。这时候服务器和Alice/Bob端就存储了以下密钥信息,所有密钥对的私钥都只保存在了端上。

公钥管理器

三、公钥管理服务器

公钥管理服务器,就来管理保存所有端上传的公钥信息,同时提供给其查询某端的公钥信息组。通过公钥管理服务器,就可以实现在对方端离线状态下,也能够完成会话协商,而不用等待对方上线。

备注: 公钥管理服务器需要自己开发实现

每次查询,会返回一组公钥信息,包括一个IPK_Public,一个SPK_Public和签名信息,以及一个OPK_Public,当一个OPK_Public被查询使用之后,服务器就需要对其进行删除,这也是为什么OPK_Public会不足的原因。

目前Signal协议是建议每次端上传100个OPK信息,当不足的时候,端可以在适当的时候继续补充上传,这块逻辑需要接入方自行开发。

密钥协商

四、Alice和Bob是如何完成会话协商计算共享密钥

对于Alice发起端,在和Bob建立端到端加密之前,Alice需要从公钥管理服务器查询获取Bob的公钥组信息,同时创建出一个临时密钥对EPK,根据3XDH协议完成协商,计算出共享秘钥S,后续可以根据共享密钥S进行加密传输数据。

为了保证Bob也可以拿到Alice的公钥信息写上计算出相同的共享密钥,Alice在发送加密信息的同时,会携带上自己的公钥信息,包括EPK_Public、IPK_Public,这样Bob在收到第一条加密消息的时候,就无需再向公钥管理服务器查询Alice的公钥信息,而是通过携带的公钥信息结合自己的私钥准确计算出共享密钥。

Alice在获取Bob的公钥信息,会根据Bob的SPK_Public、IPK_Public和Sign进行签名身份校验,如果发现签名不对,则会拒绝协商。通过SPK的身份签名校验,来进一步保证公钥信息是跟身份绑定要一致的。

Bob在收到Alice携带的公钥信息时,则无需进行签名身份校验。

五、小结

通过通过从介绍了端到端的相关概念以及通过3XDH进行协商计算得到相同的共享秘钥,这样基本上完成了端到端加密共享密钥的初始化,也拉开了端到端加密的序幕。但是如果单纯的通过共享秘钥S进行加解密,当共享密钥泄漏的时候,也会造成信息泄漏,Signal为了解决这个问题,采用了KDF棘轮链算法和DH双棘轮来保证向前向后的安全性。

KDF棘轮保证向前安全

先简单了解一下KDF算法(Key Derivation Function),KDF算法可用于更安全地保存用户密码,普通的密码管理方式是服务器保存用户密码的哈希值,以避免服务器被攻击后黑客拿到用户密码原文,但是一些简单密码的哈希值仍然可以通过少量的碰撞破解出来,比如123456的哈希值就很容易被碰撞出来。更加安全的做法是在用户哈希值附加其它信息(比如用户注册时间,用户住址等等),通过KDF算法导出,得出的密钥具有非常强的随机性,就很难被碰撞出来。比如原始密码是123456的哈希值为"hash (123456)",使用KDF算法得出最终密钥。比如:KDF(hash (123456),用户注册时间)=最终密钥,而服务器只保存最终密钥。这样的密码管理方式的好处是,不管用户设置的密码多么简单,服务器保存的密钥都是非常随机的,很难被碰撞出来。

KDF是一种密钥导出函数,通过附加一些数据(数据被称为“盐”,即salt,附加数据又称“加盐”),将原始密钥导出新的密钥,提高原始密钥的保密性。公式表达为

KDF (原密钥,盐) = 导出密钥

也就是我们在计算得到共享密钥S之后,采用S加密数据,然后对S进行一次KDF运算得到下一个S',也就是S'=KDF(S,盐),由于KDF很难通过S'反推出S,无法通过一个密钥推倒出之前的密钥,因此它是向前安全的,这就是我们说的加密向前安全。

KDF就像是一个棘轮,只能向一个方向转,也就是通过KDF可以向后推导出新的密钥,但是无法推导之前旧的密钥。

通过KDF棘轮算法可以知道,当Alice和Bob通过3XDH协商出共享密钥S之后,只要双方通过约定,采用共同的盐,就可以根据原始的共享密钥S计算出下一个密钥S' 。

当其中某个共享密钥泄漏之后,也可以保证之前的密钥不能被推算出来,但是如果盐也泄漏了,那么别人也可以根据KDF算法根据盐和S推导出后面是密钥。因为KDF只能解决了向前安全性,但是无法保证向后安全。

DH棘轮保证向后安全

KDF无法保证向后安全,是因为盐不变,是否可以动态的改变盐,使得每次进行KDF运算的时候保证盐都不同,保证盐的随机性。

Signal协议巧妙的通过DH协议来计算出这个盐,前面在介绍端到端协商的时候提到了一个EPK,这个就是来解决这个盐的问题。

在首次协商的时候,发起端Alice会在本地创建一对临时密钥EPK,同时通过获取对方的公钥信息进行协商,在没有收到对方回复消息之前,发起端的盐计算是一直保持一致,并且是由Alice的EPK_Private 和Bob的SPK_Public 计算得来,整个过程如下:

Alice通过首次协商会话创建共享密钥之后,给Bob发送第一条消息,首次加密会携带上Alice的相关公钥信息,并且首次创建KDF棘轮链的盐会用自己的临时密钥EPK私钥和对方的签名密钥公钥进行DH得到

如果Alice继续给Bob发送消息,会直接从S和 Salt进行KDF计算出下一个密钥S1,这时候在没有收到Bob的消息时,会一直采用相同的盐进行计算。

S' = KDF(S, Salt)

Bob收到Alice的第一条消息,同样会进行会话协商完成计算出共享密钥S

暂时无法在Lark文档外展示此内容

后续Alice的用Salt加密的消息,Bob只要通过相同S和Salt进行KDF处理,就可以得到下一个S1。

当Bob收到Alice的消息,并且完成解密之后,想要回复Alice消息,Bob会创建一个新的临时密钥EPK,然后重新计算出新的盐,根据KDF运算出新的密钥,然后加密后发给Alice,同时携带Bob新创建的EPK_Public

当Alice收到Bob的消息回复之后,需要处理Bob携带的EPK_Public,并且使用之前的创建的EPK_Private(Alice)进行DH运算得到新的盐,然后根据KDF(S,Slat)计算得到相同的密钥S'

每次当有一端回复消息的时候,都需要重新创建EPK,用来计算下一个新的盐,这样用来保证当某个密钥或者盐泄漏的情况下,不会对后面或者前面的消息造成泄漏风险。

群聊如何实现端到端加密

通过3XDH、KDF棘轮和DH棘轮,就可以实现端到端的向前向后安全,但是这个只能解决单聊一对一的端到端安全问题,如果用在群聊中,由于人数较多,如果也通过单聊的类似的方案,密钥的保存和计算将会导致性能降低。由于群聊的私密性相对于群聊会较低,因此Signal通过另外一种方案来解决群聊的加密问题。

Signal Protocol的群组聊天是通过KDF棘轮算法+公钥签名来进行加密通讯的。通讯流程是这样的,

(1) 每个群组成员都要首先生成随机 32 字节的KDF链密钥(Chain Key),用于生成消息密钥,以保障消息密钥的前向安全性,同时还要生成一个随机Curve25519 签名密钥对,用于消息签名。

(2) 每个群组成员用向其它成员采用单聊的加密方式发送链密钥(Chain Key)和签名公钥。此时每一个成员都拥有群内所有成员的链密钥和签名公钥。

(3) 当一名成员发送消息时,首先用KDF链棘轮算法生成的消息密钥加密消息,然后使用私钥签名,再将消息发给服务器,由服务器发送给其它成员。

(4) 其它成员收到加密消息后,首先使用发送人的签名公钥验证,验证成功后,使用相应的链密钥生成消息密钥,并用消息密钥解密。

(5) 当群组成员离开时,所有的群组成员都清除自己链密钥和签名公钥并重新生成,再次单独发给每一位成员。这样操作,离开的成员就无法查看群组内的消息了。

由上可知,一个人在不同的群组里,会生成不同的链密钥和签名密钥对,以保障群组之间的隔离。在每个群组中,每个成员还要存储其它成员的KDF链和签名公钥,如果群组成员过多,加解密运算量非常大,会影响发送和接收速度,同时密钥管理数据库也会非常大,读取效率也会降低。所以,群组聊天使用signal Protocol协议,群人数不宜太多。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,923评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,154评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,775评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,960评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,976评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,972评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,893评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,709评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,159评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,400评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,552评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,265评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,876评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,528评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,701评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,552评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,451评论 2 352