从零开始区块链:如何证明计算机的工作量?——比特币经典论文研读 (3)

这一节我们会涉及到比特币一个很关键的问题,工作量证明。这部分的内容偏多,我会拆分成几个小块分析。


本系列历史文章列表

从零开始区块链:对等网络与电子现金是什么?——比特币经典论文研读 (1)

从零开始区块链:如何防止一笔钱花两次?——比特币经典论文研读 (2)

6.时间戳服务器

在邮政领域里,有一个概念叫“邮戳”, 一般标明邮件寄出或者收到的时间地点。时间戳就是服务器给数据块加上时间标记,用于标识数据和时间的关系。时间戳服务器把当前数据块的哈希值打上时间戳后,发布到网络中。这就证明了在标识的时间刻度下,这个数据是存在的。每一个时间戳对应的数据块中,包括了前一个数据块的时间戳哈希,于是这样可以形成数据链。


关于这一部分作者并未作详细论述,我们接着往下走。


7.工作量证明(1)

这一段讲的是工作量证明的问题,有几个知识点需要储备:


(1) 设计原型 HashCash

作者提到了一个叫HashCash(哈希现金)的工作[12]。HashCash最初设计的目的是为了防止DoS(拒绝服务攻击)。


拒绝服务攻击的意思就是,如果你要攻击一个服务,就发起虚假的服务请求,让服务不得不响应,消耗了资源,让真正需要服务的人得不到服务,于是“拒绝服务”了。比如,如果你开了一家小卖部,有一天来了很多人,挤满你的店,只询问不购买,你忙着招呼这些人,那真正要买东西的人就进不来,于是对他们而言,店面就瘫痪了。


但是你开店的目的就是为了接客卖货赚钱,所以你还不能把店给关了。就像网络上的服务一样,服务设立的目的就是为了接收请求的,而当你受到DoS攻击干扰的时候怎么办?于是你只能想大致检查一下,这个请求是不是真正的请求,客户是不是真的要买东西,还是在捣乱。


那要怎么检查?在网络上,就让请求者做一些事情,这些事情要有这样的特征:做到这件事情要付出一些代价,检查有没有做到,只要很少量的代价。因为攻击者的资源也有限,所以发起的攻击也不能完全模拟成像真的一样,有很多虚假的攻击可以通过一些方法过滤掉。我们生活中的验证码其实也是这个思路,你把在一堆乱花丛中的文字挑选出来,需要花费功夫,服务器只要对个答案就好了。


HashCash设计了一个“代价函数(cost-function)”,这个函数的特点就是,要计算出结果工作量较大,但是要验证起来很容易。具体而言,就是代价函数让发起请求的人,算出一个“token”出来。这里的token取了双关的含义:一方面,这是一个符号或者标识,另外一方面这个和区块链里的“代币/通证”对应一个英文。下文如无特殊注明,我统一用“通证”代表token。


HashCash把计算这个通证的函数取名叫作Mint(),记得比特币论文前面作者也用了mint这个词么?这个词有造币厂的含义,在第2篇文章的第5部分里,我先没有译出,而是选用了“权威机构”来表示。到这里就能串起来,因为在HashCash中,采用了“造币厂”的隐喻,来代表“代价函数”生成一个通证。你想一下,在生活中,造出一枚硬币,或者印出一张钞票,是不是也是一件不容易的事情?但是验证钞票的真伪,其实要比造出钞票,容易许多。密码学家忙活半天,本质就是为了在网络上,构建出和现实世界想同属性的数学结构。


于是HashCash就可以总结出如下模式:

对应到防止拒绝服务攻击的场景下,就这样用。如果我要验证客户的身份,我就让客户通过Mint()函数给我一个通证T,这个通证的参数w就代表了工作量的大小,s可以理解为自定义的参数,这里先不考虑。然后我就可以通过Value()函数检查一下,到底是不是正确的,也就是,到底有没有包括这么多的工作量。


这个“做到困难,验证容易”的现象,在我们生活中其实很常见。

(1) 你高中刻苦三年,最后拿到了一张清华录取通知书,这个很难;但是拿着你的通知书编号去检查一下真假,这个很容易。

(2) 你辛辛苦苦地解出一道数学方程,这个很难;但是拿着你的答案,代入验算一下,这个很容易。

(3) 你经历各种磨难,做了很多事情,最后领悟到成长的几条真谛,这个很难;别人看了你的文章,感觉很有道理,这个很容易。


你有没有发现,生活有很多类似的“非对称”的结构,从一头到另一头,其实挺难的,但是反过来看,却容易许多。我们在网络空间构建信任,其实就是要利用这样的“非对称”的数学现象。



(2) 哈希函数 Hash Function

哈希函数又称为散列函数。在我大一接触这个概念的时候,其实很喜欢“散列函数”这个译法,感觉有。学到后面发现,在科技领域里“有技术、没文化”是普遍现象,于是也随波逐流地用“哈希函数”了。


哈希函数在密码学里有广泛的作用,甚至可以说是密码系统安全性的基石。简单的理解,哈希函数具备一个功能,可以把任意长度的数据(字符串、文件、数字、内存区块),归一到一个相同的长度。因为在计算机里,即使是文件,也是二进制,也是可以最终转换成数字的。经过哈希函数算出的结果,我们称为哈希值,也会叫作消息摘要(digest)。

图7:哈希函数示例

如果是初次接触这个概念,就把握好这么几个要点:

(a) 把变长转换为定长。不管是什么数据,经过哈希函数处理后,长度都是一样的。

(b) 计算容易倒推难。给定一串字符,算出一个哈希值很容易,但是根据哈希值反推字符内容,很难。

(c) 哈希值对细节敏感。如果把字符串修改一个字母,算出的哈希值都完全不一样。这个再延伸一下,你可以认为哈希的结果近乎是随机数。


如果你是一个会思考的读者,你可能会有一个问题:任意长度的数据可以有无限多个,但是转换到固定长度,却是只有有限个,那会不会出现两个不同的字符串算出来是一个哈希值?


的确是会有的,这个叫作哈希函数冲突或者哈希碰撞。在密码学里面,这个需要通过分析并且将概率严格控制到一定比例以下,以至于用现有的计算条件无法轻易地找到相同的哈希值。这就像你家里的钥匙,其他人的钥匙一般不能打开你的锁,如果两个人分别买两把锁,钥匙却能通用,那说明锁有问题,安全性就得不到保证了。


哈希函数是一种数学上的构想,现在有很多不同的实现,有的因为年代久远,安全性已经不能保证,已经不建议采用,例如MD5;但是有的现在仍然会使用,比如比特币就SHA-256来做工作量证明。至于具体这些函数是怎么算出来的,有相关的文档,如果有兴趣,在互联网上可以找到算法,读完以后你会更加怀疑自己的智商。


(3) 通过哈希碰撞难度,控制计算机工作量


有了以上知识的铺垫,下面要讲到怎么利用哈希函数来控制工作量了。


我们已经知道,可以通过让某个程序来计算出一个通证的方式,来验证工作量。这就是HashCash做的设计(HashCash也不是首创,只是比特币的参考),现在简单梳理一下HashCash怎么通过参数的方式来控制工作量。

这个公式看上去有点复杂,其实本质比较简单。

Mint()函数就是计算能代表w工作量的通证,这里表示成一个哈希函数,要求结果左边有w个零比特。前文已经说了,哈希函数算出的结果几乎可以看成一个随机数,现在要求这个随机数的二进制,前w位都是0。


那有什么办法可以快速算出通证T来么?没有。只能一个一个试。这就叫暴力破解。在密码学,暴力破解几乎算一种最管用但是也是最笨的方法。如果你把需要遍历的空间搞得很大,那猜到的概率就很小。


这就像生活中的密码是一样的,如果密码是四位数字,那我平均试1万次就够了,多加一位,次数多10倍。这个道理可以迁移,我在自己的《刻意学习[13]》这本书里也讲了“暴力破解”攻破你的成长问题。


好,那么到现在,我们就可以用这个参数w来控制Mint()函数算出通证T的工作量了。


比如,假如我把w设置成1,那任意一个哈希值,第1位要么就是0,要么就是1,最多试两次就搞定了,这是一个简单工作。

假如我把w设置成2,那任意一个哈希值,前两位最多有00、01、10、11四种情况,平均要试四次,工作量翻番。

如果我把w设置成k,那就是要从个可能结果里,找出一个全部是0的结果。

如果k就等于哈希值的全部长度,就变成前面说的哈希碰撞了。


计算结果的难度可以通过上述的示例展示,但是计算结果的验证呢?


假设我们的计算机拿出一个通证,这个通证代表着前6位都是0的工作量。那我要验证到底是不是有这么多的工作量,怎么办呢?我就只要算一次哈希,看一下结果是不是前6位都是0,就搞定了,对吧?这就是Value(T)做的事情了。


于是你可以看到,计算出一个通证,和验证一个通证的难度是不一样的。而计算通证的难度,通过一个参数,就可以控制。


这有没有点像在小学的时候,班主任布置作业,“课文抄5遍并背诵全文,家长签字”,然后你要做很长的时间,才能拿到家长签字的通证。所以你当天晚上能不能睡觉,就取决于老师让你抄5遍还是抄50遍。


在工作岗位中,我们往往会通过产出量、加班时间来看一个员工的工作量。在马克思的《资本论》里,建立了剩余价值的理论体系,揭露了资本对于劳动的压榨剥削;在这一节,我们发现了一种虐待计算机的方法,通过让计算机去算通证,用来作为计算机的工作量证明。假如有一天,机器之间也存在价值剥削与等级关系,工作量证明可以不失为一项有效的衡量手段。


下一节我们继续讨论比特币的工作量证明。


参考文献

[12] Back A, Others. Hashcash-a denial of service counter-measure[J]. 2002.

[13] Scalers. 刻意学习[M]. 北京联合出版社, 2017.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容