我们继续挖矿代码的分析,上篇我们看到了BitcoinMiner()函数的第二部分创建区块和整合交易。现在我们继续往下看。
这部分首先申请了三块内存空间,做为哈希缓冲区,并16字节对齐(alignup<16>)。具体什么是字节地齐我在网上找了些概念我们也简单介绍下:
现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。
对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。
以上就是字节对齐的函数模板。我们简单说下原理:
(1)(nBytes-1),表示对齐所需的对齐位,如:2字节对齐为1,4字节为11,8字节为111,16字节为1111...
(2)(u.n+(nBytes-1)),表示u.n补齐对齐所需数据
(3)&~(nBytes-1),表示去除由于补齐造成的多余数据
(4) (u.n+(nBytes-1))&~(nBytes-1),表示对齐后的数据
举例:如8字节对齐。起始地始是6
6 + (8 - 1)=0000 0110 + 0000 0111 = 0000 1101
0000 1101 & ~(0000 0111) = 0000 1000 //去除由于补齐造成的多余数据
总的来说,这里使用字节对齐的目的是适配不同的cpu和提高对内存的存取效率。然后调用FormatHashBuffers()格式化哈希缓冲区。
这个函数的 先定义了名为tmp的临时结构体,其中包括包含了区块头信息的block结构和表示区块哈希值的hash1。然后将相应区块中的数据赋给相应的数据。我们这里说下pchPadding0和pchPadding1这两个数组,表面上看没什么用,其实这里就是我们前面说的字节对齐的扩展。目的是为了后面的FormatHashBlocks()格式化函数,因为了格式化相应的数据,所以需要固定的位数,也是为了加密用,由于加密算法涉及很多分组异或运算,一般加密分组就必须长度固定。这是我个人理解,如果大家有别的更好的解释,欢迎指正并留言。
我的理解是这样来的,在调用FormatHashBuffers(pblock, pmidstate, pdata, phash1)这个函数的参数中,都是固定好的内存空间。其中pdata需要128 + 16字节,phash1需要64+16位。而我们的结构体的内存空间是不够的,其中block的区块头信息的内存大小为:(int + unit256+unit256 + int + int +int )= (4 + 32 + 32 + 4 + 4 + 4) = 80字节。不够128 + 16字节的,所以需要补位(pchPadding0[64] )正好补上 64字节,然后将多余的位数补0,也就是memset(&tmp,0,sizeof(tmp))的作用。最后通过FormatHashBlocks()格式化tmp.block ,tmp.hash1的内存数据。
下面的代码就好理解了,首先将结构体tmp内存区域中的数据按字节反序交换,然后把tmp中的结构对象block用pSHA256InitState定义的状态以SHA256算法加密,作为pmidstate的数据,最后使用memcpy将tmp.block的前128字节数据赋给传过来的参数pdata,将tmp.hash1的前64字节数据赋给参数值pash1。
回到最上面的头部代码中。在调用完FormatHashBuffers()格式化缓存区后,将格式化后的数据的内存地址赋给相应的指针变量:
这里的内存地址nBlockTime,nBlockBits,nBlockNonce正好是FomatHashBuffers()中tmp结构中nTime,nBits,nNonce的变量地址。
由于今天这篇文章比较抽象,涉及到字节对齐的知识和内存格式化的知识,关于具体的算法原理,由于水平有限,也不是太清楚,希望大家也谅解并指正。我们也就先了解到这里。
作者:区块链研习社比特币源码研读班,black