关注微博:@IFPS宗师风清扬
通过之前的介绍,相信大家都已经知道IPFS中的激励层Filecoin主要是通过检索和存储两种收益模式,但是关于IPFS到底是如何进行存储和读取的相信很多朋友还是比较模糊的。俗话说知己知彼,百战不殆。想知道IPFS到底值不值得投资,下面就给大家具体介绍一下存储和检索。
单文件存储
首先IPFS是一个文件系统,但是和一般的文件系统不同的是IPFS是没有存储上限的,同时也是没有空间回收的功能的。我们可以将IPFS存储文件分为下面几个步骤来分析:
1
把单个文件进行拆分为块(block),每个块的大小都是256KB。大部分时候还有残留的小文件(小于1KB)的文件,这个时候将不再额外占据一个块的大小,而是把数据内容和Hash一起上传给IPFS节点。
2
块分好之后就会逐个计算block hash,hash1=hash(block1),hashn=hash(blockn);
3
编好号之后将所有的block hash拼凑成一个数组然后再计算一次hash,这个时候就能得到文件最终的hash(file)。最后把hash(file)和block hash数组捆绑成一个对象,这个对象就是索引结构了。
4
如果要把文件同步到IPFS网络就只要把block和索引结构全部上传到IPFS节点上;
由于IPFS是不支持空间回收的,文件一旦同步到IPFS就将永久存在了,这时候很多人就会有疑问如果频繁的编辑大文件,编辑一次同步一次的话不是会过度浪费很多空间。其实不是这样的。我们用一个例子来说明一下。
我这里有一份2G的大型文件已经同步大IPFS网络上了,现在又在这个文件里面追加了100k内容重新同步,按照之前的理解应该是需要2G+2G+100K的空间。然而IPFS中文件是分块存储的,相同hash的block只会被存储一次。因为之前2G的内容没有改变,所以在IPSF网络中这些数据不会被分配新的空间,只会把新的100K数据重新分配一个block然后上传hash,所以实际上占用的空间只会是:2G+100K。
如果是不同文件中存在很多数据重复的现象的话,例如不同字幕的电影;当两部不同字幕的同一部电影都被上传到IPFS网络中的时候,其中大部分block的hash是一致的。这些block在IPFS上也只会存储一份。所以一个block可能会有多个文件的索引指向,这就是Merkle DAG。因为所有的索引都保存了hash,所以具有内容可寻址、数据无法篡改和重复数据删除的特点。
检索
了解了IPFS存储的方式之后,检索的过程就比较简单了,基本上就是存储方式的一个逆推过程:
1
首先找到该文件hash的block hash数组(IPFS生态中矿工的职责)然后下载下来;
2
得到block的索引之后就可以根据block hash搜索block所在节点的位置然后下载;
3
最后根据block hash数组的顺序把文件拼接完整。
IPFS前景分析
前文所说的是只是一个IPFS block的大概描述,中间涉及的技术细节很多很复杂;而且IPFS的生态也很大,还有很多的优点,比如高可用属性、不会宕机、不怕恶意攻击、文件不丢失等等。
微博:IPFS宗师风清扬
转自微信公众号行会走点存科技有限公司,侵权请告知