「飞猪说币」2018年的10倍币:IPFS原理介绍之二
飞猪尽量用自己的语言来做基础原理介绍,也许不是最精确,但是一定是最容易理解的语言。
(至于为什么说IPFS会是2018年的10倍价值币,相信读者看完全系列介绍以后会有自己的判断。)
IPFS基础介绍之二: IPFS文件寻址
上一章节介绍了IPFS是什么,同时介绍了分布式存储的好处。我们知道所有进入IPFS存储的文件会被分成很多小块分别存储到IPFS的节点中去,接下来飞猪将介绍IPFS另一个重要的基础功能,即我们怎么访问这些文件。存储和寻址,这是IPFS的两个主要核心。
IPFS文件寻址:
先简单介绍一下我们现在访问网页的原理:
我们现在访问网页,比如百度的网址,电脑或者手机先会去DNS服务器(什么是DNS服务器飞猪就不多解释了,有兴趣的老铁可以去百度一下),从DNS服务器了解到百度网站对应的IP地址,然后电脑或者手机才可以通过IP地址访问到这个网页。如果这时候域名解析服务器(DNS)出了问题或者网站更换了IP,那你就没办法访问到百度网站了。
IPFS采用内容寻址技术,为每一份文件添加数字指纹,即生成一个哈希值,内容的任何变动都会造成哈希值的变化,这个哈希值类似于我们平常给文件打包时的MD5码,同一个文件无论复制粘贴多少遍都是同一个MD5码。文件的任何变动会得到一个新的哈希值,大量哈希值相同的冗余文件会被删除,哈希值列表会部署在一条公链上,任何人可以通过内容搜索直接找到相关文件。相较于HTTP协议采用的路径寻址,HTTP搜索的结果是服务器中文件存储位置,文件存储位置如果有变化,你都可能再也无法找到它。而IPFS的每个文件有唯一的哈希值,不论网络如何变化,隔壁老王的电脑打开还是关闭,这个文件始终存在,根据这个哈希值就肯定能找到这个文件。
在IPFS里访问一个地址的过程是根据文件的哈希值可以直接访问到IPFS网络里的这个文件。
这里介绍一下哈希值的概念:
Hash,一般翻译做“散列”,也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射,pre-image),通过散列算法,变换成固定长度的输出,该输出就是哈希值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。飞猪简单举例:一部6T的电影,最终通过哈希算法的出来的就是不到1K的一串字符串,这串字符串可以唯一代表这个6T电影。比如隔壁老王给飞猪传来一部电影,飞猪只用比较哈希值就知道这个电影是不是飞猪想要的,而不用从头到尾把这个电影看完才知道。
Hash主要用于信息安全领域中加密算法,他把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说,hash就是找到一种数据内容和数据存放地址之间的映射关系。哈希算法主要用于以下方面:
1) 文件校验
2) 数字签名
3) 鉴权协议
IPFS用基于内容的寻址替代传统的基于域名的寻址,用户不需要关心服务器的位置,不用考虑文件存储的名字和路径。我们将一个文件放到IPFS节点中,将会得到基于其内容计算出的唯一加密哈希值。哈希值直接反映文件的内容,哪怕只修改1比特,哈希值也会完全不同。当IPFS被请求一个文件哈希时,它会使用一个分布式哈希表找到文件所在的节点,取回文件并验证文件数据。IPFS每个节点维护一张DHT(分布式哈希表),包含相应数据块与目标节点的对应映射关系。整个哈希表被组织成二叉树,平均查询联系节点的复杂度是O(log2N)。例如要查询10000万节点只需20跳。(至于什么是跳,这个飞猪不多说,大家百度一下吧)
存储和寻址,这是IPFS的两个主要核心。
有了这两个基本的核心,一套分布式存储系统就可以运行起来了,当然实际运行起来还需要很多其他功能辅助,比如认证、交换、传输等,但是存储和寻址是IPFS的最核心基础。
IPFS在便利性、安全性、开放性等诸多方面都体现出相当大的优势。接下来飞猪将会有一个章节专门讲解IPFS的优势。(所以飞猪说IPFS是2018年的10倍币是有依据的。)
飞猪写作习惯会在文章末尾放一些基础知识介绍供大家参考。
IPFS矿机收益来源:IPFS网络中,矿机的收益将主要来源于检索和储存,越多的存储空间被占用,越多的上传下载被利用,越多的关键词被检索到矿工的收益越高。不同于传统GPU或ASIC矿机,其收益波动性大(因为我们很难知道明天哪个文件关键词会成为检索热点),但由于其不需要强大的计算核心,仅需要硬盘空间与网络带宽,或许能避免传统POW机制中算力过于集中的弊病,让更多有闲置资源的群众参与到POW中来,共同维护IPFS网络。
(可以私信飞猪要数字助理软件的试用版)