IPLD是什么
IPLD是内容可寻址web的数据模型。它允许我们将所有散列连接的数据结构视为统一信息空间的子集,将所有将数据与散列连接的数据模型统一为IPLD实例。
IPLD数据模型定义了一种简单的,适用于所有merkle-dags,基于JSON的结构。同时也定义了一系列编码的格式结构。
目前系统的问题
在分布式系统中,通过使用加密哈希来定位内容已经成为了广泛使用的方法。 从区块链到加密数字货币到网页,这中间的数据是庞大的。然而,尽管所有这些工具都依赖于一些常见的原语,但是它们的特定底层数据结构是不可互操作的。
IPLD是所有受哈希启发的协议的一个名称空间。通过IPLD,可以跨协议遍历链接,允许您探索数据,而不管底层协议是什么。
IPLD如何解决了这些问题
IPLD定义了一系列规范来让基于内容寻址,加密hash的分布式系统中的数据变的具有互操作行。
它具有如下特点
- 规范化数据模型
一个自包含的描述性模型,惟一地标识任何基于哈希的数据结构,并确保相同的逻辑对象总是映射到相同的位序列。
- 协议独立
IPLD将独立的系统组合在一起,使与现有协议的集成变得简单。
- 可升级
有了多格式(multiformat)支持,IPLD很容易升级,并将随着您喜欢的协议而增长。
- 跨格式的互操作
以各种可序列化的格式表示IPLD对象,如JSON、CBOR、YAML、XML等,使IPLD在任何框架中都易于使用。
- 向后兼容的
非侵入性解析器使IPLD易于集成到现有工作中。
- 所有协议的名称空间
IPLD允许您通过一个公共名称空间,通过协议无缝地跨协议探索数据,结合基于哈希的数据结构。
IPLD结构和组成
一些核心术语和组成
merkle-links: merkle-graph的核心单位
merkle-dag: 默克尔DAG: 任何边为merkle-links的有向无环图
merkle-paths: unix风格的路径便于遍历 merkle-dag
IPLD Data Model:一种灵活的、基于JSON的数据模型,用于表示merkle-dags.
IPLD Serialized Formats:序列化模型,一系列IPLD对象可以使用的格式, 例如 JSON, CBOR, CSON, YAML, Protobuf, XML, RDF, etc.
可见,IPLD 是多个由默克尔链接组成的dag图的一种数据模型。
IPLD协议的其他关联部分协议
[图片上传失败...(image-659b3f-1533192576398)]
可以看出,有一些协议还在修订中
一些关键概念
什么是默克尔链接(merkle-link)
一个merkle-link是链接两个对象的方式。目标对象和源对象都使用加密Hash的内容寻址。同时,目标对象的hash也会嵌入到源对象中。包含merkle-links的内容寻址可以做到:
加密完整性检查:解析链接的值可以通过Hash来测试。 这样一来可以实现广泛的,安全的,不受信任的数据交换(例如git或bittorrent),因为其他人不能给你任何不通过Hash链接到的数据。
不可变数据结构:带有merkle链接的数据结构不能改变,这对于分布式系统来说是一个重要的属性。 这对于版本控制,表示分布式可变状态(例如CRDT)和长期归档很有用。
一个merkle-link通过如下的IPLD对象模型表示:一个包含 / 映射到一个 “映射值”(“link value”),例如: 一个链接,在json中可以表示为一个“链接对象”(“link object”)。
<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="THWy" data-linenum="1">{ </pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="IHq2" data-linenum="2"> "/" : "/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k"</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="S6jz" data-linenum="3">}</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="irdw" data-linenum="4">// "/" 是一个链接key</pre>
<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="2F5o" data-linenum="5">// "/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k" 是一个链接值</pre>
一个在foo/baz有链接的对象:
<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="uv8V" data-linenum="1">{</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="qfun" data-linenum="2"> "foo": {</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="h0rF" data-linenum="3"> "bar": "/ipfs/QmUmg7BZC1YP1ca66rRtWKxp77WgVHrnv263JtDuvs2k", // 不是一个链接</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="TDFB" data-linenum="4"> "baz":</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="oh2Y" data-linenum="5"> {"/": "/ipfs/QmUmg7BZC11ca66rRtWKxpXp77WgVHrnv263JtDuvs2k"} </pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="o1ET" data-linenum="6">// 是一个链接</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="nVem" data-linenum="7"> }</pre>
<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="eLYs" data-linenum="8">}</pre>
一下结构中又一个 有一个伪”链接对象” 在 files/cat.jpg ,而实际的链接在 files/cat.jpg/link
<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="BzC2" data-linenum="1">{</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="xVYH" data-linenum="2"> "files": {</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="5Tff" data-linenum="3"> "cat.jpg": { // 链接的属性包含在其他对象中</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="JBqL" data-linenum="4"> "link": {</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="kRRG" data-linenum="5"> "/": "/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k"}, </pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="bcqM" data-linenum="6"> "mode": 0755,</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="RNb0" data-linenum="7"> "owner": "jbenet"</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="OmIB" data-linenum="8"> }</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="JISa" data-linenum="9"> }</pre>
<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="C7Rp" data-linenum="10">}</pre>
当链接被修改时,映射本身将被其指向的对象替换,除非链接路径无效。
这个链接可以是multihash, 也就是说它假设这个链接是在 /ipfs 层级下的,或者是对象的绝对路径。但目前只有 /ipfs 层级路径可以使用。 如果应用需要使用 /表示其他内容,那么应用自身需要保证解析的时候不冲突。
merkle-graph和merkle-dag
具有merkle-link的对象形成一个有方向的图叫Merkle-graph
merkle-path是什么
一个merkle-path是一个unix风格的路径(e.g. /a/b/c/d),它可以实现通过merkle-link遍历,并且获得所有的对象。 通用的文件系统可以被设计成在IPFS之上的对象模型,设计特定的算法来实现数据对象的操作和查询。
工作原理
一个merkle-path是一种unix风格的路径,它依据路径遍历,同时也逐步解析循内容。解析内容意味着获得merkle-link的内容,再进一步解析。例如,假设我们有如下merkle-path:
<pre class="ql-syntax ql-authorBlock-13003047 first-line last-line ql-long-13003047" spellcheck="false" line="3C1W" data-linenum="1">/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/c/d</pre>
其中:
ipfs 是协议的命名空间。
QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k 是一个加密哈希值
a/b/c/d 是一个可遍历的unix路径 由 /表示的可遍历的路径 ,可以表示两种链接: 在同一对象内部遍历数据 依据merkle-link实现对象间的信息遍历
例如
<pre class="ql-syntax ql-authorBlock-13003047 first-line ql-long-13003047" spellcheck="false" line="HM5e" data-linenum="1">> ipfs object cat --fmt=yaml QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="BULY" data-linenum="2">---</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="ne1i" data-linenum="3">a:</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="Yabc" data-linenum="4"> b:</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="Y4R1" data-linenum="5"> link:</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="hAGH" data-linenum="6"> /: QmV76pUdAAukxEHt9Wp2xwyTpiCmzJCvjnMxyQBreaUeKT</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="vJ1l" data-linenum="7"> c: "d"</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="8k8I" data-linenum="8"> foo:</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="0qs7" data-linenum="9"> /: QmQmkZPNPoRkPd7wj2xUJe5v5DsY6MX33MFaGhZKB2pRSE</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="Ynz3" data-linenum="10">> ipfs object cat --fmt=yaml QmV76pUdAAukxEHt9Wp2xwyTpiCmzJCvjnMxyQBreaUeKT</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="voxf" data-linenum="11">---</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="J25M" data-linenum="12">c: "e"</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="O0pA" data-linenum="13">d:</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="T5g7" data-linenum="14"> e: "f"</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="tI1z" data-linenum="15">foo:</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="oc5p" data-linenum="16"> name: "second foo"</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="91C0" data-linenum="17">> ipfs object cat --fmt=yaml QmQmkZPNPoRkPd7wj2xUJe5v5DsY6MX33MFaGhZKB2pRSE</pre>
<pre class="ql-syntax ql-authorBlock-13003047 ql-long-13003047" spellcheck="false" line="me84" data-linenum="18">---</pre>
<pre class="ql-syntax ql-authorBlock-13003047 last-line ql-long-13003047" spellcheck="false" line="ClF7" data-linenum="19">name: "third foo"</pre>
假设有如下paths:
/ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/c 只会遍历第一个对象,得到字符串 d. /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/link/c 会遍历两个对象,得到字符串 e /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/link/d/e 会遍历两个对象,得到字符串 f /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/link/foo/name 会遍历第一个,第二个对象,得到字符串 second foo /ipfs/QmUmg7BZC1YP1ca66rRtWKxpXp77WgVHrnv263JtDuvs2k/a/b/foo/name 会遍历第一个,第二个对象,得到字符串 third foo
IPLD限制和愿景
有如下限制:
1. IPLD 路径必须是明确无误的,任意给定的路径遍历的方式必须是恒定的(e.g.避免链接命名冲突)
2.IPLD 路径必须是全局的,同时也要支持其他语言(e.g. 使用 UTF-8,而不是ASCII).
3. IPLD 路径必须是在UNIX和Web之上的层级 (使用 /, 在ASCII 系统内转变必须是确定的 ). 鉴于JSON的成功, 很多系统都支持JSON 接口.
4.IPLD 必须具有支持JSON格式的导入导出能力 JSON数据模型也是简单而且易于使用的。5.IPLD 也必须要易于使用。 可以让定义数据的操作变得很简单。在IPLD之上定义新的数据结构不需要具有很多背景知识 由于IPLD 是基于JSON数据模型的, 它应该通过JSON-LD与RDF及 Linked Data standards 兼容 IPLD序列化格式(在磁盘上,传输中)都需要快速和空间有效 (不能用JSON格式存储, 而是应该用CBOR或其他格式) IPLD 加密哈希散列必须可升级 (使用multihash)
如下特性是加分项:
1. IPLD不应该包含错误的数据,e.g. 存储不完整的JSON.
2..IPLD 应该可升级, e.g. 如果一种更好的在磁盘上存储的格式出现了,系统应该可以只要花费很小的代价就升级 IPLD 对象应该可以可以解析属性,而不仅仅是 merkle links.
3. IPLD 事先定义的格式应该容易实现和转化 IPLD 事先定义的格式应该在不获得整个对象的情况下也可以搜索(CBOR 和 Protobuf 已经可以做到).
参考链接
https://github.com/ipld/specs/blob/master/IPLD.md
联系微信:bitwiki