Kademlia
Kademlia 是一种通过分布式散列表(distributed hash table DHT)实现的协议算法,它为非中心化的P2P计算机网络设计。
Kademila规定了网络的结构,也规定了通过节点查询进行信息交换的方式。
Kademlia网络节点之间使用UDP进行通信。参与通信的所有节点形成一张虚拟网。这些节点通过一组数字(节点ID)来进行身份标识。节点ID不仅可以用来做身份标识,而且可以进行定位(通常是文件的散列或关键词)。其实,节点ID与文件散列直接对应,它所标识的那个节点存储着哪儿能获取文件和资源的相关信息。当我们在网络中搜索某些值时,Kademlia算法需要知道与这些值相关的键,然后在分布式网络中开始搜索。每一步都会找到一些节点,这些节点的ID与键更接近,如果有节点直接返回搜索的值或者再也无法找到与键更接近的ID时,也会停止搜索。
复杂度O(log(n))。
非集中式网络还有更大的又是:能显著低于拒绝服务攻击(denial of service attack,亦称为洪水攻击。DDOS:distributed denial of service attack)
Kademlia基于两个节点之间的距离计算,该距离是两个网络节点ID好的异或(XOR distance), 计算的结果最终作为整型数值返回。
关键字和节点ID有同样的格式和长度,因此可以使用相同的方法计算关键字和节点ID之间的距离。节点ID一般是一个大的随机数,选择该随机数追求的目标是它的唯一性(希望在网络中该节点ID是唯一的)。异或距离和实际上的地理位置没有任何关系,只与ID相关。
选择异或距离是因为通过它计算的距离有和几何距离公式的一些特征:
- 节点和它本身之间的异或距离为0
- 异或距离是对称的:即A到B的距离和B到A的距离是等同的
- 异或距离符合三角不等式:(AB+BC >= AC)
Kademlia搜索的每一次迭代将据目标至少近1bit。
路由表
基于单个bit构建路由表
Kademlia路由表由多个列表组成,每个列表对应节点ID的一位(若节点ID有128位,则节点的路由表将包含128个列表),包含多个条目,条目中包含定位其他节点所必要的数据(通常由其他节点的IP地址,端口,节点ID组成。)