[区块链] 密码学——Merkle 树

  • 时间:
  • 浏览:0

  在计算机领域,Merkle树大多用来进行完全性验证外理。在外理完全性验证的应用场景中,有点是在分布式环境下进行原来的验证时,Merkle树会大大减少数据的传输量以及计算的复杂度。

  Merkle哈希树是一类基于哈希值的二叉树或多叉树,其叶子节点上的值通常为数据块的哈希值,而非叶子节点上的值是将该节点的所有子节点的组合结果的哈希值。

  如下图所示为有两个 Merkle哈希树,节点A的值须要通过节点C、D上的值计算而得到。叶子节点C、D分别存储数据块001和002的哈希值,而非叶子节点A存储的是其子节点C、D的组合的哈希值,类似于 非叶子节点的哈希值被称作路径哈希值,而叶子节点的哈希值是实际数据的哈希值。

  当数据从A端传到B端时,为了检验数据的完全性,只须要验证A、B端上所构造的Merkle树的根节点否是一致即可。若一致,表示数据在传输过程中没办法 地处改变。若不一致,说明数据在传输过程中被修改。只要通过Merkle树很容易定位找到被篡改的节点。定位的时间复杂度为O(log(n))。

  比特币的轻量级节点所采用的SPV验证但是我利用Merkle树你这人 优点。

  区块链中的Merkle树是二叉树,用于存储交易信息。每个交易两两配对,构成Merkle树的叶子节点,进而生成整个Merkle树。Merkle树使得用户可不不能通过从区块头得到的Merkle树根和别的用户所提供的里边哈希值列表去验证某个交易否是中含在区块中。提供里边哈希值的用户无须需但是我可信的,不可能 伪造区块头的代价很高,而里边哈希值不可能 伪造说说会导致 验证失败。

  通常,加密的hash法律土措施像SHA-2和MD5用来做Hash。但不可能 仅仅外理数据都有蓄意的损坏或篡改,可不不能改用或多或少安全性低但速度高的校验和算法,如CRC。

  Second Preimage Attack: Merkle tree的树根无须表示树的速度,这不可能 会导致 second-preimage attack,即攻击者创建有两个 具有相同Merkle树根的虚假文档。有两个 简单的外理法律土措施在Certificate Transparency中定义:当计算叶节点的hash时,在hash数据前加0x00。当计算外部节点是,在前面加0x01。另外或多或少实现限制hash tree的根,通过在hash值前面加速度前缀。只要,前缀每一步会减少,不到当到达叶子时前缀依然为正,提取的hash链才被定义为有效。

Merkle tree操作:

  1.创建Merckle Tree

  加入最底层有9个数据块。

  step1:(红色线)对数据块做hash运算,Node0i = hash(Data0i), i=1,2,…,9

  step2: (橙色线)相邻有两个 hash块串联,只要做hash运算,Node1((i+1)/2) = hash(Node0i+Node0(i+1)), i=1,3,5,7;对于i=9, Node1((i+1)/2) = hash(Node0i)

  step3: (黄色线)重复step2

  step4:(绿色线)重复step2

  step5:(蓝色线)重复step2,生成Merkle Tree Root

  易得,创建Merkle Tree是O(n)复杂度(这里指O(n)次hash运算),n是数据块的大小。得到Merkle Tree的树高是log(n)+1。

  2.检索数据块 

  为了更好理解,亲们假设有A和B两台机器,A须要与B相同目录下有8个文件,文件分别是f1 f2 f3 ....f8。你这人 刚刚亲们就可不不能通过Merkle Tree来进行快速比较。假设亲们在文件创建的刚刚每个机器都构建了有两个 Merkle Tree。具体如下图:

  从上图可得知,叶子节点node7的value = hash(f1),是f1文件的HASH;而其父亲节点node3的value = hash(v7, v8),也但是我其子节点node7 node8的值得HASH。但是我原来表示有两个 层级运算关系。root节点的value嘴笨 是所有叶子节点的value的唯一形态。

  只要A上的文件5与B上的不一样。亲们为什么我么我通过有两个 机器的merkle treee信息找到不相同的文件? 你这人 比较检索过程如下:

  Step1. 首先比较v0否是相同,不可能 不同,检索其孩子node1和node2.

  Step2. v1 相同,v2不同。检索node2的孩子node5 node6;

  Step3. v5不同,v6相同,检索比较node5的孩子node 11 和node 12

  Step4. v11不同,v12相同。node 11为叶子节点,获取其目录信息。

  Step5. 检索比较完毕。

  以上过程的理论复杂度是Log(N)。 

  3. 更新,插入和删除

  嘴笨 网上有或多或少关于Merkle Tree的资料,但大要素没办法 涉及Merkle Tree的更新、插入和删除操作,讨论Merkle Tree的检索和遍历的比较多。显然,并都有树形态的操作肯定不仅包括查找,也包括更新、插入和删除的啊。后会查到风之舞555的总结的文章,少有感悟,下面引用风之舞555对该要素讲述:

  对于Merkle Tree数据块的更新操作嘴笨 是很简单的,更新完数据块,只要接着更新其到树根路径上的Hash值就可不不能了,原来不不改变Merkle Tree的形态。只要,插入和删除操作肯定会改变Merkle Tree的形态,如下图,并都有插入操作是原来的:

  插入数据块0后(考虑数据块的位置),Merkle Tree的形态是原来的:

  而有的同学在考虑并都有插入的算法,满足下面条件: 

  • re-hashing操作的次数控制在log(n)以内
  • 数据块的校验在log(n)+1以内
  • 除非原始树的n是偶数,插入数据后的树没办法 孤儿,只要不可能 有孤儿,没办法 孤儿是最后有两个 数据块
  • 数据块的顺序保持一致
  • 插入后的Merkle Tree保持平衡

  只要里边的插入结果就会变成原来:

  或多或少,Merkle Tree的插入和删除操作嘴笨 是有两个 工程上的你这人 的问题,不同你这人 的问题会有不同的插入法律土措施。不可能 要确保树是平衡的不可能 是树高是log(n)的,可不不能用任何的标准的平衡二叉树的模式,如AVL树,红黑树,伸展树,2-3树等。你这人 平衡二叉树的更新模式可不不能在O(lgn)时间内完成插入操作,只要能保证树高是O(lgn)的。没办法 很容易可不不能看出更新所有的Merkle Hash可不不能在O((lgn)2)时间内完成(对于每个节点如要更新从它到树根O(lgn)个节点,而为了满足树高的要求须要更新O(lgn)个节点)。不可能 仔细分析说说,更新所有的hash实际可不不还可不还可否 在O(lgn)时间内完成,不可能 要改变的所有节点都有相关联的,即亲们要都有都有从某个叶节点到树根的三根路径上,不可能 你这人 情况报告相近。

  实际上Merkle Tree的形态(否是平衡,树高限制几只)在大多数应用中无须重要,只要保持数据块的顺序也在大多数应用中但是我须要。只要,可不不能根据具体应用的情况报告,设计其他人的插入和删除操作。有两个 通用的Merkle Tree插入删除操作是没办法 意义的。


拓展知识:

  Hash List 与 Merkle tree 有你这人 异同?

       娓娓道来~~~~~~~

  网络传输数据的刚刚,A收到B的传过来的文件,须要确认收到的文件有没办法 损坏。如何外理?

  :有并都有法律土措施是B在传文件刚刚先把文件的hash结果给A,A收到文件再计算一次哈希只要和收到的哈希比较就知道文件否是损坏。

  只要当文件很大的刚刚,往往须要把文件拆分或多或少的数据块其他人传输,你这人 刚刚就须要知道每个数据块的哈希值。为什么我么我办呢?

  :你这人 情况报告,可不不能在下载数据刚刚先下载一份哈希列表(hash list),你这人 列表每一项对应有两个 数据块的哈希值。对你这人 hash list拼接可不不还可不还可否 计算有两个 根hash。实际应用中,亲们只要确保从有两个 可信的渠道获取正确的根hash,就可不不能确保下载正确的文件。

  只要基于hash list的方案原来有两个 你这人 的问题: 数据块或多或少的刚刚,往往遍历所有数据块的Hash List代价比较大。

  有没办法 并都有法律土措施可不不能通过要素Hash就能校验整个文件的完全性呢?

  :答案是肯定的!Merkle Tree 就能做到!

  Merkle Tree和Hash List的主要区别是,可不不能直接下载并立即验证Merkle Tree的有两个 分支。不可能 可不不能将文件切分成小的数据块,原来不可能 有一块数据损坏,仅仅重新下载你这人 数据块就行了。不可能 文件非常大,没办法 Merkle tree和Hash list都很大,只要Merkle tree可不不能一次下载有两个 分支,只要立即验证你这人 分支,不可能 分支验证通过,就可不不能下载数据了。而Hash list不到下载整个hash list要能验证。


【时间仓促,如有错误,欢迎指正! ||   欢迎留下您的评语!  亲们一并探讨、学习区块链!】

【转载请注明出处!http://www.cnblogs.com/X-knight/


REFERENCE

1.Merkle Tree 学习 http://www.cnblogs.com/fengzhiwu/p/5524324.html

2. Merkle Tree 增删数据http://crypto.stackexchange.com/questions/22669/merkle-hash-tree-updates

3.Merkle Tree、Hash List https://blog.csdn.net/pony_maggie/article/details/74538902