主页 > imtoken国际版和国内版 > 区块链硬核分析(一):区块链是共享数据库吗?

区块链硬核分析(一):区块链是共享数据库吗?

imtoken国际版和国内版 2023-12-11 05:13:19

编者介绍:区块链作为一种新兴的信息技术,越来越受到关注。区块链凭证存储技术的出现,不仅突破了传统电子证据应用的痛点,而且具有不易篡改、去中心化存储等技术特点,符合电子数据实体凭证存储和被认为具有很大的发展潜力。本文作者对区块链进行了分析。它真的是一个共享数据库吗?

一、简介

近年来,学术界和工业界对区块链的理解和应用存在很多误解,我在过去的文章中也逐渐澄清和重新定义。

但是,我总觉得没有尽头,也没有具体的话题。最近由于分布式产业协作模型的设计,每当区块链技术的应用出现微妙之处,我觉得需要一系列的文章来一一解释这些误解。

希望通过我的反复倡导,能够为区块链行业的应用提供更多的解决方案和定义。

这一次,我们将首先讨论“区块链是共享数据库”这句话是否有问题。

区块链在百度百科中是这样描述的:“区块链是信息技术领域的一个术语,本质上是一个共享的数据库,其中存储的数据或信息具有“不可伪造”、“可追溯”等特点。 ”、“公开透明”、“集体维护”。

可以说,大部分人认为区块链是共享数据库,受百度百科影响很大。

接下来,我们来分析一下什么是共享数据库?

二、什么是共享数据库?

我通过“知网”搜索关键词“共享数据库”,没有找到直接匹配的论文,而是更多关于数据共享模型的相关论文;通过百度百科词条搜索也没有找到“共享数据库”的概念描述。有“共享存储”(概念完全不同,有兴趣可以自行搜索)。

可以说,“共享数据库”长期以来一直不是学术和系统软件实践的概念,“共享数据库”更多的是互联网造词的变形产物之一。这是因为,无论从数据集成和共享模式分析,还是从数据库分类分析,“共享数据库”都是一个伪命题。

首先,从数据库的定义来看:“数据库是按照数据结构对数据进行组织、存储和管理的仓库。它是计算机中长期存储的、有组织的、可共享的大量数据的集合。 ,并统一管理”[1]。

区块链是什么

也就是说,数据共享本身就是数据库的基本功能之一,不需要额外使用区块链技术来建立数据库的数据共享能力。

其次区块链是什么,从数据库分类的角度来看,目前常见的分类按照数据结构的组织方式可以分为:“关系型数据库”和“NoSQL数据库”;根据部署方式的不同,可以分为:“单机数据库”和“分布式数据库”等,从来没有按照数据共享程度分类的数据库。

此外,从数据共享方式来看,业界往往采用数据集成的方式,实现不同来源、不同格式、不同特征的数据的逻辑或物理集成,为企业提供全面的数据共享。

通常采用联邦、中间件模型和基于数据仓库的方法来构建数据集成系统,有很多成熟的框架可以使用。

因此,“共享数据库”的概念在数据库技术的发展或企业数据共享模式中从未出现过,因为开发数据库软件的初衷本质上是为了解决数据的组织、存储、管理和共享。

三、为什么你认为区块链是一个共享数据库?

上面提到的“区块链是共享数据库吗?” 是个伪命题,因为数据库的使命之一就是提高数据访问和共享的便利性,那我们为什么会有这样的定义呢?

我猜想“区块链是一个共享数据库”主要是受到一些常见的底层区块链平台或产品的影响。

首先,大部分公链平台,比如比特币、以太坊、EOS等,本身并不是一个通用的底层区块链平台。它们都是基于点对点资产交易的区块链相关技术的组合应用,包括:加密技术、分布式技术、P2P数据传输、共识算法、链式数据结构、博弈论等。

技术的应用服务于点对点、安全、高效的资产交易。因此,在非资产加工行业,如政务、产业、供应链等,直接使用基于公链的区块链技术往往是不兼容的。

既然公链平台的业务目的很明确,大家就不讨论比特币是不是共享数据库了。

其次,在大多数已经开发出联盟链应用的行业中,Apache Hyperledger 系列平台在底层广泛使用,深受 Hyperledger 的影响。

区块链是什么

以 Hyperledger 的核心 Fabric 为例,Fabric 是一个通用的区块链平台,业务用途不明确。从下图中可以看出,Fabric 的节点主要由智能合约(早期的 Chaincode)和分布式账本组成。节点中的数据主要由分布式账本 Ledger 存储。

Fabric 节点组成来源:Hyperledger Fabric 技术白皮书 [2]

分布式账本 Ledger 主要由区块链和全局状态组成。全局状态的更新由区块中的交易触发和决定。见下文:

Fabric 账本构成来源:Hyperledger Fabric 技术白皮书 [2]

从下图可以看出,分布式账本Ledger中的全局状态WorldState确实是分布式KV存储模型。结合分布式节点网络,不难解释为什么区块链是共享数据库。.

Fabric 状态模型来源:Hyperledger Fabric 技术白皮书 [2]

如前所述,Fabric 是一个通用的区块链平台,业务用途不明确。在 Fabric 的账本模型 Ledger 中,它与我们日常生活中所了解的财务账本并无直接关系。Ledger 只是一个通用的 KV 存储模型。您可以存储任意数据。

在Fabric的实际使用中,如果没有领域模型驱动,Fabric就是一个真正的分布式数据存储架构。

受这个因素影响,其实在区块链行业的应用中,我们广泛使用Fabric的全局状态来存储World State,实现分布式存储链。

区块链是什么

我在其他文章中反复强调,如果将区块链定位为分布式数据存储机制,与目前常用的分布式数据库相比,不会有任何技术优势,但实现起来更复杂区块链是什么,效率更低。

四、数据共享独立于数据存储结构

通过以上分析,确实可以将以Fabric为代表的通用区块链平台定义为分布式数据存储模型,但这种分布式存储机制能否带来数据共享和开放?

这里有一个误解。我们片面的理解是数据分布会导致数据共享,但是本文要强调的是,数据是否共享与存储结构和部署方式无关。

数据的存储结构和部署方式是物理模型,而数据的共享是业务模型。

在“数据就是资产”、个人隐私保护和商业数据安全被社会舆论加强的当下,决定是否共享数据的关键不是数据如何存储和部署,而是数据的业务必要性。数据共享和多个参与者的需求。利益是否平衡和保障。

单纯使用分布式存储机制来解决“信息孤岛”问题,显然是异想天开。

而且,大部分“信息孤岛”的问题,恰恰是数据的去中心化存储和管理造成的。可以说,数据的分布是现状,而不是前景。

解决数据分散造成的“信息孤岛”问题,首先要分清数据主权的关系。单一数据主权(绝对数据主权)下最有效的方法是数据集成,通过数据联合、数据中间件和数据仓库实现数据聚合。

在多方数据主权(relative data evidence)关系下,是通过法律强制或商业模式驱动,在合法合规的前提下,让数据在数据应用参与方之间安全流动。

在无法建立数据集成的环境下,例如:多方数据主权、集成成本和法律约束,确实可以利用区块链技术建立数据可交易、可流动、可监管的可信数据共享网络.

但此时,区块链技术应用的重点不是分布式数据存储,而是数据资产的交易。如果不建立数据资产交易模型,单纯使用Fabric的全局状态是无法实现数据共享的。

区块链是什么

事实上,以比特币为代表的经典区块链技术已经证明,区块链分布式节点中的数据存储只是为了保证每个节点能够在本地高效地验证交易数据的真实性,而不是为了数据共享。为最终目的。

五、新技术驱动总是首先带来哑铃效应

进入互联网Web2.0时代以来,从大数据、AI、5G、区块链到今年的量子计算,大量新技术、新名词涌入行业。

每一个新技术与产业的结合,都无法避免国内产业圈技术认知的“哑铃效应”,即哑铃的一端是高度概念化和抽象的,而另一端是高度实例化和工具化的。

区块链技术的兴起也是如此。一方面,将区块链描述为一种去中心化的概念化和抽象化,以网络自治取代中心化系统。价值互联网;另一方面,区块链被描述为共享数据库,一种分布式存储工具。

为什么会产生这种认知?我认为一个很大的原因是,一项新技术的突然崛起,往往只是被几篇论文和几个应用场景点燃。

然而,广泛领域的应用型配套研究并没有完全跟上。使用高度概念化、抽象或实例化和工具化的定义,总是可以在现实世界中找到映射关系,这是一种低成本的解释路径。

可以说,新技术发展的哑铃效应是一个必然的过程,但是随着实践领域新技术知识的积累和模型的沉淀,哑铃的两端会不断的修正以创造价值感知更流畅,更实用。

爱因斯坦说:“你不能用你创造它的思维水平来解决问题”,看待新技术往往不能直接从现实事物中匹配和映射,而是需要创新思维来开发和改进新技术。应用领域。技术的定义和价值。

六、总结

区块链技术在一定程度上确实可以充当分布式数据库或数据共享机制,但在实际应用中,与传统数据集成框架相比并无优势。

同时,由于采用分布式共识算法、P2P网络传输和区块数据结构等技术,系统复杂度较高,性能和可维护性较差。

区块链是什么

如此巨大的代价只是为了建立分布式一致的存储机制,显然得不偿失,也没有实际的商业前景。

区块链技术的使用需要注意构建分布式、点对点、安全、公平的交易环境,在优化数据交易环境的前提下,间接实现数据的充分共享和利用。

可以说,在数据共享领域,区块链技术只是基本条件之一,而非绝对因素。在数据所有权去中心化的环境中,决定数据是否可以共享的最重要的事情是业务和业务模型的建立。

参考:

[1]百度百科数据库/103728

[2] Apache hyperledger-fabric-readthedocs-io-en-release-2.0.pdf

相关文章:

《我们真的了解区块链吗?——重新认识区块链的商业价值》

#专栏作家#

黄锐,大家都是产品经理专栏作家。高级系统架构师,高级产品经理,多家大型互联网公司顾问,金融机构及高校客座研究员。主要关注新零售、工业互联网、金融科技和区块链行业应用板块,擅长产品或系统的整体设计和规划。

本文最初发表于人人都是产品经理,未经允许禁止转载

题图来自Unsplash,基于CC0协议

奖励作者,鼓励TA抓紧创作!

欣赏