一、大数据与区块链
这个故事还是要从比特币谈起
比特币这个电子现金系统是同时去中介化(个人与个人之间的电子现金无须可信第三方中介的介入)和去中心化(由某个机构负责维护)的(交易双方可以在无须建立信任关系的前提下完成交易)
哈希函数:将任意长的字符串,转变成固定长度的输出(计算过程不能太复杂),只要输入字符串发生微小变化,哈希函数的输出就会完全不同。
区块链:把大的东西切分成很多个区块进行存储,只要其中有一个东西被篡改,下边的数据都不一样,就会被发现
采用区块链(数据结构哈希函数),保障账本不能被篡改,采用数字签名技术,保证只有自己才能够使用自己的账户,采用p2p网络和pow共识机制,保证去中心化的运作方式
区块链是利用块链式数据结构来验证与存储数据,利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问安全的一种全新的分布式基础架构与计算机范式。
三要素:
区块链的本质就是分布式账本,是一种数据库。区块链用哈希算法实现信息不可篡改,用公钥,私钥来标识身份,以去中心化和去中介化的方式,来集体维护一个可靠数据库。
大数据与区块链的区别主要表现在以下几个方面。
(1)数据量。区块链技术是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链处理的数据量小,具有细致的处理方式。而大数据管理的是海量数据,要求广度和数量,处理方式上会更粗糙。
(2)结构化和非结构化。区块链是结构定义严谨的块,通过指针组成的链,是典型的结构化数据,而大数据需要处理的更多的是非结构化数据。
(3)独立和整合。区块链系统为保证安全性,信息是相对独立的,而大数据的重点是信息的整合分析。
(4)直接和间接。区块链是一个分布式账本,本质上就是一个数据库,而大数据指的是对数据深度分析和挖掘,是一种间接的数据。
(5)CAP理论。C(Consistency)是一致性,它是指任何一个读操作总是能够读到之前完成的写操作的结果,也就是在分布式环境中,多点的数据是一致的。A(Availability)是可用性,它是指快速获取数据,可以在确定的时间内返回操作结果。P(Tolerance of Network Partition)是分区容忍性,它是指当出现网络分区的情况时(即系统中的一部分节点无法和其他节点进行通信),分离的系统也能够正常运行。CAP理论告诉我们,一个分布式系统不可能同时满足一致性、可用性和分区容忍性这3个需求,最多只能同时满足其中2个,正所谓“鱼和熊掌不可兼得”。大数据通常选择实现AP,区块链则选择实现CP。
(6)基础网络。大数据底层的基础设施通常是计算机集群,而区块链的基础设施通常是P2P网络。
(7)价值来源。对于大数据而言,数据是信息,需要从数据中提炼得到价值。而对于区块链而言,数据是资产,是价值的传承。
(8)计算模式。在大数据的场景中,是把一件事情分给多个人做,比如,在MapReduce计算框架中,一个大型任务会被分解成很多个子任务,分配给很多个节点同时去计算。而在区块链的场景中,是让多个人重复做一件事情,比如,P2P网络中的很多个节点同时记录一笔交易。
二、什么是区块链,什么是大数据
1、区块链:是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法。
区块链(Blockchain)是比特币的一个重要概念,货币联合清华大学五道口金融学院互联网金融实验室、新浪科技发布的《2014—2016全球比特币发展研究报告》提到区块链是比特币的底层技术和基础架构[2]。本质上是一个去中心化的数据库,同时作为比特币的底层技术。区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次比特币网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
2、大数据:指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
三、区块链的区块是怎么产生的
那作为区块链的数据元素,区块的构成又是怎样的呢?
其实,每个区块的大小被规定不能超过1M,它的结构分为两部分,区块头和区块体。
区块头共80字节,分为6个部分:version,prevBlockHash,merkleRoot,time difficultyTarget,nonce。
version:大小为4字节,记录了区块头的版本号,用于跟踪软件/协议的更新;
prevBlockHash:大小为32字节,记录了该区块的上一个区块的Hash地址;
merkleRoot:大小为32字节,记录了该区块中交易的merkle树根的哈希值;
time:大小为 4字节,记录了该区块的创建时间戳;
difficultyTarget:大小为4字节,记录了该区块链工作量证明难度目标;
nonce:大小为4字节,记录了用于证明工作量的计算参数。
区块体的内容是该区块的交易信息,包括交易数量和交易数据。区块体共分为三部分:
numTransactionsBytes,numTransactions,transactions。
numTransactionsBytes:大小为1字节,记录了交易数量占用的字节数;
numTransactions:大小为0-8个字节,记录了区块内的交易数量;
transactions:大小不确定,记录了区块内存的多个交易数据。
在区块体部分中,numTransactions(记录区块内交易数量)是存储交易信息的重要字段,将numTransactions(记录区块内交易数量)部分使用压缩存储方式,这样可以大量的节约存储空间。numTransactionsBytes字段的存在是为了指出numTransactions在区块体中存在的部位,为读取交易数量而做准备,因此,应最先读取numTransactionsBytes字段值,并根据该字段值的不同做出如下规定:
如果numTransactionsBytes字段值小于253,则交易数量为numTransactionsBytes字段值作为;
如果numTransactionsBytes字段值等于253,则交易数量为numTransactionsBytes字段值之后的两个字节;
如果numTransactionsBytes字段值等于254,则交易数量为numTransactionsBytes字段值之后的4个字节;
否则,交易数量为numTransactionsBytes字段值之后的8个字节。
数字中国是十九大报告中首次明确提出的重大发展战略。以云计算、大数据、移动互联为代表的数字技术应用不再局限于经济领域,而是广泛渗透进入公共服务、社会发展、人民生活的方方面面,需要宏观协调、总体把控、融合发展。
随着新一轮科技革命和产业变革不断深入,全球范围内数字经济浪潮势不可挡。发展数字经济成为全球共识,被称为打开第四次工业革命之门的钥匙。
秉承尼斯大学世界包容性人文精神内涵,始终拥抱变化,勇立潮头,顺应数字经济时代的发展趋势,融合中西文化思维精髓,尼斯大学《区块链及数字经济管理博士》(简称DDE)应运而生。
以此为基石赋能数字经济行业管理者全球化视野及全球化融合思维,整合知识,智慧经营数字经济,推动行业持续发展,为人类命运共同体而贡献力量。因此DDE项目将和数字经济领域同仁协同前进。
如果有区块链类的问题,欢迎私我ღ(´・ᴗ・`)比心~~~~点击咨询
四、区块链与大数据存储究竟有着怎样的关系
区块链和大数据存储的关系如下:
一、数据安全:区块链让数据真正“放心”流动起来
区块链以其可信任性、安全性和不可篡改性,让更多数据被解放出来。用一个典型案例来说明,即区块链是如何推进基因测序大数据产生的。区块链测序可以利用私钥限制访问权限,从而规避法律对个人获取基因数据的限制问题,并且利用分布式计算资源,低成本完成测序服务。区块链的安全性让测序成为工业化的解决方案,实现了全球规模的测序,从而推进数据的海量增长。
二、数据开放共享:区块链保障数据私密性
政府掌握着大量高密度、高价值数据,如医疗数据、人口数据等。政府数据开放是大势所趋,将对整个经济社会的发展产生不可估量的推动力。然而,数据开放的主要难点和挑战是如何在保护个人隐私的情况下开放数据。基于区块链的数据脱敏技术能保证数据私密性,为隐私保护下的数据开放提供了解决方案。数据脱敏技术主要是采用了哈希处理等加密算法。例如,基于区块链技术的英格码系统(Enigma),在不访问原始数据情况下运算数据,可以对数据的私密性进行保护,杜绝数据共享中的信息安全问题。例如,公司员工可放心地开放可访问其工资信息的路径,并共同计算出群内平均工资。每个参与者可得知其在该组中的相对地位,但对其他成员的薪酬一无所知。
数据HASH脱敏处理示意图
三、数据存储:区块链是一种不可篡改的、全历史的、强背书的数据库存储技术
区块链技术,通过网络中所有节点共同参与计算,互相验证其信息的真伪以达成全网共识,可以说区块链技术是一种特定数据库技术。迄今为止我们的大数据还处于非常基础的阶段,基于全网共识为基础的数据可信的区块链数据,是不可篡改的、全历史的、也使数据的质量获得前所未有的强信任背书,也使数据库的发展进入一个新时代。
四、数据分析:区块链确保数据安全性
数据分析是实现数据价值的核心。在进行数据分析时,如何有效保护个人隐私和防止核心数据泄露,成为首要考虑的问题。例如,随着指纹数据分析应用和基因数据检测与分析手段的普及,越来越多的人担心,一旦个人健康数据发生泄露,将可能导致严重后果。区块链技术可以通过多签名私钥、加密技术、安全多方计算技术来防止这类情况的出现。当数据被哈希后放置在区块链上,使用数字签名技术,就能够让那些获得授权的人们才可以对数据进行访问。通过私钥既保证数据私密性,又可以共享给授权研究机构。数据统一存储在去中心化的区块链上,在不访问原始数据情况下进行数据分析,既可以对数据的私密性进行保护,又可以安全地提供给全球科研机构、医生共享,作为全人类的基础健康数据库,对未来解决突发疾病、疑难疾病带来极大的便利。
五、数据流通:区块链保障数据相关权益
对于个人或机构有价值的数据资产,可以利用区块链对其进行注册,交易记录是全网认可的、透明的、可追溯的,明确了大数据资产来源、所有权、使用权和流通路径,对数据资产交易具有很大价值。
一方面,区块链能够破除中介拷贝数据威胁,有利于建立可信任的数据资产交易环境。数据是一种非常特殊的商品,与普通商品有着本质区别,主要是具有所有权不清晰、“看过、复制即被拥有”等特征,这也决定了使用传统商品中介的交易方式无法满足数据的共享、交换和交易。因为中介中心有条件、有能力复制和保存所有流经的数据,这对数据生产者极不公平。这种威胁仅仅依靠承诺是无法消除的,而这种威胁的存在也成为阻碍数据流通巨大障碍。基于去中心化的区块链,能够破除中介中心拷贝数据的威胁,保障数据拥有者的合法权益。
另一方面,区块链提供了可追溯路径,能有效破解数据确权难题。区块链通过网络中多个参与计算的节点来共同参与数据的计算和记录,并且互相验证其信息的有效,既可以进行信息防伪,又提供了可追溯路径。把各个区块的交易信息串起来,就形成了完整的交易明细清单,每笔交易来龙去脉非常清晰、透明。另外,当人们对某个区块的“值”有疑问时,可方便地回溯历史交易记录进而判别该值是否正确,识别出该值是否已被篡改或记录有误。
一切在区块链上有了保障,大数据自然会更加活跃起来。
币盈中国平台上众筹项目的代币都是基于区块链技术开发出来的,相关的信息都会记录到区块链上。
本站所有软件信息均由用户上传发布,版权归原著所有。如有侵权/违规内容,敬请来信告知邮箱:764327034@qq.com,我们将及时撤销! 转载请注明出处:https://www.ssyg068.com/biquanzx/23993.html
发表回复
评论列表(0条)