11月24日,由中国计算机学会主办的首届中国区块链技术大会(China Computer Federation ChinaBC 2018)在杭州未来科技城开幕。在下午举行的“区块链与密码学”分论坛上,北京信息科学技术研究院副院长陈性元作了题为“区块链技术在大数据共享和服务中的应用思考”的演讲。
以下为演讲内容,由整理发布:
大家好,今天很高兴能在这里分享我对区块链技术在大数据共享和服务中的应用的一些思考。今天的演讲分为三个部分:
1.大数据共享服务是时代必然要求
2.大数据共享服务面临的主要挑战
3.用区块链技术破解大数据共享服务之难题
大数据共享服务是时代必然要求
我们知道,“共享”是大数据时代的根本要求。2008年,“大数据”的概念首次在《大数据时代》这本书中提出,2008年9 月,美国《自然》(Nature)杂志推出了名为“大数据”的封面专题,专题中有个很重要的文章叫做《Big Data–The next google》。它将大数据与谷歌相提并论,这里的“谷歌”并不是专指谷歌,而是泛指互联网的搜索引擎。足以看出,大家很看好大数据在那个时代的发展。
2008年–2011年,大数据面向各领域的应用不断深化。特别是2011年2月,《科学》(Science)联合其姊妹刊推出了一期面向大数据应用的专刊–“Dealing with data”,从互联网技术、互联网经济学、超级计算、环境科学、生物医药等多个方面介绍了海量数据所带来的技术挑战。2012年以来,大数据得到了各个国家的高度重视。2017年,中共十九大报告指出:
加快建设制造强国,加快发展先进制造业,推动互联网、大数据、人工智能和实体经济深度融合,在中高端消费、创新引领、绿色低碳、共享经济、现代供应链、人力资本服务等领域培育新增长点、形成新动能。
可以看出,人工智能和大数据不仅是一种技术,而是经济发展的新动能。同时,大数据还是社会发展的新引擎,大数据也成为了塑造国家竞争力的战略制高点之一,并作为颠覆性创新技术,改变人们的生活方式。
随着大数据的作用越来越大,高度共享和充分利用成为了实现大数据价值和提升大数据效能的核心目标。但是,这并不容易。
“共享”是大数据时代的根本要求。习近平总书记在中央全面深化改革委员会第三次会议中说,要将信息交换与共享同机构改革、投资审批等作为深化简政放权、优化服务改革的重要举措。可以看出,要简政放权、优化服务改革、提升政府的执政能力更有利于发展经济,而信息交换与共享信息非常重要。另外,
《中华人民共和国国民经济和社会发展第十三个五年规划纲要》指出,促进“互联网+”新业态创新,鼓励搭建资源开放共享平台;
《“十三五”国家信息化规划》指出,打破信息壁垒和孤岛,实现信息跨部门跨层级共享共用;
《国务院关于积极推进“互联网+”行动的指导意见》指出,加快形成以开放、共享为特征的经济社会运行新模式,建立数据共享交换标准体系,打通政府部门、企事业单位之间的数据壁垒;
《国务院关于加快推进“互联网+政务服务”工作的指导意见》指出,推进政务信息共享,打通数据壁垒。
数据安全的现实形势严重制约着“共享”。从一些典型的大数据安全事件可以看出,数据涉及到公民隐私、军事机密、政治政权等方面。比如:
2017年美国征信机构Equifax数据泄露事件,导致几乎全美一半人口的个人敏感信息掌握在黑客手中;
2017年NSA数据泄露事件,使得美军超过100GB绝密数据暴露在亚马逊上;
2018年Facebook事件,剑桥分析公司利用非法收集的Facebook用户信息干扰美国大选。
所以,大数据既要共享,又要安全。
大数据共享服务面临的主要挑战
经过充分的研究,我们形成了基本的共识,就是大数据共享服务面临的主要挑战有“不愿”、“不敢”和“不能”。
“不愿”:不愿意共享数据,根本原因是利益的藩篱。数据往往代表着利益或权利,如果我把数据给你了,那我能得到什么?当然还有价值的认可与激励、责任认定、相互信任的关系等问题。区块链技术在解决这些问题上具有天然的优势。
“不敢”:主要是安全问题:一是大数据安全防护既要防外,更要防内,比如同态密码,即使是组织内部的成员也无法看到隐私信息;二是大数据安全监管,数据使用情况不清,系统安全状况不明。
“不能”:
一是受利益藩篱的制约。解决价值激励的问题;
二是受分析技术的制约。要突破多中心大数据分析关键技术;
三是受大数据安全地带制约。既要保证大数据安全,还要不影响大数据应用效能。
所以,发挥大数据共享服务效能的前提是安全共享、可信服务,这就要破解激励与价值认可、安全与责任认定、分析与全维共享等难题。
用区块链技术破解大数据共享服务之难题
要解决“不愿”、“不敢”和“不能”等问题,本质上还是安全的问题。这里我简单地介绍一下大数据安全的技术架构。我认为大数据安全包括三个部分:大数据平台安全、大数据安全监管、大数据安全共享与可信服务。
大数据平台安全
大数据安全监管
大数据安全共享与可信服务
破解大数据共享和服务过程中“不愿”、“不敢”和“不能”等问题,区块链技术拥有天然的优势,可以从技术上解决激励与价值认可、安全与责任认定、分析与全维共享等问题,实现安全共享与可信服务。
数据共享
通过大数据的交流、流转和交换实现数据共享,区块链技术在其中的作用有:
(1)激励与价值认可:构建价值链与智能合约,分类评估与激励,考虑数据的质量与价值,另外就是单位的类别、人员(比如体制内或体制外的人)的类别等等。我认为,我们不能泛泛地谈论智能合约和激励,要根据不同的场景研究不同的方法。
(2)安全与责任认定:可以建立数据目录、属性等链,实现安全互信、访问控制、操作审计、责任认定等等。
(3)与同态加密、属性密码等结合。
注:同态加密:使用同态加密模型,可以保护隐私不受数据处理者自身的影响。不管是尝试访问系统的外部用户,还是内部用户,都无法查看正在处理的个人详细信息,只能看到处理的最终结果。
属性密码:与传统密码学相比,属性密码学提供了更加灵活的操作(比如加解密)关系。例如,在属性加密机制中,密文和密钥都与一组属相相关,加密者可根据要加密的内容和接收者的特征信息制定一个由属性构成的加密策略,而产生的密文只有属性满足加密策略的用户才可以解密。
要结合具体的服务对象,和数据交易、流转、交换的实际情况,从智能合约到链的结构。
信息共享
通过多中心的大数据分析来实现信息共享,区块链技术在其中的作用有:
(1)分析与知识共享:属地化原位计算+多中心大数据协同分析理论与技术,值得关注。
(2)激励与价值认可:构建价值链与智能合约,分类评估与激励,考虑知识价值,对整体分析结构贡献度,另外就是单位的类别、人员(比如体制内或体制外的人)的类别等等。
(3)安全与责任认定:可以建立数据目录、属性等链,实现安全互信、访问控制、操作审计、责任认定等等。
知识共享
通过可信隔离计算实现信息、知识共享,主要思路是数据本地或加密共享存放,可以在可信隔离计算环境进行信息检索、分析计算。
(1)激励与价值认可:构建价值链与智能合约,分类评估与激励,考虑信息或知识的价值,另外就是单位的类别、人员(比如体制内或体制外的人)的类别等等。
(2)数据加密发布与可问责解密。
区块链技术应用思考
基本原则:要深刻理解区块链的内涵和本质,把握它的概念,然后结合实际、扬长避短、应用创新。
体系架构:完全的去中心化是不可能的。如果金融领域去中心化,将会扰乱金融秩序。
智能合约:要分类研究,如同大数据中的数据、信息和知识是不一样的。
密码创新:量子计算将对密码学造成冲击,所以需要加强抗量子的研究。
运行安全:要考虑通用环境或专用环境,环境如果不安全,那数据早就被篡改了。
谢谢大家。