在当前大数据、人工智能、区块链等新科技大行其道的背景下,海量数据在共享、交换、交易过程中的隐私保护问题凸显。在此背景下,隐私计算作为未来解决方案将发挥重要作用。由矩阵元、算力智库、万向区块链实验室、Crypto Innovation School (CIS)和上海市股份公司联合会共同发起的“振金社”正式成立,旨在打造国内首个数据安全与隐私保护专业联盟平台。
公元前520年,古希腊哲学家毕达哥拉斯认为“万物皆数”,并把数当做宇宙万物的本原。
20世纪40年代,计算机的发明让人类文明插上数字翅膀。
2016年,中国数字经济总体量占全国GDP总量超过三成。
2018年9 月,Facebook 宣布,由于安全系统漏洞造成网站受黑客攻击,可能导致近5000 万用户信息泄露,连扎克伯格本人都未能幸免。
2018年11月30日,万豪国际集团旗下喜达屋酒店客房预订数据库被黑客入侵,最多约5亿名客人信息或被泄露,万豪股价应声下跌超5%。
2500年来,从数到数据,从哲学意义到商业价值,即便数并非万物本源,但数据已成为新时代的“石油”。
可以肯定的是,随着数据的价值被广泛认识,如何更高效、更安全地利用数据,正成为全社会关注的问题。
2018年12月1日,由矩阵元发起,算力智库主办的“Web 3.0时代隐私计算构建新数据共享世界”主题私享会在深圳举行。来自全国各地的学者、金融机构和技术服务商等业界专家在当前大数据、人工智能、区块链等新科技大行其道的背景下,探讨了海量数据在共享、交换、交易过程中的隐私保护问题,以及隐私计算作为未来解决方案将发挥的重要作用。
会上,由矩阵元、算力智库、万向区块链实验室、Crypto Innovation School(CIS)和上海市股份公司联合会共同发起的“振金社”正式成立。作为Web 3.0时代下专注讨论隐私安全与数据共享的联盟组织,“振金社”联合了权威学术机构、科技企业、领先数字经济智库、主流媒体等作为首发布道者,旨在打造国内首个数据安全与隐私保护专业联盟平台。
算力智库总裁燕丽发表演讲
万向区块链董事长肖风
万向区块链董事长肖风在致辞中表示,随着人工智能的兴起,隐私计算成为世界性话题。目前中国在隐私计算领域不落后于海外,随着区块链的进展,已经找到了理论的技术路径,希望行业一起在工程化系统化方面共同努力,走向应用。“振金社”的成立就是希望国内业界共同联合发展隐私计算,在脱离“币”、脱离投资融资的基础上谈谈底层技术。
矩阵元CEO孙立林
矩阵元CEO孙立林表示,区块链解决不了隐私保护,要解决这一问题就不得不转到密码学。只有隐私的固化才能给数据确权、估值、定价,这才是商业模式。
深圳证券交易所高级经理计胜侠在会上做了《区块链的隐私问题浅析及存证案例分享》的演讲。他表示,目前数据隐私泄露问题严重,国内外都出台了相关法律规定。但区块链由于每个节点都有相同数据,泄露风险更为突出。区块链上的隐私保护实践应基于哈希算法+非对称加密/签名。
隐私计算:现实需要
与会嘉宾普遍认为,当前数字经济中数据价值得到充分发掘,但数据隐私泄露已经成为最受关注的问题。另外,掌握大量数据的不同机构,因担心数据泄露而不愿共享数据,形成了“数据孤岛”,造成无法充分发挥数据价值。
武汉大学教授何德彪
武汉大学教授何德彪指出,当今社会在享受互联网便利的同时,却让渡了部分安全性,增加了隐私数据泄漏的途径,导致了个人信息的非授权使用和泄露。据统计,涉及个人信息泄漏的前5大行业分别为:互联网、金融、政府机构、教育、医疗,占全部行业个人信息泄露的69.2%。这几大行业都偏重于存储、分析、使用个人信息,并已渗透到生活的各个方面。
何德彪教授进一步表示,隐私敏感数据具体可分为:客户行为信息、身份信息、金融交易信息、征信信息、医疗信息、保险信息等。
矩阵元COO谢红军
矩阵元COO谢红军认为,互联网的发展,使得数据成为战略资源,“大数据”下诞生了“流量经济”,催生了依赖“大数据”的“广告”公司。在此背景下,数据隐私安全问题越来越普遍和常见,出现了许多强制授权、过度授权的超范围收集个人数据现象,用户的便利性成为了牺牲隐私性的借口,但这样的“合理性”应该得到纠正。
谢红军表示,掌握大量数据的机构和主体,因出于数据泄露及自身利益考虑,不愿开放自己的内部数据,尤其是重要数据。但任何单一机构永远都只能掌握数据全集的一部分,只有将多方数据协同计算才能实现数据价值的最大化。这时候,就需要借助“隐私安全”技术,来解决数据隐私保护和数据流通与共享之间的悖论。
根据中国信通院发布的《大数据安全白皮书(2018)》,隐私安全是指利用脱敏、匿名、密码学等技术保障个人数据在平台上处理、流转过程中不泄露个人隐私信息。谢红军则指出,隐私保护是建立在数据安全防护基础之上的保障个人隐私权的更深层次安全要求。
作为数据隐私问题的解决方案,以安全多方计算(MPC)为代表的隐私计算其核心价值就在于:在本地数据不被归集、隐私不被泄露的前提下,各方仍然能够通过执行既定逻辑的运算得到一个共同想要的结果。在MPC整个计算协议执行过程中,各参与方对自身数据始终拥有控制权,只有计算逻辑公开。计算参与方只需参与计算协议,无需依赖第三方就能完成数据计算,并且各参与方拿到计算结果后也无法推断出原始数据。
据谢红军介绍,除安全多方计算(MPC)外,基于密码学算法的新型隐私安全技术还包括代理重加密 (PRE)、零知识证明(ZKP)、同态加密 (HE)、监管审计等。
当然,除了有认知、有技术,还要有应用、有场景。正如肖风在会上所说,光有技术不行,必须要结合场景,因为只有场景才能告诉我们怎么去做工程。
隐私计算:产业召唤
本次会议吸引了近百位来自金融、医疗、科研、科技、投资等领域的专业人士参加,其中包括了欧菲科技、得润电子、华鹏飞等上市公司,足见各产业对隐私计算的认知和期盼。
电子科技大学教授罗蕾
电子科技大学教授罗蕾以智能网联汽车(ICV)为例,介绍了数据安全与隐私保护对于该行业的重要性。据她介绍,随着车辆保有量的激增,车联网用户将爆炸性增长。每辆车产生的数据每小时达到5G-250G之多,市场对车辆数据的应用存在广泛需求,仅二手车交易中数据价值保守估计可达1.5亿/年。
在这一复杂的生态中,数据主要来自于车辆、配件厂商、4S店、交警、车管所、地图、车联网平台、保险商、二手车、租赁等,包括了驾驶数据(驾驶操作、行驶情况、路线等)以及非驾驶数据(维修、销售、保养、保险、出行与消费习惯等)。同时,这些数据的需求方也来自多方面,如车联网平台、保险公司、市政建设、交管部门、租赁及二手市场等。
罗蕾教授指出,要让汽车数据发挥价值,有两个前提:第一,应汇聚多维度、多领域的海量大数据。第二,应合法合规使用数据,即保护数据隐私、保障数据权益。她表示,在数据自身安全方面,应采用现代密码学算法主动保护数据。在数据防护安全方面,则采用现代信息存储手段主动防护。
与会专家认为,安全多方计算在现实中应用价值巨大。比如,在医疗健康和基因数据领域,隐私性要求高、数据量大,可通过MPC让不同机构实现共享数据,保证实际数据保留在医疗机构的本地系统,同时又能共同计算出需要的数据结果。在金融行业,借助隐私计算进行多方数据协同计算将彻底改变传统互联网用户标签和画像处理方式,改善大数据收集、清洗、分析模式下的风控和精准营销模型,大幅提高金融服务水平。此外,隐私计算也有助于物流行业中不同数据方之间的协同计算,确保数据不离开本地,从而杜绝数据泄露,解决目前物流大数据行业的痛点。
谢红军表示,隐私计算在金融、供应链、物联网、汽车业等领域都有用武之地。他以基因数据分析为例说明,基因数据作为人最为重要的数据,通常是志愿者或客户自己将其保存于研究机构或者医疗公司中。这些研究机构想对基因数据做深入研究,比如研究某种疾病等,而由于本身存储的基因资源的有限性,他们希望利用其他机构或企业的数据。但是,这些数据是客户最敏感的个人数据,或因其他原因,导致不同机构的基因数据不能互相共享。
在这种情况下,通过在分布于两个不同地域上的机构各自部署一个MPC节点(包含MPC算法的软件部署和SDK的部署),两机构无需将各自基因数据给到对方,通过MPC协议就可完成对两地基因数据的相关计算。谢红军还从技术层面介绍了MPC的基本逻辑、计算流程、基本框架等。
在技术层面,谢红军介绍了安全多方计算的基本逻辑、计算流程、基本框架等。据其透露,矩阵元已拥有多项密码学核心技术专利,并与武汉大学、中国科学院、上海交通大学深入开展技术攻关和科研合作,在金融、医疗、保险、征信等领域积累了应用经验。