前言:人工智能的发展需要数据来喂养,但数据获取有很大的壁垒。区块链时代能打破数据壁垒吗?未来会产生什么样的情况?为什么降低数据获取壁垒的原则是公链优先?基于区块链的数据交易市场未来有可能诞生吗?本文来自于元界联合创始人兼CTO陈浩投稿。欢迎大家一起留言探讨。
今天我们从数据视角来看公链的发展,看看得出什么结论。
数据壁垒:人工智能的困境
我们先从人工智能开始。众所周知,曾经大数据的火热,推动了人工智能的发展,尤其是监督学习种类的人工智能算法,互联网行业也提出了“数据驱动”的口号。然而正如大家看到的,似乎人工智能的应用并没有向币圈一样席卷全球,那这是为什么呢?
借用吴恩达的原话:
“AI的崛起正改变着公司的竞争格局。公司的壁垒不再是算法,而是数据,让算法利用足够的数据,使得产品运行起来,然后通过产品来获取用户,用户在提供更多的数据……周而复始,又举例:搜索公司,搜索公司有着大量的数据,显示如果用户搜了这个词,就会倾向于点哪个链接。”
其实这里暗示了一个很重要的问题,当人工智能的算法不再是瓶颈时,抢占数据的高地就是运营的第一准则。那么问题又回来了,如果已经存在数据壁垒,那么其他企业想进入人工智能怎么办?这会影响人工智能的发展吗?
我认为会的,互联网行业既存数据壁垒让很多初创型公司望尘莫及。
区块链上会产生类似的数据壁垒吗?我的回答:是。
首先要明确一点,区块链上的数据来自区块链应用。我在今年一月份的文章《区块链应用的去中心化只是一个乌托邦》中表示基于区块链的应用想要完全去中心化是不可能的。
那么接下来的问题就是,什么程度的去中心化应用才可以被接受呢?我认为这个没有统一的答案,而是取决于场景。这也是区块链应用落地的困难之一,人们首先要达成共识,其次接受不同程度的去中心化。
那么这些应用的表现形式是什么呢,我认为是混合型区块链应用(Hybird-dApp)。
为了解释这个概念,我们参照移动端开发的Hybird App,H5与原生页面混合型APP。那么在Hybird-dApp中,区块链所提供的功能相当于是H5部分,其他都是Native的。
如下图所示:
从图中我们可以看到,由区块链部分提供的功能是去中心化的,而Native是由中心化管理的。举个例子,当用户产生了大量的视频存储需求时,我们优先选择Centralized HTTP server,而视频的著作权我们可以使用Blockchain dAPP来搞定(围绕着token)。
这样的好处是,兼顾了区块链资源的珍贵和高昂的存储需求。其实这样的APP已经大量出现,相当多的行情APP和钱包APP,除了用户私钥是去中心化的(寄宿在用户设备中为用户提供支付功能)。除了支付功能之外的其他功能,几乎都是中心化设施提供的,例如资讯推送,IM聊天等,这本身已经符合Hybird-dAPP的定义了,只是这个概念没有人单独提出来。
现在我们扩大视角,难道只有支付功能应该是去中心化的吗?显然不是。随着行业的发展,会涌现出相当多一批Hybird-dAPP,提供多元多样化的服务,例如金融服务、游戏娱乐等等。
说到金融服务,又不得不提到数字货币交易所。目前数字货币交易所已经积累了大量用户数据,其中归交易所私有的有KYC数据,成交明细数据,高净值持币用户的数据,到个人的充提数据,这些我们统称为平台私有数据;而公众可查的就只有统计级别的充提数据(交易所出入金)。
由于公链的账本都是公开的,所以充提数据才可以统计,这也是公链账本的一个特性:只要分析师掌握一点点辅助数据,就可以在链上挖掘出大量有价值的数据。
现在我们在这里引出我们的主题:区块链上的数据壁垒会在交易所以及上述Hybird-dAPP中心化部分产生。
这会逐渐形成两个壁垒:
1. 分析壁垒,具有丰富数据分析经验+对区块链深刻理解的分析师,单单从公链账本本身就能挖掘出很多有用的数据,这属于人才壁垒,通过挖人就可以解决。
2. 私有数据壁垒,单纯地依靠公链数据是很难对用户进行画像的,一旦掌握少许链外数据作为引子,就可以推导出超量的有用数据,那么谁积累的私有数据越多,谁对用户的画像就更为准确,利用人工智能加速扩张商业版图的可能性就越大。而私有数据壁垒会比分析壁垒更难打破。
降低区块链的数据壁垒:公链优先原则
通过上述分析,我们得出了积累私有数据、构建数据壁垒是未来区块商业竞争的核心竞争力的结论。我们接下来通过图示来进一步分析:
区块链链上数据和平台私有数据的对垒示意图
经过一段时间的竞争,C平台倒闭,B成为头部,拥有大量私有数据
上面两张图展示了仅平台之间的竞争导致的私有数据壁垒的产生,然而这不是最致命的,最致命的是下面一种情况:
平台倾向使用传统技术,公链账本不敌私有数据
公链作为一种去中心化、去信任的优质资源,被中心化商业平台“联合抵制”了,公链的地位被极大地弱化,起不了监督平台的作用。而理想的情况应当如下:
人们倾向于使用公链记录数据,包括商业化平台
那么图4和图3的区别是什么呢?为什么说图4是理想化的情况呢?
我们知道,公链的产生源自去中心化的理念,也就是公链作为基础设施提供了去中心化的协议,来帮助人们构建商业应用,这些应用可以是DApp或者Hybird-dApp,但我们并没有脱离去中心化理念的范畴。
我们将去中心化的理念再细化一下可以发现,其实去中心化体现在两点:
公开透明可监督
用户私权至上
图4很明显符合以上两点,而图3的情况是反其道而行之。
其实从数据的角度,从人工智能身上吸取经验,维护公链作为公开账本的价值是非常重要的,一个积累了大量数据的公链,可以养活相当多数量的中小微企业,这无形中也加速了行业发展,间接地扩展了这个公链的应用生态。
那么根据上述分析,我觉得有必要提出一个区块链应用的开发原则——公链优先原则。
公链优先原则:在公链可负载和应用成本可控的情况下,优先使用公链,而不是传统技术(含DLT)。
文章的最后,给大家提个问题,用户使用平台服务产生的数据,这个数据的所有权到底归属谁?