4月27日下午,、比原链、比特大陆联合举办的以“区块之链 智能之芯”为主题的2018区块链+人工智能高峰论坛在杭州举办,众多行业领军人物和重磅嘉宾到场,共同解读区块链共识算法、人工智能、AI驱动区块链共识系统进化等相关前沿科技。
在本次论坛上,比原链创始人长铗和比特大陆CEO詹克团共同宣布“比原链&比特大陆人工智能实验室”正式成立,同时,比原链与库神、imToken、比特派、币信、Kcash、Cobo、Bepal、虎符等8家加密货币钱包服务提供商,以及蚁池、鱼池F2Pool、BTCC国池、蜘蛛矿池、UUPOOL、厦门矿池、币印矿池、91POOL矿池等8家知名矿池在现场进行了合作签约。
比特大陆人工智能产品总监汤炜伟做了以“AI将驱动又一个星球级计算”为主题的演讲,描述了AI行业对算力的巨大需求,需要怎样的计算架构以及AI和区块链的关系。
我们先看一下AI世界在发生什么,首先AI是基础性平台的生产力技术。这样的技术分为几种维度,而现在最流行的就是语音识别、图像识别、自然语言处理、机器人技术等等多种AI技术,它们与行业很完美的结合起来,极大赋能了这些新行业的场景,比如在安防、互联网、消费电子、汽车医疗、金融等多个领域都有相当多的落地和应用。
我们看一下AI这个行业发生了巨大的改变,它依靠了三大要素,算力、算法和数据,需要多大的数据和算法呢,大家手里都有智能手机,智能手机在生成了很多新的内容,比如一些互联网的视频、短视频、直播,各种各样拍别人或者自拍的图片。我们以34亿互联网客户20分钟视频举例,处理这样规模的数据需要50个Exa Flops的计算能力,这样的计算能力也是相当大的。
另外一个应用场景,语音和NLP来看,30分钟语音数据处理需要大概70个Exa Flops处理能力,这个处理能力也是非常大的。另外就是在街头和室内无数的安防摄象头,2017年全部拿来做视频分析,把视频里的人、车、物、人脸全部提取有效特征和属性,这样的计算量达到210个Exa Flops。根据市场调查2020年将进一步提升,达到1000个Exa Flops计算规模,这个计算规模也是非常巨大的。
地球上整个星球计算基础设施的规模,PC和笔记本。我们得到IDC或者其它市场调查数据显示,每年会销售2亿5万颗CPU,手机这一块每年销售15亿颗手机芯片。在服务器这一块大概2千万个服务器芯片销量,对于它的核心数、主屏数、持有年限以及计算能力,总共需要的功耗PC笔记本3千个兆瓦,手机达到900个兆瓦,Server1600个兆瓦,Bitcoin更高一点。
Deep Learning的计算量非常之巨大,达到了300个Exa Flops的规模。处理这样规模的计算力在Deep Learning需要多大功耗,PC笔记本、手机、服务器、Bitcoin都在这样的功耗规模,Deep Learning需要3千个兆瓦的数据中心计算。这里有一个前提假设,每个TFlops10瓦,这也是目前主流GPU的能耗范围。
基于目前主流Deep Learning和AI深度学习计算架构来看,主流使用CPU,大部分使用GPU架构。处理刚才互联网视频,互联网音频以及安防视频需要多大的计算能力呢,分别是50、70、71,210的Exa Flops,通过分别需要的CPU计算方案和GPU计算方案可以看到是非常巨大的数字。CPU计算的互联网视频达到50亿瓦的规模,需要消耗500亿美金成本。如果用GPU稍微好一点,也200亿美金的成本,以及10亿瓦的功耗。
依此类推,我们看到处理这三个应用场景,尤其是安防加在一起会达到千亿美金,甚至更高的计算成本,以及几十亿瓦的巨大功耗。做一个对比,与世界上最大的科学计算、高性能计算的数据中心来讲,这个相当于重建了几百个甚至上千个超级计算中心,这样的高成本和高能耗很难实现深度学习的计算需求。
深度学习AI到底是什么算法,以及需要什么样的计算架构呢,我们看一下它的特性。长铗刚才讲到AI计算现在流行的深度学习采用了大量矩阵运算和张量运算。
比较早期的神经网络,它需要做输入层,做下载量,做大量的卷积运算,以及很多全网络矩阵运算。有很多连接层,最终得到输出层的输出。运算过程中80%-90%处理的计算能力都用于矩阵和张量运算。
我们以典型人脸识别场景举例,大概需要多大的计算力。检测人脸到跟踪、识别、比对,整个计算能力,每一张大约是25Gflops左右,每一秒需要500个Gflops左右,这个计算力也达到了万亿次计算力的规模,这个计算也是相当密集,比较多的。
自从1980年开始,很多人提出脉动阵列的加工来讲,Google第一个实现了脉动阵列TPU架构,我们也是继谷歌之后实现了这样的脉动阵列架构,把神经元和权重进行脉动式的数据搬运过程,能够很高效的,很有效的把神经网络数据搬到计算NPU里面,实现高效快速的张量运算处理。
我们在2015年底开始AI芯片研发,2017年上半年就成功实现了AI芯片的流片,2017年下半年实现了板卡服务器的量产和出货。
这是这台服务器的样子,它可以做人脸识别,可以做车辆结构化,可以做行人结构化,达到基本的视频分析、视频处理的强大处理能力。
AI和区块链,我们是怎么看它们之间的关系。应该这么说,我们分析了这么多PoW算法,矩阵运算和张量运算,能够设计出非常优秀的PoW算法,尤其是利用矩阵线性运算和非线性运算过程中可以实现类哈希性质不可逆的加密,比如BTM的算法,可以对比一下在神经网络、深度学习这一块的线性运算常用的就是卷积、全连接、Conv、FC。非线性运算包括非线性映射函数,实现了神经网络非线性。实际上在BTM最新的论文里也看到了非常多的矩阵运算线性和非线性带来加密不可逆的特征,比如说FNV的算法,Random Proof,分别在矩阵上,H(X)计算里都体现了非线性操作,实现了不可逆加密的优秀特征。
人工智能芯片和POW公链结合在一起形成强大的算力,为PoW公链非常好的保驾护航。BYTOM的PoW算法充分利用了张量计算、矩阵计算的非线性特性,PoW公链算法具有优秀的不可逆加密特性。基于张量计算的PoW公链算法具有很好的前景和生命力,比特大陆未来每一代AI产品都会支持Bytom挖矿计算,AI芯片加速,更有助于Bytom和AI的结合,生命力更强。让AI智能机器赋能更强生命力,用Blockchain智能机器更好维护信任的公链,使得生产力和生产关系都能并行往前走。