9月16日,在上海举办了第11期《Chainge》技术沙龙,同济大学区块链俱乐部等协办支持,主题是“区块链+人工智能”。搜狗输入法之父马占凯、比原CTO朗豫、JarvisPlus创始人佘泽鹏、CONNECTOME Founder Ishii等嘉宾受邀分享各自观点。
彭博也是分享嘉宾之一,他是《深度卷积网络:原理与实践》一书的作者,Blink•禀临科技联合创始人。在《深度学习与区块链的融合:机遇和挑战》的分享中他认为,深度神经网络像是一个黑箱子,借助数据、算力和模型(算法),它会给出惊艳结果,比如战胜人类围棋冠军的“阿尔法狗”。
在这些层面,区块链技术可以扮演重要角色。比如数据上区块链可提供数据来源、存储、安全保护、清洗标注、防造假等。算力上则能提供大规模并行计算、数据隐私保护等能力。彭博认为,在物联网领域,区块链与AI的融合必要性更强,基于区块链协议与专用硬件芯片的物联网也许会成就下一代互联网。
以下是彭博分享,经整理:
可能很多人了解人工智能是因为Google DeepMind研发的AlphaGo(阿尔法狗),它采用了深度卷积网络,模拟并超越了人类。而深度卷积网络(DCNN)是深度神经网络的重要类别。卷积神经网络是一种目前流行的神经网络架构,受生物自然视觉认知机制启发,擅长处理图像,特别是图像相关的机器学习问题。
上面是卷积神经网络生成模型的案例,往卷积神经网络输入大量明星图片,让它学习,它会自动发现明星图片之间较为合理的插值方法,随机生成新图片,过程无需人类知识。有一些瑕疵,但总体来说,效果非常惊人。
卷积神经网络如何识别图像信息?
我们说人的思维规律可以分两类。一类是逻辑规律,比如平面上三角形内角和是180度;另一类是统计规律,比方说看到乌云就知道可能要下雨。人的直觉更像是通过统计规律思考,举个例子,我们看到猫的图片立刻可以判断这是猫,我们不会去思考猫的耳朵、脸等特征的定义后再下判断。这个问题上我们不是根据逻辑规律而是基于统计规律在思考。
在人工智能的发展过程中,存在逻辑学派与统计学派之争,目前统计学派占上风。原因在于深度学习是典型的统计方法,可以非常好地模仿人的“直觉”,例如人的“棋感”,以及在图像识别中的能力,这在此前是非常难的。
我们可以看一下传统编程和深度学习的比较。传统编程是输入数据和人类设定的规则,最后输出一个答案。深度学习则是输入数据和答案,机器自动得出一个规则。当然,目前人工智能还是需要人做少量工作,比如实验网络的一些超参数,但未来可以完全自动化。
那电脑是如何完成这一工作的?我们会发现网络可以自动总结出重要的中间概念,例如识别萨摩耶犬图片时,网络中间的有些神经元会去识别白色,有些会去识别毛发等。为什么可以自动总结出这些中间概念,学术界其实还没有特别好的答案,因此有人称其“数据黑匣子”,我见过的比较好的说法是说这来自于自然界规律和现象的层级性。
但这并不意味着卷积神经网络就没有缺陷,它对世界的理解也会想当然,因为它是基于统计规律。举个案例,非洲草原上有一课树,树上有很多山羊,卷积神经网络会认为那是鸟,因为它学习时的图片数据里从来没有出现过站在树上的山羊,即便它识别出那些是山羊,最后它的判断还会是鸟。
因此,涉及自动驾驶、医疗等人命关天的领域,纯靠深度学习还是存在一些问题。
区块链+物联网会成为下一代互联网?
现在我们可以把深度神经网络认为是一个黑箱子,人类把数据、算力、模型(算法)给到它,它会给出一个结果。那么,为什么近些年深度学习成长特别快?很大程度上就是数据和算力在这些年飞速发展,它为深度学习提供了基础保障。
那么现在,区块链就在上述的3个方面,登上了深度学习的舞台。数据上,区块链可以做的有数据来源、存储、安全保护、清洗标注、防造假等。算力上则是提供大规模并行计算、数据隐私保护。而算法上则可利用众包完善算法,也能构建算法交易平台。因为开源等原因,在一定程度上,现在模型(算法)并非壁垒,所以数据和算力的重要性相对更突出。
当然,这里面还是存在一些挑战。数据类创业项目中包括了交易市场,这是区块链创业的常见方向。但难点在于,对比于中心化市场,它如何提供附加价值?算力类创业项目的难点在于算力如何实现分布式?深度网络的训练目前很难做到分布式,存在技术障碍。但深度网络的运行是可以采用分布式的。信任机制可以用区块链实现,数据安全也能在一定程度上用区块链解决,但商业上的一个问题是成本和效率。理想的情况是采用 POW机制,目前仍有难度,因为存在安全、效率和去中心化的不可能三角。而模型(算法)类创业项目类似于任务交易市场,但去中心化并不一定比中心化的成本低。
通过对未来的展望可以发现,将来,手机、摄像头都会有AI芯片,物联网(IOT)与边缘计算天生适合去中心化网络,与区块链相融合的必要性更强。基于区块链协议与专用硬件芯片的物联网,会不会是下一代互联网?