人机交互界面的发展现在到达巅峰了吗?不,还远远未到,人机交互界面的发展正在向着自然语言交互的方向大踏步的前进。
目前,Jarvis+ 技术团队集中主要技术力量,以自然语言理解和对话管理为技术突破口,集成和整合其他相关AI 技术为社区用户推出各式各样的聊天机器人。为社区用户提供良好的技术服务,改进人机交互界面,期望在未来更加广阔的对话即服务领域中占有一席之地。
让我们和Jarvis+的Michae一起来看一下,计算机人机界面是怎样发展的吧。
计算机人机界面,又被称作用户界面,是人与计算机之间传递和交换信息的媒介和对话接口,是计算机系统的重要组成部分。计算机人机界面是系统和用户之间进行交互进行信息交换的媒介,它实现信息的内部形式(二进制数据)与人类可以接受形式,比如文本、图像和声音等之间的转换。凡参与计算机用户与计算机系统信息交流的领域都存在着人机界面。纵观数十年的计算机技术发展史,每次一次人机界面的变革都带来了计算机应用和计算机技术的重大飞跃。
计算机从诞生开始,就不可避免地要输入各种各样的信息,如操作指令和数据信息等。现在人们在手机上指指点点就可以轻松地实现购物、视频浏览、阅读等操作。但是早期的计算机人机界面就没有这么简便了。人们要对最早期的计算机,输入指令和数据依靠的是下图中的打孔纸带。在打孔纸带的特定位置上钻孔表示某个字符或者数字,然后放入计算机的打孔纸带识别设备,设备通过纸带上不同的透光率了解到计算机用户的输入。
这种人机交互方式非常地繁琐,一旦人们输入较长的指令而中间某个纸孔打错的话,就要重新制作打孔纸带。而且信息输入到计算机后要等待计算机的运算,再通过计算机输出的打孔纸带判读运算结果。这种计算机只适合非常专业的人员使用。
后来,人们把打字机的键盘和阴极射线管显示器移植到了计算机上,人们可以通过敲击计算机键盘给计算机输入数据和指令。如果输入错误了,还可以使用键盘上的退格键删除错误信息再重新输入。键盘的出现把之前的基于任务模式的计算改进成了交互模式的运算。操作人员可以一边输入一边观看到结果。人机交互效率得到了大幅度提升,计算机开始走向普及。
再然后,加州大学伯克利分校博士道格拉斯·恩格尔巴特(Douglas Engelbart)发明了鼠标,Douglas Engelbart很早就在考虑如何使电脑的操作更加简便,用什么手段来取代由键盘输入的繁琐指令改进人机交互界面。鼠标的出现,大大地改进人机交互的体验。以前必须要通过键盘多次敲击输入的数据和信息,现在通过鼠标的几次点击就可以办到。前苹果创始人史蒂夫·乔布斯发明了计算机图形界面后,为鼠标的应用带来了更加广阔的前景。微软公司更是通过图形界面的Windows 操作系统让鼠标成为计算机的标配,让计算机成为了每个家庭的家用电器并极大的拓展了计算机的用户群体和计算机市场。鼠标的普及也领个人电脑游戏得到了空前的发展,《帝国时代》《反恐精英》《英雄联盟》等等脍炙人口的游戏都是通过鼠标和键盘配合操作的。鼠标这种人机交互界面的改进,为个人电脑游戏这个产业的大发展奠定了基础。
在个人手持设备领域,乔布斯也进行着革命。以前,诺基亚NOKIA 公司的移动电话占领者市场的绝大部分份额,在最辉煌的时刻诺基亚公司更是打出了“每眨一次眼,世界就会卖出四部诺基亚手机”的广告语。虽然诺基亚手机也可以浏览简单的网页,但是手机屏幕太小并且需要使用键盘输入的问题让乔布斯看到了商机。苹果推出的iPhone手机,主打高分辨率大屏幕,多点触控式交互和极简的按键(只有一个)。这样的设计令iPhone 手机的人机交互体验提升到了很高的层次。不到十年的时间,苹果成为全球市值最高的公司,而保守的诺基亚公司直接退出了手机市场。
那么,现在就是人机交互界面的巅峰了吗?不,还远远未到!人机交互界面的发展正在向着自然语言交互的方向大踏步的前进。人们在设备上指指点点终究还是麻烦,要是计算机能听懂人类的语言,理解人类的想法那就是更大的进步。于是对话即服务的概念被提了出来。在很多场景下,对话用户界面(CUI – Conversational User Interface)比图形用户界面(GUI – Graphical User Interface)更加自然和高效。过去几年中,对话用户界面得到了大量的关注,也取得了迅速的发展,也是各大厂商在AI 领域追逐的焦点。苹果的Siri,微软的小冰等这些对话即服务产品都是各大厂商在这个领域不断探索的产物。
对话即服务的人机交互界面是以AI人工智能技术为基础的,多领域AI 技术集成的综合领域。该领域主要包括五个AI 技术领域:
1)语音识别(ASR)将原始的语音信号转换成文本信息;
2)自然语言理解(NLU)将识别出来的文本信息转换为机器可以理解的语义表示;
3)对话管理(DM)基于对话的状态判断系统应该采取什么动作,这里的动作可以理解为机器需要表达什么意思;
4)自然语言生成(NLG)将系统动作转变成自然语言文本;
5)语音合成(TTS)将自然语言文本变成语音输出给用户。
在这五大AI技术领域中,多数技术公司都以一到两个技术领域作为主攻方向进行探索。目前,Jarvis+ 技术团队集中主要技术力量,以自然语言理解和对话管理为技术突破口,集成和整合其他相关AI 技术为社区用户推出各式各样的聊天机器人。为社区用户提供良好的技术服务,改进人机交互界面,期望在未来更加广阔的对话即服务领域中占有一席之地。
在未来,对话即服务的人机交互界面将渗透到社会经济、生活的各个领域,将再次极大地拓展用户群体,并带来无限商机。
Jarvis+也会为本次人机交互界面的发展添砖加瓦,期待拥有更加广阔的未来!