分享更多
字体:

《全球商业经典》:让机器更像人

http://msn.finance.sina.com.cn 2012-02-02 14:30 来源: 《全球商业经典》杂志

  人制造了机器,而机器又重新塑造了人,这是一个生生不息的过程。我们无法阻挡,只能在接受和适应中,尽力让机器和人类都避免异化。

  文/猛犸

  iPhone 4S一经发布,追捧和调戏Siri就成了新的大众娱乐。人们和它开玩笑,向它求爱,还时不时问它“宇宙和一切的终极答案”之类的问题。用户把和Siri的各种互动发到视频网站上,探索着它“智慧”可能性的尽头,像是发现了一个能和人类沟通的新物种。

  如此受欢迎的Siri,并不是已经拥有悠久历史的语音识别软件,更像是一个体积微小的“沃森(Watson)”——那个由IBM制造的、在2011年3月的问答游戏中打败了人类选手的人工智能程序,Siri的重点是在于分析语句的内容,找出句子中关键词之间的关系,并且自动执行网络工具或手机软件,以满足用户的需求。

  Siri的历史可以追溯到2003年。那一年,美国国防部高等计划研究署资助了一项名为CALO的计划,集合超过22家研究机构的300名研究人员之力,只为解决一个问题:开发出能够学习、懂得人类语言的软件,它会根据经验和收集到的其他信息分析使用者的意图,以帮助用户完成相应的工作。

  这一计划于2008年完成,Siri则是这一计划产物的手机版——配合3G网络的带宽、更强大的处理器和更加智能的网站内容,苹果公司把这种拥有学习和组织能力的软件称做“VPS”——虚拟个人助理。这是人机交互历史上的一个重大革新。人们喜欢使用各种各样的问题来为难Siri,并不仅因为它会给出有趣或者有用的答案,更重要的是它看起来不像是机器,而像是一个孜孜不倦又无所不能、躲在在机器里的小精灵。或者说,她像是一个活着的人。

  而人们和机器之间的沟通,也正在朝着这一目标努力:让机器更像人。

  人机间高高的门槛

  人类希望用机器模拟自身的设想,从古代的文学作品中就能看到端倪。从《列子·汤问篇》中“偃师造人”的传说,到古希腊、古罗马的一些虚构作品,都能看到给机器赋予人格特质的例子。历史上最伟大天才之一的达?芬奇就曾经设计过机器人;1748年,法国哲学家拉?梅特利曾匿名出版了一本《人是机器》的书,干脆提出人本来就是一部精密机器的理论。这可能也是当条件成熟之后,让机器识字、读书,或者让机器能够和人“对话”的技术迫不及待发展起来的主要原因。

  传统的机器和工具与人的互动简单而直接,几乎一眼就能看出它是如何发生的。比如当我们压下一根杠杆,杠杆的另一端就会翘起来;当我们按一个按钮时,它就会被按下去,然后发生一些我们意料之中的事情。这样的直观性,让人类学习使用机器和工具的成本一直很低,但是计算机的出现改变了这一切——我们需要花大量的时间学习这种本来用来帮助人们的工具,本应成为大众工具的机器却因为技术的高门槛而让大众陷入困惑之中。

  这与电脑界面一直不符合人类的直觉有关。计算机内部发生的事情对于大多数人来说,并不直观,即使连我们在键盘上打字或者移动一下鼠标这样看似极简单的事,其背后也比表面看到的复杂许多。当我们按下键盘上的一个键时,特定的电路闭合并发出一个信号,经过键盘内部单片机的处理发送给主机的接口,然后由CPU根据当前运行的程序来运算,再把结果发到屏幕上——可能是屏幕上出现了一个字母,或者是在游戏里走了一步。如果一个原始人穿越到了现代,一定会认为我们都是巫师——我们做出奇怪的手势,面前的镜子(屏幕)上就会出现神秘的符号和画面;我们在一块板子(键盘)上敲敲打打,另外一个地方却出现了变化。

  自计算机发明以来,我们已经熟悉了这种与它们相处的方式,并且忽视了这一长串的隐匿过程,以为当我们在键盘上按下一个键,屏幕上就会出现相应的活动,一切就这么简单。实际上,键盘和鼠标隐藏了人机交互的复杂性,以一种接近直观的方式展示出来。但是,这并不够,人们一直想要更好的人机交互方式,想让计算机能够和人一样,我们与它们可以进行更加自然的交互。要实现这样的设想,需要我们改变一些固有的策略才行。                          

  你就是控制器   

  过去,计算机的运算能力是很珍贵的资源,直到今天,计算机和用户之间的交互还是通过一种叫做“中断”的方式来进行,这像是暗示计算机的运算资源依然很珍贵,我们只能偶尔打扰它一下——就好像它是我们的上司一样。但是在摩尔定律的帮助下,今天的计算机用户已经不再需要这样小心翼翼了,如今的计算机用户拥有的计算能力已经超过了通常所需,往往只有在玩很精美的3D游戏时,计算机运算器件的温度才会有明显上升,因此以计算机为主的模式,可以改变了。今天,在计算机和用户组成的计算机系统中,用户才是更重要的资源,而计算机可以退居二线,让它实时观察用户的动作并且更加及时地做出反应,才是更合适的途径。

  视线跟踪软件就是一例。很显然,用视线来控制计算机不仅能够让残疾人更方便地使用电脑,也会让那些腾不出手来或者仅仅是犯懒的用户,能更容易地得到他们想要的信息。

  早在19世纪,人们便已经发现视线并非如我们以为的那样是平滑移动的。其实,人们在看到物体的时候,视线会在大约只有0.1秒的短暂注视后,从一个点跳跃到另一个点,其过程就像我们对着不同方向拍了几张照片,再把它们拼成一张更大的照片一样。人类的视线能够准确观察到的范围可能比我们想象的要小得多——大约相当于我们伸直手臂时,能够看到的自己大拇指的长度。在不停地视线跳跃中,我们的大脑会自动把这些图像拼合起来,让我们意识不到视线的跳跃。这一发现,展示出了使用视线来控制机械设备的可能性。

  今天,人们已经有了不少方法来判断瞳孔的位置,进而模拟计算出视线在屏幕上的精确落点。最简单的方式是使用家用摄像头首先判断使用者的面部位置,找到你的眼睛,既而通过虹膜与瞳孔的颜色差,计算出瞳孔的位置,再根据距离计算出瞳孔中心指向的屏幕位置。 

  2002年5月,英国伦敦的帝国大学开发了一种叫做“眼标”的设备,让用户能够使用视线来控制鼠标指针。2009年5月,英国蒙特福德大学的研究者们在计算机屏幕边缘设置了两个近红外线摄像头,以此精确区分瞳孔和虹膜部分,通过获取的两副红外图像的位置差,可以将瞳孔的位置定位得更加精确,让用户可以只靠眼睛来玩复杂的电脑游戏。

  德国夫琅禾费协会(Fraunhofer-Gesellschaft)的光电微系统研究所甚至更进一步,开发出了将摄像机和屏幕结合在一起的工具,当用户盯着屏幕时,屏幕也在用无数的小眼睛盯着用户,遍布整个屏幕的摄像头可以把用户的视线落点计算得更加精确。虽然这一技术目前尚未进入成熟商用,但已没有什么根本难题需要解决。

  既然视线可以捕捉,那么计算机用户的表情和动作自然也可以捕捉。几年前,英特尔就已开始尝试在电视上安装摄像头,根据用户的表情来控制录像的播放。例如在一场球赛中,电视“看到”用户表情比较激动的话,就会把刚才的片段以慢动作重放一次。

  家用游戏主机商们更是早就开战了人体动作捕捉上的探索,希望把这种以前只用于电影特效的技术带入玩家的起居室。任天堂公司就在Wii的手柄中加入了红外和加速度传感器,让手柄变成各种各样的运动器材;索尼的PS Move看起来像个麦克风,其实它不仅有加速度传感器和陀螺仪,而且还能发光;附加在微软Xbox 360上的Kinect更是完全抛弃了游戏手柄,仅凭两部摄像头、麦克风和红外线传感器就能跟踪玩家的肢体动作,还能识别玩家的语音指令。

  Kinect用彩色和黑白的两个摄像头获取玩家的立体图像,通过红外线感知玩家离电视的大致距离,以判断玩家的身体动作,并将之转化为游戏中角色的动作。2009年7月,比尔?盖茨提到,Kinect不仅仅是玩具,还会成为我们操控电脑的新方式。“这不仅限于游戏,还可以应用在所有基于电子媒体的消费品上,甚至包括使用Windows的电脑、视频会议、协同工作和通信等。”他说,“这是3D定位设备,这是视频识别,是可以进行行为判断的摄像头。”的确如此。Kinect发布没多久,就有黑客把它移植到家用计算机上,微软也发布消息,说在Windows 8发布时,将让Kinect在PC上也可以使用。

  机器更懂你   

  不久以后,我们在空气中比划手势就能操作计算机,就像汤姆?克鲁斯在电影《少数派报告》中所做的那样。当这种技术真正进入商用,《钢铁侠》中托尼?史塔克那套空气投影和动作捕捉结合的工作环境将不再是科幻。这种人机互动技术使得我们不再需要指挥计算机,而是彻底由计算机随时“紧盯”我们的动作。这样会更自然,或者说,更符合我们的直觉。

  2009年,麻省理工学院(MIT)媒体实验室的印度天才帕纳夫?米斯瑞(Parnav Mistry)就展示了一个基于人类直觉的操作系统。这种系统叫做“第六感(Sixsense)”,它由一部手机、一个微型投影仪、一个摄像头、几个不同颜色的智能鼠标手指和相应的软件构成。“第六感”设备拥有完整的输入输出:用摄像头拍摄下人们的手势和面前的一切,并且用它来执行相应的动作。例如你把一本书放在摄像头前面,“第六感”就会通过手机里面的OCR(光学字符识别)软件判断出书名,再去亚马逊这样的网上书店中搜寻,把书评直接投影在书的封面上,给你的购买做参考。此外,当你看到某个人的时候,它会用图像搜索程序搜索此人的照片,再提供给你网上关于此人的相关资料,帮助你化解对面却不相识的尴尬。而当你用手比出一个取景框姿势时,它就会拍下你眼前的美景。

  虽然以目前手持设备的计算能力,要完成“第六感”设想的计算还有些难度,但是这种基于人类直觉的操作方式还是让人眼前一亮。这比Kinect这样的动作捕捉技术更近了一步,它能够让计算资源围绕人的需要而配置,根据人的周围环境而判断出人们最需要的是什么信息。帕纳夫?米斯瑞在发布“第六感”时曾说:“我相信把信息跟所有物件整合,不仅能帮助我们消除信息鸿沟,还能以某种方式帮助我们保有人性,加强我们与实体世界的连接,最终我们不会变成坐在一台机器面前的另一台机器。”

  消除信息鸿沟的根本方法,在于让人们生活的这个由原子构成的真实世界和由字节构成的虚拟世界能够随时连接在一起——甚至更进一步地叠加在一起。

  在日本东京都的立川市,有一栋叫做N Building的建筑,它的墙上刷着一副81平方米的巨型标记,这看起来似乎没有什么意义,但是如果你在智能手机上安装一个软件,再用手机摄像头对准那个标记,屏幕上就会显示出建筑中的店铺、商品和打折的信息,就像你的手机变成了一个透视窗口,它让建筑物内部的信息一览无余。

  1992年,波音公司计算机研究部门的首席科学家托马斯?考德尔(Thomas Caudell)提出了这种被叫做“增强现实”的设想。他认为,人类可以将所需要的数据投射到真实世界的景物上,以减少人们在真实世界与虚拟世界之间切换所花费的时间。不过,当时的计算能力不足以支持这样的设计,但现在已经不成问题。现在,宝马公司在使用这种技术培训维修人员,医学院用它来培训外科医生,甚至有人在名片背后也印上标记,当它对着摄像头时,电脑会显示出一个立体的网格人物形象,还会主动进行自我介绍。

  甚至就连杂志也不甘落后——2009年12月的《Esquire》封面是《钢铁侠》和《大侦探福尔摩斯》的主演小罗伯特?唐尼,他手指着一个由黑色和白色方块组成的图形。当你在杂志官网上下载一个软件,再把封面上的图形放到摄像头前,小罗伯特?唐尼就会出现在你的屏幕上,展示这期杂志的更多故事,有视频、有动画、有访谈,甚至还有汽车广告。阿迪达斯正计划推出几款支持增强现实的运动鞋,让你能够和穿同款球鞋的玩家一起玩虚拟游戏。和“第六感”类似,增强现实技术让我们无须努力翻找信息,而是让信息根据我们的所需,适时地出现在我们眼前。

  美丽新世界,抑或深渊

  所有这些让人机互动更为友好的技术都暗示了同一种趋势——让计算机变得更加像人,机器不再像过去那样只会等待人们的提问,它们会像人一样考虑更多的可能性,然后做出最合适的反应。今天,硬件、软件、人机交互、微型设备等领域的进展,意味着一种新的人机交互方式——让机器更“懂”人的心思。

  隐藏在这种趋势之下的,是一堆看不见的传感器、大量程序和互联网的协同工作。随着计算设备能力的提升、电子器件微型化进程的进展,计算设备终将会变成围绕在我们身边的一团空气,它们从我们的生活中学习,自动自发地做好一切准备。这些行为是如此自然,人们不会意识到这是大量计算得出的最优结果,我们不再需要告诉机器去做什么,它们就会主动“关照”我们。

  这几乎是已经确定的未来。但是人们对这样的机器将会产生什么样的反应,并不可知。必然有些人会欢欣鼓舞新时代的来到,但是也一定会有人厌烦、担心,甚至恐惧。对新技术的担忧可能来自人们固有的心理障碍,不过机器即使像一个傻头傻脑的大铁块,也并不能保证它就一定招所有人喜欢。对机器的恐惧,比较合理的解释也许是人们对看起来有智能的对象会表现出一点感情色彩,我们可能不会对一个电灯开关关心备至,但有时会忍不住把自己的计算机拟人化。

  斯坦福大学传播系的学者也认可这种观点。拜伦?里弗斯(Byron Reeves)和克利福德?奈斯(Clifford Nass)在那本里程碑式的《媒介公式》中,研究了人与信息技术设备的关系,他们用20年的时间和数十个实验证实,人们和自己使用的计算机之间的确存在类似人类之间的感情。正是基于这些实验,他们帮助微软开发出了Word软件中那个长着两只大眼睛、曲别针形状的助手“Clippy”。有些人喜欢它,也有许多人讨厌它,但重点是,这个完全没有生命的小东西唤起了人们强烈的情绪反应。卡耐基梅隆大学和乔治亚理工学院的研究表明,人们会一厢情愿地将情感投射到机器上,期盼它们的行为像人类自己一样。当机器达不到这样的要求时,人们会失望和愤怒。

  更成熟的人机交互技术会让用户误认为计算设备可能拥有某些人类的特质,变成某种像是人的“生物”。这种趋势让学者担忧这会进而改变人类对待真人的方式。2011年12月7日,供职于美国福克斯新闻台的心理学家基思?阿布罗发表了一篇文章,认为Siri这样的工具会弱化人类的正常社交能力,减少人类正常的情感响应,让我们的语言和情感最终变得和一台机器差不多。不过,这只是一种比较严重的推测,我们只能希望它不会发生。

  人机交互的确会向着更自然的方式前进,但是我们也正在受到机器越来越多的影响,只要看看那些整天“调戏”Siri而乐此不疲的人,就会对此心中有数。但是,宛如DNA双螺旋紧紧缠绕一般,人制造了机器,机器又重新塑造着人,这是一个生生不息的过程,我们无法阻挡,只能在接受和适应中,尽力让机器和人类都避免异化。

分享更多
字体:

网友评论

以下留言只代表网友个人观点,不代表MSN观点更多>>
共有 0 条评论 查看更多评论>>

发表评论

请登录:
内 容: