Siri:天生我聪颖
http://msn.finance.sina.com.cn 2011-11-10 19:43 来源: 南都周刊虽然苹果给Siri打上了测试版的标签,但让它帮你发个邮件或找个约会的地方还是轻而易举的。实在无聊的时候,你甚至可以跟你的新助理探讨一下人生的意义。谁知道它会给你一个什么样的答案?
在iPhone 4S诞生之前,人与机器之间的交流就像一部默片。无论借助的是键盘、鼠标或触摸屏,我们总是以无言的方式向冷漠的电脑传递我们的喜怒哀乐。这一切,将会因为Siri的出现而改变。
Siri到底是什么呢?它是苹果的移动操作系统iOS 5里面内置的一款虚拟个人助理软件,通过自然语言处理技术来实现人机交互功能。这意味着,Siri既能听懂我们说的话,也能以我们听得懂的语言来回答。单独拆开来看,Siri所包含的人工智能、情景感知等功能并不是什么全新的技术。但只有在Siri那里,1+1才真正大于2。对计算机研究人员来说,一台能真正实现与人对话的设备就像是圣杯一样,是Siri让他们离梦想又近了一步。
2010年4月,苹果巨额(1.5亿-2.5亿美元)收购Siri公司之举让不少人出乎意料。但在熟悉人工智能研究的人看来,苹果其实做了一笔非常划算的买卖。Siri技术来源于美国政府2003年投入约1.5亿美元资助SRI International以及其他研究机构开展的PAL(Personal Assistant that Learns)项目。在iPhone 4S发布之后,美国白宫在一篇博文中,特意把Siri技术与Internet和GPS这些军转民的技术相提并论。
耗时5年的PAL项目的目标是制造新一代的智能助理,使它们能够从经验中学习和推理,并听从指令完成特定的任务。在项目结束之后,SRI意识到这项技术的潜在市场价值。Siri公司被分离出来,先后两次共融资2400万美元对这一技术进行商业化开发。
Siri技术的核心在于:每一个Siri询问都会引发机器学习、自然语言处理和网络搜索等算法。当你可以在一个像iPhone这样的移动设备上访问这些算法,并为它们提供GPS位置和用户喜好等情景感知信息时,你将得到一个强大的个人行动引擎,而不仅是搜索引擎。
更早一些的语音感知和人工智能技术应用,因为很多因素而失败。硬件的运算能力不足以及缺乏一个可操作的系统模型,是其中最主要的原因。苹果也不例外。在上世纪80年代,苹果就设想过知识导航者(Knowledge Navigator)的概念,并拍摄了多段相关视频,但从未能够将其变成现实。
iPhone 的出现为Siri带来了契机。Siri首先在iPhone 3GS上开发了独立的Siri应用程序。Siri需要缓存数据,需要足够的带宽访问大型的数据中心,还需要强大的处理器来运算海量的数据。但能够满足这些需求的不只有iPhone,所以Siri也在考虑开发Android平台上的程序,直到苹果将其收购。
从随后的进展来看,苹果从一开始就对如何利用Siri的技术有非常明确的想法。他们不满足于将Siri作为一个独立的程序,而是要把它与iOS 5整合起来,变成一个系统平台级的应用。这种整合让你可以仅仅通过日常语言来启动系统程序完成设置提醒、发送短信和电子邮件、获取天气信息和交通指南等任务。
人与人之间的日常交流是以一种简单流畅的问答方式来进行的,而这种交流方式一直是人机互动面临的巨大障碍。一个再简单的问题,也需要我们在机器上输入特定的提问方式,经过一系列的步骤,才能获得令人满意的答案。我们对此习以为常,因为我们已经被机器的这种运作方式所异化。
Siri正在试图还原我们的行为方式。要做到这一点,Siri需要实现三个技术领域的完美结合:对话式界面(Conversational Interface)、个体情景感知(Personal Context Awareness)和服务委托(Service Delegation)。换句话说,Siri要能够明白你说的话,再结合你的个人背景进行运算,最后才能提供你所需要的信息。这个过程不仅要求移动设备有强大的运算能力处理前端任务,还需要足够的带宽以保证与云端服务器的数据交换。
虽然苹果给Siri打上了测试版的标签,但让它帮你发个邮件或找个约会的地方还是轻而易举的。实在无聊的时候,你甚至可以跟你的新助理探讨一下人生的意义。谁知道它会给你一个什么样的答案?
但有个问题是Siri自己无法解答的:就像最早的iPhone不能安装第三方软件一样,你不能让Siri去执行任何非iOS内置的功能。现在我们还不能指望BBC为我们读出当天的头条,Oplayer自动播放一段影片,Evernote记下我们的日记。在苹果开放Siri的API之前,我们只能想象一下Siri的未来会有多么美好。