人工智能成熟编辑本段回目录
人工智能在过去数十年中仅得到了有限的应用,如今它已无处不在。而且这一次它真的管用了。
作者:Gary Anthes
美国东部时间 2009年1月26日12时
计算机世界 - 坐在会议桌边的一位男子说:“Stair,请去实验室取一下订书机。”站在他附近的斯坦福人工智能机器人Stair,带着鼻音以单调的语气回答道:“我这就给你去取订书机。”
Stair转动枢轴和轮子,避开路上的多个障碍物,进入隔壁的实验室。它的立体摄像机眼睛前后转动,将房间里的物品尽收眼底。它似乎思考了片刻,然后走近一张桌子,更仔细地看了一眼一个长方形的金属物体。只见它伸出带关节的机械臂,四下里旋转,然后就用带橡皮垫的长手指轻轻地拾起了订书机。接着它转头走回了会议室。
Stair边将订书机递给那个男子,边说:“给你订书机。祝你今天过得开心!”
对人工智能研究者而言,这确实是一些令人开心的日子。虽然Stair的表现看起来也许比会取报纸的狗强不了多少,但仅在几年以前,它的这项特技绝活也是无法想象的。
斯坦福人工智能机器人(Stair)
Stair确实代表了人工智能的一个新潮流,它集成了学习、视觉、导航、搬运、规划、推理、言语和自然语言处理等多项技术。它也标志着人工智能从一些狭窄的、经过仔细定义的领域转向了现实场景,在这些现实场景中,系统要学会处理复杂数据,还要能适应不确定的环境。
人工智能或多或少地遵循着Gartner公司所推广的“炒作周期”(hype cycle):技术先是默默无闻地奋力发展几年,然后因大受追捧而迅速火爆起来。接着又因没能兑现过高的承诺而声名狼藉,最后再崛起,达到取得过硬成就并为大众接受的水平。
人工智能起源于二十世纪五十年代末,但是直到二十世纪八十年代“专家系统”出现时才声名大噪。在专家系统中,要先对专家(比如,国际象棋冠军)进行采访,然后将他们的逻辑规则写入软件中:如果条件A出现,就采取动作X;但是如果条件B出现,就采取动作Y。微软研究院的人工智能研究人员Eric Horvitz说:对于下国际象棋之类的特定任务,它们干得还挺不错,但是却“很脆弱”。
Horvitz说:“它们将主要精力集中在捕获人类知识块上,接下来的思想很简单,就是将这些知识块装配成具有人类专家知识的推理系统。”但是,它们在面对程序员没有预计到的条件时无法“伸缩”,即不能适应新环境。
-------------------------------------------------------------------------
如今,人工智能出现了哪些不同气象:
- 泛在计算和更强大的计算机
- 来自互联网和物理传感器的巨量数据
- 会随着时间流逝学习和改进的算法
- 可以处理不确定性、不完整性和意外的软件
- 可以权衡代价和收益的软件代理
- 语音、视觉、机器人学、传感器和机器学习等不同学科的融合
-------------------------------------------------------------------------
现在,人工智能系统可以在“一个很大的复杂世界中”完成有用的工作,Horvitz说:“因为这些小【软件】代理没有它们所处世界的完整表示,它们对自己的行动没把握。因此,它们学着理解各种事物发生的概率,学着弄清用户的偏好和结果的代价,也许更重要的是,它们开始能意识到自己的存在。”
以上这些能力都源自一种叫机器学习的东西,它在许多现代人工智能应用中都处于核心地位。实质上,程序员开始时使用的只是所要解决问题的一个粗糙模型,但是在软件中植入了这样一种能力,可以随经验增长进行自适应和改进。比如说,语音识别软件在获知你声音的细微差别后,可以工作得更好;随着你在线购物的增加,Amazon.com可以更准确地预测出你的偏好。
都是关于数据的
机器学习当然要建立在灵巧算法的基础之上,不过它近年之所以声名鹊起,却是因为可获得巨量数据,既有来自互联网的,最近更有来自分布广泛的物理传感器的。Carlos Guestrin是卡耐基.梅隆大学计算机科学与机器学习系的助理教授,他将传感器、机器学习和优化技术结合在一起,来弄清大量复杂数据的涵义。
他说,比如南加州大学和加州大学洛杉矶分校的科学家将传感器放在机器人船上,检测和分析航道上具有破坏性的赤潮(algae blooms)。人工智能算法通过学习,来预测海藻的位置和增长。与此类似,卡耐基.梅隆大学的研究人员将传感器放进供水管道系统中,来探测和预测污染物的扩散。在两种场景中,机器学习都可以随时间增长而做出更好的预测,而优化算法则可识别出最佳位置,以安放昂贵的传感器。
卡耐基.梅隆大学的Carlos Guestrin
Guestrin还在研制一个系统,可以根据用户的浏览历史和偏好,搜索大量博客,从中识别出该用户每天应该阅读的一些内容。他说,这听起来也许和预测污染物扩散任务完全不同,但实际情况并非如此。
“污染物在供水系统中的扩散,和故事在网络上传播基本类似,”他说。“我们可以使用同样的建模思想和算法来解决这两个问题。”
Guestrin说博客过滤器之类具有人工智能的工具,所具有的重要性,可能远远不止每天为我们节省几分钟时间。“在生活中,我们根据很有限的信息作出抉择---我们要选哪个候选人,以及我们觉得哪些问题比较紧要。我们没有时间进行分析,没法作出深思熟虑的决策。事实上,随着信息量的增加,我们作出好决策的能力可能反而会降低。机器学习和人工智能可以帮我们一把。”
微软研究院将传感器、机器学习和人类行为分析结合在一起,建立了道路交通预测模型。预测交通瓶颈对传感器和计算机预报来说,似乎可以是一个显而易见且不算困难的应用。但是微软研究院认识到,大多数司机都不怎么需要被告知:周一下午五点,出城方向的州际高速公路上会发生拥堵。他们真正想知道的何时何地出现异常或“意外”,也许更重要的是,它们会发生在哪里。
于是,微软研究院建立了一个“意外预报”模型,它可以学习历史交通数据,并根据传感器捕捉到的实际交通流量,提前30分钟对意外情况进行预测。测试发现,它可以预测出西雅图地区道路上出现的意外情况中的50%,现在使用它的司机已达几千人,他们可以用Windows移动设备接收预警信息。
微软研究院的交通预报软件,可以预测出西雅图地区道路上出现的半数“意外情况”。
很少有几家机构会像搜索引擎公司那样急需弄清大量数据的意义。比如,如果一个用户用Google搜索“玩具车”,然后点击出现在搜索结果顶端的沃尔玛,这对沃尔玛有多大价值,它应该为这个点击向Google支付多少费用?答案由一个使用“数字交易代理”的人工智能专业软件给出,沃尔玛和Google之类的公司在自动在线拍卖中都采用了“数字交易代理”。
Michael Wellman是密西根大学的教授,是研究这类市场的一个专家。他解释道:“有成百上千万个关键词,而一个广告客户可能对其中的几百个乃至几千个感兴趣。他们要对关键词的价格进行监控,并决定如何分配预算;而对Google或Yahoo而言,要弄清某个关键词到底值多少钱,都太困难。他们通过一个拍卖过程,由市场来决定价格。”
提交“玩具车”的查询后,不到一秒钟,Google就查寻哪些广告客户对这些关键词感兴趣,然后查看他们的出价并决定:显示哪些人的广告、将它们放在页面的什么位置。Wellman说:“我特别感兴趣的问题是,一个广告客户应该如何决定要出价的关键词,出多高的价,以及如何随着时间流逝学习---根据他们的广告的有效程度---对每个关键词的竞争有多激烈。”
他说,这些模型最好的地方在于,其中还包含了在不确定性情况下预测价格的机制。很明显,不管哪一方,都不能指望在每次交易中获得最优财务成果,但是他们可以通过将机器学习应用于实时价格和出价的方式,逐渐提高利润。
----------------------------------------------------------------------------
华尔街上的人工智能
当前金融崩溃的恶人榜上有华尔街的“金融计量分析师”(Quants)---那些为交易优化和风险分析建立人工智能模型的计算机科学家和数学家。但是,密西根大学计算机科学与工程系教授Michael Wellman说:现在下断论还为时过早,很难说是不是这些模型没一个能阻止崩盘,甚至反而促进了它的出现。
专研人工智能在市场中的应用的Wellman说:“我认为交易自动化和风险分析是解决方案的一部分,而不是问题的一部分。比如,一个大问题就是缺乏透明度---公司甚至不了解自己拥有的资产。如果【投资】合同变得更易为计算机读取和分析,公司就能更好地进行风险分析,就能更好地理解他们所处的位置,对这一点你还是可以指望的。”
----------------------------------------------------------------------------
大脑研究
人们也许以为人工智能方面的研究,开始于对大脑如何工作的研究。但是大多数的人工智能进展都来自于计算机科学,而不是生物学或认知科学。
卡耐基.梅隆大学的计算机科学家、机器学习系主任Tom Mitchell说:这些学科有时会有共同的思想,但是它们之间的合作充其量不过是一种“松耦合”。“人工智能中的进步大多来自于好的工程思想;而不是因为我们看到大脑是如何完成某项任务,再去模仿它。”
卡耐基.梅隆大学的Tom Mitchell
他说:但是如今情况在发生变化,“突然之间,我们可以通过功能性核磁共振成像之类的大脑成像方法,获得观察大脑到底在干什么的途径。采用这种查看大脑的方法,可以在你思考时,以每秒1次的频率,观看你大脑活动的动态画面,其分辨率可达1毫米。”
他说:因此,认知科学和计算机科学如今作出了要共享思想的姿态,这可是前所未有的。比如,某些人工智能算法在机器人做了正确的事情之后给它发一个小小的奖励信号,而犯了错误之后则发一个惩罚信号。随着时间流逝,它们会产生一个累积效应,机器人就会学习并作出改进。
Mitchell和他的同事一直在查看大脑成像所揭示出的神经活动,以期解密大脑是如何表示知识的。为了训练计算机模型,他们向接受试验的人出示一列60个名词---比如电话、房屋、西红柿和手臂---并观察每个词产生的大脑图像。接着,他们使用Google具有万亿词汇量的文本数据库,确定常和这60个基本词汇联用的动词---比如,“振铃”和“电话”---并根据二者出现的频度对这些词汇进行加权。
所得的模型能精确地预测出某个词汇引起的大脑图像,此前还从没人观察到过这些。比如说,甚至经过高度简化,这个模型还能预测出名词“飞机”产生出来的大脑图像,更像“火车”而不是“西红柿”产生的图像。
Mitchell说:“我们以前对大脑如何表示思想很感兴趣。而这个实验可以弄清楚长期困扰人工智能界的一个问题:一个好的通用的知识表示应该是什么样的?”也许还能从中得到其他收获。注意到大脑也会遗忘,他问道:“那是大脑的一项特征还是一个程序缺陷呢?”
Andrew Ng是斯坦福大学计算机科学助理教授,他领导了多才多艺的Stair的开发工作。他说:这台计算机清楚地表明,人工智能以前的许多分离领域,如今都足够成熟了,可以集成到一起“去实现伟大的人工智能梦想”了。
那个梦想究竟是什么呢?他说:“早先,有好些著名的预测,都说在相对较短的时间内,计算机会和人一样聪明。我们仍然希望在未来某个时候计算机会和我们一样聪明,但是这不是我们在10年内能解决的问题。可能要花上100多年。”
译文:http://select.yeeyan.org/view/98698/55222