科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 10366 次
  • 编辑次数: 2 次 历史版本
  • 更新时间: 2010-09-25
高兴
高兴
发短消息
蓝色森林
蓝色森林
发短消息
相关词条
人工智能时代
人工智能时代
人工智能的历史
人工智能的历史
性爱机器人发展史
性爱机器人发展史
机器人与人工智能吉尼斯
机器人与人工智能吉尼斯
自动化技术史
自动化技术史
机器人学的历史与未来
机器人学的历史与未来
银幕机器人发展史
银幕机器人发展史
人形机器人发展
人形机器人发展
工业机器人发展史
工业机器人发展史
机器人发展史
机器人发展史
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

人工智能时代 发表评论(0) 编辑词条

目录

人工智能时代已经来临!编辑本段回目录

经历数十年的失败,受益于计算能力的巨变,人工智能终于可以面对公用

After 50 years of frequent failure and narrow success, artificial intelligence (AI) is going mainstream. A confluence of trends—cloud computing, smart phones, expanded broadband capability, improved AI algorithms, plus the steady Moore's Law expansion of raw processing power—is producing a vast acceleration in AI capability. Not only are AI's individual subdisciplines—speech recognition, natural language understanding, machine learning, computer vision, etc.—improving, they are beginning to work in concert. We are, finally, starting to approach the subtlety of real human intelligence. In the process, we are moving from the merely good to the uncanny.

50年的不断失败和次要的成功, 人工智能AI)正在走向主流。一些趋势的汇集 -- 云计算,智能手机,拓展的带宽容量,改进的智能算法,以及根据摩尔法则不断增强的处理能力 -- 极大的加速了人工智力的发展。人工智能的产业下属项目 -- 语音识别,自然语言理解,机器的学习,计算机视觉等等 -- 不仅都有所发展,还开始了合作。我们,终于,即将见证人类智力的精妙。在这个过程中,我们正从“刚刚好”走向“出乎意料”!

Within the next three to five years, you will be able to:

在接下来的三到五年内,你将能够:

• Use virtual personal assistants (VPAs) to manage your business and social calendars. VPAs will effortlessly find the most convenient time for a four-person meeting next week or reserve you a 2 p.m. tee time at the club. They will know your social graph and habitual patterns and, increasingly, like any good executive assistant, make helpful suggestions. ("Do you want me to invite your accountant to this meeting?")

--- 使用虚拟个人助手(VPA)来管理你的商业或者社交日程表。 VPA将会轻松的为下周的四人会议找到一个合适的时间,或者为你在俱乐部预定一个下午两点的下午茶。他们会了解你的社交图标以及作息规律,而且像任何好的经理助手一样,提出不错的建议。(“你想让我把你的会计师也邀请到会议里么?”)

• Text ahead to a descendant of today's Roomba to "vacuum the downstairs" confident in the knowledge that it will be able recognize and avoid both the antique desk and the cat.

--- --直接向现在的“Roomba”的后裔产品发消息说“给楼下吸尘”,然后一点也不担心楼下的猫和古董桌。

• Indulge your taste for robatayaki, barbeque typically served at family-owned Japanese restaurants where English proficiency is minimal. You'll be able to locate the nearest such restaurant to your Osaka hotel, determine its hours of operation, and use your smartphone translator to order in serviceable Japanese.

--- 放纵的享用只有正宗日本料理才能提供的台端烧和BBQ。你将能够找出距你居住的大阪酒店最近的这样的餐馆,判断它的营业时间,利用你智能手机的翻译软件来预定一个位子。

• Ask search engines questions of fact and get definitive answers—not millions of blue links. Instead of mere keywords—say, "Ricky Henderson," "league leader," "walks," and "stolen bases"—you'll ask, "In what years did Ricky Henderson lead the American League in both walks and stolen bases?" (Answer: 1982, 1983, 1989, and 1998.)

--- 向搜索引擎提出关于事实的问题,然后得到明确的回答,而不是一百万个蓝色的超链接。不用再说那些模糊的语言了,比如“瑞奇-韩德森”,“队长”,“上垒”,“盗垒”,相反,你只要问“瑞奇-韩德森在哪年带领美国队上垒和盗垒?”(答案:1982,1983,1989 和 1998)

Within the same period, changes to the IT competitive landscape will prove just as profound:

于此同时,竞争激烈的IT业也会产生深远的变革:

• Most new smartphone applications will have to be voice-enabled rather than thumb-typed. Customers will insist on the capability to search, text, e-mail, schedule, collaborate, and purchase just by talking to their phones.

--- 大多数智能手机将会通过语音启动被不是拇指。顾客会要求通过语音来启动搜索,短信,邮件,日程表,协作和购买等服务。

• AI will emerge as the key differentiator in smartphone competition and with it, overall IT leadership.

--- 人工智能将会成为智能手机竞争的关键,甚至全IT行业领导权的关键。

To grasp the full magnitude of the tectonic shift underway requires some understanding of AI's checkered past. Founded as a discipline in 1956, AI has engendered lofty hopes ("Within 20 years, computers will be able to do anything a man can do," according to Herb Simon, one of the discipline's four founders) and bitter disillusionment. Despite decades of intriguing laboratory demonstrations, AI usually fell well short of real-world reliability.

要想理解这个巨变的内幕需要回顾一下人工智能的曲折历史。人工智能在1956年被设立为一个项目,之后带给人们极高的期待(项目的确立者之一,Herb Simon曾说,“在20年内,电脑就会做到人类能做的任何事”)和痛苦的失望。即便数十年以来实验室不断传出令人激动的演示,AI总是让人觉得在现实中不靠谱。

Take AI's natural language understanding of a phrase such as "I want to drop off my car." Does the speaker want to turn over parking of his car to a valet, push the car off a cliff, or perhaps injure yourself by falling off the car? A meaning easily grasped by most Americans has proven exasperatingly hard for AI to comprehend consistently. Better natural-language-understanding algorithms help, but the ultimate solution almost always comes down to hundreds of millions of iterations of speech patterns with almost as many individual English speakers. In AI, above all, what matters for real-world applicability is brute force computing power.

那AI的自然语言理解来举个例子。比如这句,“我想出车。”是说话者想要开车出去,还是下车出去?(这部分有些改动。 -- 译者)大多数人能够轻易明白的意思,已证实会让AI难以理解。尽管有更高级的自然语言算法的相助,但是终极的解决方法总是在几百万个口语样式和几乎同样多的说话人中迭代。对于AI来说,现实的适用性依靠的是强大计算的蛮力。

Significant AI improvement has thus had to await the extra processing power predicted by Moore's Law. By the late 1990s, processing power had reached the point where, with the right algorithms, computers could reliably recognize the several hundred basic words used to reserve airline seats or make stock transactions. As a result, successful speech recognition companies emerged. Along with speech recognition, AI has demonstrated commercial success in other relatively narrow subdisciplines, such as logistics, data mining, and medical diagnostics.

AI显著的提高需要等待摩尔定律预示的更强大计算能力的到来。在上世纪90年代末,处理能力已经达到了这样一个高度:有了合适的算法,计算机就可以可靠地识别用来预定机票和股票转账几百个基本词汇。同语音识别一起,人工智能已经在其他相对较小的领域展示出了商业成功,比如逻辑,数据挖掘和医学诊断。

Advent of the Cloud

云的降临

Until recently, that has been the status of AI: gradual, partial success coupled with research and development so segregated into silos that practitioners rarely communicate with one another. Enter cloud computing. Although valued primarily for its efficiency in data administration—and certainly not new—AI developers have begun to take advantage of it only in recent years. In so doing, they have found new ways to work with all that siloed AI information and, essentially, recreate a broader AI discipline.

知道最近,AI的进展都是这样的:逐渐的,不完全的成功被隔离在彼此很少的沟通的各个仓筒里。进入到云计算时代,尽管这个技术主要目的在于数据管理,而且也不是很新,但是AI开发者还是在最近几年对其大加利用。他们找到了与仓筒中的AI信息协同工作的新方法并且,重建了一个更拓展的AI学科。

First, by creating deep pools of easily accessed data, cloud computing facilitates data mining and crowd sourcing. These techniques intelligently sort the millions of facts about everyday life that humans know, i.e. "common sense." Companies such as True Knowledge are automatically scouring Wikipedia, Freebase, and other databases for "facts"—all painstakingly entered and curated by individual contributors. AI-based common-sense reasoning, although not yet here, appears within reach.

首先,创建更够容易获取的数据,云计算设备数据以及众包的数据池。这些技术可以智能的整理百万条人们普遍了解的“常识”。比如真知公司(True Knowledge)自动的利用维基百科,自由基和其他数据库作为源来分析“事实”,那些“事实”都是由志愿者不辞劳苦的整理输入的,基于AI的常识理性,尽管还没有完成,但是可谓近在咫尺了。

Second, those same deep pools of data facilitate rapid feedback. Machine-learning algorithms that automatically recognize complex patterns and make intelligent decisions based on data can now be applied against these vast data sets and use that experience to continuously enhance performance.

其次,那些数据池设备快速的反馈。机器学习算法能够自动的识别复杂的样式然后根据数据做出智能的决定,这个做法可以应用到大型的数据集上,并利用经验不断的提高性能。

The Old, Laborious Way

令人疲惫的旧方法

That's a monumental improvement. Ten years ago, Nuance, a speech recognition company in which I invested and on whose board I served, had to collect results laboriously from discrete voice response platforms decentralized throughout the population. For example, the company would capture how speakers in Boston and rural Tennessee would each pronounce the word "fire." Then Nuance engineers would periodically reconsolidate that information into a new main data set that would go out every 18 months to customers as a new software release.

那是一个里程碑式的进展。十年前, Nuance公司(一个语音识别公司,我对其投资并在其董事会上供职),需要人工在广泛的人口中收集分离的语音回应平台。举个例子,公司需要捕获波士顿的人和田纳西州乡村地区的人的“火”一词的发音。而且,Nuance的工程师将会每隔一段时间的把那个信息向下一次软件发布(每隔18个月)的数据集中合并。

Today, Nuance and other speech recognition companies, such as Vlingo, simply draw on data pools in the cloud to compare and analyze constantly hundreds of millions of utterances and feed results back into their systems in near real time. One result: commercially available dictation software that can capture the tens of thousands of words in the whole English language with near 100 percent accuracy. Other AI comparison machines, such as those for facial recognition, also learn and steadily improve their products in similar fashion.

而现今,Nuance和其他语音识别公司,比如Vlingo,只需在数据池中抽取一些信息就可以和数以百万记的发音比较并把结果几乎是实时的传回系统。只有一个结果:一个可以获取的商业软件,它可以以100%的准确率识别英语中的数万单词。其他的人工智能比较机器,比如面部识别,也可以以同样的机理增强他们的产品。

Third, and most significantly, cloud computing both turbocharges Moore's Law processing speeds and enables those narrow AI subdisciplines to communicate and work in concert. From 1990 to 2020, Moore's Law progress alone will increase the processing power of a single server by a factor of 1 million. By 2020, in contrast, cloud computing could multiply AI-related processing power by a factor of 1-billion. The combination of cloud computing and open source programs such as the Yahoo! (YHOO)-developed Hadoop, permits AI systems to run data and algorithms across multiple servers simultaneously. For AI, that means we can split off those cumbersome silo subdisciplines (machine learning, speech recognition, dialog management, etc.), process them in parallel, and neatly reassemble them into something that makes sense.

最后,也是最重要的一点,云计算可以加快摩尔定律所预测的处理速度并且让AI的应用狭窄的子科目协同合作。从1990年到2020年,摩尔定律本身就可提高一个服务器的处理性能一百万倍。在2020年,对比之下,云计算可以让与人工智能相关的处理能力乘以十亿。云计算和开源程序(比如由Hadoop开发的YAHOO!)的结合,可以让AI系统在多个服务器上同时的运行数据和算法。对于AI来说,那意味着我们可以摈弃那些笨重的仓筒子科目(机器学习,语音识别,对话管理等等),而是同时处理他们并且把他们有机的整合到一起。

Prepare for Bionic Swarms

准备好应对仿生群

In the future, swarms of computers, like colonies of ants or flocks of starlings, will be directed via cloud computing toward global problem solving. (If this sounds to you something like the "bionic swarms" from William Gibson's 1984 science fiction novel, Neuromancer, you're right.) AI researchers already have an official name for this phenomenon: Swarm Intelligence. Darpa recognized this opportunity and its potential for future military action early on. Five years ago, it began contracting more than $200 million with SRI International and leading university research subcontractors to reassemble AI subdisciplines into an integrated whole. The goal: a mobile, automated knowledge assistant for battlefield command and control.

在未来,电脑群,像蚂蚁的殖民地或者欧椋鸟群一样,竟会被云计算带领起来解决全球性问题。(如果你听起来像威廉-吉布森1984年的科幻小说,《神经漫游者》中的仿生群,那就对了)。人工智能研发者已经给这种现象定义了一个官方的名字:群体智慧。Darpa早就意识到了这个可被用在军事行动方面的机会。五年前,SRI国际和领先的大学科研分包商达成了一个两千万美元的合同,项目是整合AI的子科目。目标是:一个移动,自动的战场指挥与控制助手。

But it's not only in battle that mobile computing is key. Because of its size, the smartphone has limited ability for information capture and display. Users must gather data from the cloud and find a way to make decisions on the fly. Any AI applications that help users quickly turn complexity into simplicity thus become essential.

在战斗中,不仅仅移动计算很重要。限制于他的尺寸,智能手机只有有限的信息捕捉和显示能力。用户必须从云获取数据,并且找到一个方法来在移动中作出决定。任何能够帮助用户快速化繁为简的AI应用都很必要。

With financing from my firm, San Jose (Calif.) startup Siri licensed the Darpa-funded SRI technology and developed a virtual personal assistant that allowed users to access services verbally, such as restaurant reservations and movie tickets, from the Web. Apple (AAPL) bought Siri earlier this year. (Not disclosing terms was a condition for the deal.) Expect to see more AI-based mobile technology quite soon. Besides Apple, both Google (GOOG) and Microsoft (MSFT) have made intelligence-at-the-interface a key R&D focus. Google's recent announcement of its Voice Actions app for Android, seen by analysts as a response to Apple's Siri acquisition, should really be understood more broadly as the second of many salvos in the coming Smartphone AI Wars.

获得了我的公司的资助,圣荷西(加州)启动Siri,利用 Darpa资助的SRI技术并开发出了一个允许用户通过网络语音接入服务的虚拟个人助手,比如餐馆预订和订购电影票。苹果公司(AAPL)今年早些时候购买了这一技术。(条件未公开。)现在可以期待很快能看见更多的基于AI的移动技术。不光是苹果,谷歌(GOOG)和微软(MSFT)已经把界面智能化作为开发重点。谷歌最近的关于Android上的Voice Actions的发布,被分析师认为是苹果购入SIRI的一个回应,或许被认为是即将到来的智能手机AI之争的第二轮交火。

And what of the larger future of AI? Optimists, such as Raymond Kurzweil in The Singularity is Near, foresee an AI utopia in which human and machine intelligence combine. Pessimists, such as Samuel Butler in his prescient Darwin Among the Machines (1863), forecast a dystopian future akin to SkyNet in Terminator 3. For now, however, it's clear that the decade of mainstream AI has arrived. The question for businesses and investors alike is: "What's your AI strategy?"

那么AI的未来会如何?乐观主义者,比如撰写《奇异点已近》一文 的Raymond Kurzweil,预见到了一个人机和谐的人工智能乌托邦。而悲观主义者,比如写出了预见性的《电脑天演论》(1863)的Samuel Butler,预见着一个类似《终结者3》中天网的反乌托邦的未来。但是现在,很明确的是,主流AI的时代正在到来。商人和投资者的问题是,“你的AI策略是什么?”

Gary Morgenthaler is a partner at Morgenthaler Ventures in Menlo Park, Calif.

Gary Morgenthaler是加州门罗公园Morgenthaler投资公司合作人之一。

  

译后记:

这个新闻生动的说明了,没有硬件的升级,也就没有软件的换代。我脆弱的大脑思考着:

有没有可能在一个386上做一个算法,使得向一个人那样思考,只是非常慢?

摩尔定律,但我们的处理器加工工艺达到1纳米级别会怎么样?

群体智能产生主动思考的智慧。接下来出于其自身生存的考虑,它开始思考如何处置人类。。。

如果群体智能是真的,那么岂不是迟早会有一个存在于云中的上帝。或者已经有了。并且如果他能学习的话,正在以百万倍于我们的速度进化着。。。

最后,我们真的有能力控制我们创造出来的东西?

人工智能谱曲的新时代编辑本段回目录

从今往后,如果你经常听到音乐界传来有疑似莫扎特、巴赫的新作品问世,千万不要惊诧。这既不是古典音乐大师们的起死回生,也决非音乐界的考古新发现,这些作品出自音乐奇才Emily Howell的‘手笔’。

EmmyExperiments in Musical Intelligence (音乐智能实验)的简称(EMI),为了上口故称EmmyEmily HowellEmmy的升级版。这是美国加州大学圣克鲁斯分校的音乐教授兼作曲家大卫·科普开发的一款软件,认为是目前最先进的人工智能音乐作曲系统。这款程序因为其具有以假乱真的能力而在音乐界引起了激烈的争论。现场聆听过科普先生表演的听众被这种新颖独特的作曲手法深深折服。科普先生为Emmy注入了生命活力,让它成了现代音乐界的弗兰肯斯坦 (科学怪人)。

致力于创造独树一帜、新潮有趣的当代古典音乐,是大卫·科普追求的梦想。

早在1980年,科普要为一部歌剧谱曲。很快预付的稿费被花完了,工作却没有多大进展。无论他如何费尽心机,合适的音符就是跳出不来。他甚至觉得自己已经丧失了审美判断力。在恐惧和绝望交加的时刻,他的目光转向了电脑。

科普先生在摆弄合成器制造各种音响效果的过程中,接触过谱曲软件。他受人工智能启发,觉得或许能找到一种方法,创作出有自己的风格的新作品。

他读遍圣克鲁斯图书馆人工智能的图书,又坐进课堂学习计算机编程。不久他开发出一套符合自己口味的简便作曲软件,但没过多久,他意识到这项工作难度太大。于是他把目标定得更加实际:从模仿巴赫风格的赞美诗做起。经过一年的努力,他编出的曲子已经达到大学二年级生的水平。此后他又顺利引进和弦制作,不过乐曲的活力仍嫌不足,但对于软件作曲不啻是个小小的胜利,但作为制作原创性音乐的一种方法,还来路方长。

终于,功夫不负有心人。1987年,当Emmy谱写的巴赫风格作品首次演出时,坐在伊利诺伊大学音乐厅的所有听众惊讶得目瞪口呆。两年以后,在圣克鲁斯巴洛克艺术节上,科普先生要求听众告诉他,哪首曲子是巴赫的原创,大多数人都无法给出正确的答案。

虽然Emily的作品给古典音乐学者留下了深刻印象,他们甚至无法相信这些曲子是出自电脑的手笔。科普先生因此而赢得不少音乐家和计算机专家的赞誉,但与此同时他的创作也引起令人不安的问题:如果机器编出的曲子可以与莫扎特的奏鸣曲媲美,那莫扎特还有什么独特之处?此外,人们还要问,这些大作到底有没有自己的灵魂,难道贝多芬等大师们的作品可以通过符号来操控?

一位音乐爱好者在不知道作品是由机器谱写之前,对它赞不绝口。半年后,他在加州大学圣克鲁斯分校出席科普先生的讲座,再次聆听了同一首作品,这次他告诉作者,音乐确实很美,但缺少打动灵魂的深度。

还有一位艺术爱好者霍夫斯塔特也有类似的看法,他认为音乐是人类传递深层情感信息的基本途径。而机器,无论拥有多么高超的运算能力,都无法拥有这种神奇的精神力量。

还有一种观点认为,科普的作品有抄袭之嫌。

科普对此是这样回答的:暂且把人类具有精神创造天赋的观点搁置一边,看看四周不计其数的音乐作品吧。作曲家难道不是在听到些音符之后才创作新品的吗?那么第一个音符的作者是谁?是鸟,还是飞机?

也许,确实有作曲家从鸟类汲取灵感,但科普认为,新作品肯定得到过其他作曲家的启迪,他们下意识地把听到的东西切成片段然后以新颖的方式重新拼接。不然怎么解释古典音乐的某种风格会传承三、四个世纪?为了证明自己的观点,科普对著名作曲家的作品进行逆向开发,寻找作品的修辞手法、语句和思想。

没有谁的东西是完全原创的,在音乐创作上,我们听什么写什么。作曲家的任务就是审视历史聆听音乐,每个人都在向别人借鉴。不同之处在于你借鉴多少以及用多么高超的手段把这些东西进行组合。科普认为。

科普先生是基于这样的理念来开发作曲软件的,他认为所有的音乐,或者任何具有开创性的工作,都是建立在已有知识的基础之上,或称为站在巨人的肩膀上(有人称之为剽窃)。其实我们创造的一切东西都是重新排列组合的产物。他的观点虽然有一定的道理,但他把人类的创造等同于简单的重新排列组合却让一些音乐家和艺术家大为不满,这不是在贬低自己的劳动吗?

在科普先生看来,即使是最受人尊敬的作曲家,在创造自己的东西时,或多或少受到过以往作品的启发。他正是由此豁然开朗,利用Emily Howell软件对著名作曲家的作品进行逆向开发,提炼作品中的构成要素。

实际上,科普先生的作品并非是建立在简单排列组合基础上的粗制滥造,而是人和机器的合作和交融。1981年当他即将完成那部歌剧的时候,他已经为Emmy建立了一套数据库。科普先生是在用专业的元素和理念与机器进行音乐对话,机器在他的调教下,优化作曲手法,逐渐形成自己的风格,创作出属于科普先生的原创音乐。

虽然有音乐家和作曲家对他的工作持怀疑态度,但从现实的情况来看,科普先生确实开辟了机器谱曲的新天地,而且其作品一点也不亚于艺术大师。当他的作品登台亮相后,他得到了自己一生中最好的评价。90年代后期科普教授名声鹊起,当时的《纽约时报》用许多版面报道了他的成果。

他还引起了对人工智能感兴趣的科学家们的关注。斯坦福大学人文学科电脑辅助研究中心的高级研究员埃莉诺认为科普的发现具有颠覆性意义。她认为,科普先生揭示了许多有关音乐风格、作品定义和个人对音乐演化的作用等诸方面至关重要的要素,这些东西在他之前还没有被清晰地阐述过。他对于我们理解音乐确实作出了重要贡献,揭示了一些真正值得了解的东西。

在与作曲软件相伴近30年之后,科普的作曲速度已经相当惊人。他刚才还躺在浴缸里构思,转眼之间他擦干身子,穿好衣服,来到电脑跟前,连续捣鼓10分钟,一首100多小节的乐曲便大功告成。不过他仍然有所迷惑不解,自己几十年的创新探索能否最终更接近于终极目标:谱写出流芳百世的不朽之作。

尽管引来不少争议,科普先生还是希望自己的探索能吸引更多作曲家的关注。他认为现在是百舸争流的时代,他相信自己的作为预示着新型音乐创作的未来:大批原创音乐电脑作曲家即将诞生。如果能又快又好地写出听众喜爱的东西,就肯定能形成气候。

我相信这是迟早的事,我不认为作曲家都反应迟钝。他们最终会借助一切可用工具去追求音乐梦想,写出自己喜欢的音乐。或许开始会有所犹豫,但最终该发生的还是会发生,无论我们喜欢与否。

目前,至少有一个著名的演唱组合(因为签署了保密协议,他不能说出其名称)请他用软件帮助他们谱写新作品。他指出这样的合作就像潘多拉盒子,一旦打开就会引起连锁反应。

 我希望孩子们都能听到我的作品,演奏我的音乐,像我童年时期一样从音乐中获得乐趣,他说。如果这个愿望无法实现,那才是我完全的失败。

Emily Howell即将推出一个专辑,大家可以点击网址http://www.miller-mccune.com/culture-society/triumph-of-the-cyborg-composer-8507/欣赏这位机器人天才的作品小样。

《纽约时报》:能说会道的计算机编辑本段回目录

在人工智能不断发展的如今,人工智能分担了人类越来越多的工作,使许多基础工作领域能实现自动化和高效率。虽然现在它们看起来还有些“呆头呆脑”,但相信在不久的将来,它们将显示出更多的“智能”。

“你好,谢谢您的到访,”医师助理向一个母亲和他5岁的儿子问道。“是您还是您儿子需要就诊呢?”

The boy, the mother replies. He has diarrhea.

母亲回答说:是我儿子,他腹泻了。

“Oh no, sorry to hear that,” she says, looking down at the boy.

“哦,真可怜。”她看着那个小男孩说。

The assistant asks the mother about other symptoms, including fever (“slight”) and abdominal pain (“He hasn’t been complaining”).

助理问了母亲其他的一些症状,包括发烧(“轻微的”)以及腹痛("他还没有说")等。

She turns again to the boy. “Has your tummy been hurting?” Yes, he replies.

她又一次转向那个小男孩,问:“你胃疼么?”

“是的。”男孩回答道。

After a few more questions, the assistant declares herself “not that concerned at this point.” She schedules an appointment with a doctor in a couple of days. The mother leads her son from the room, holding his hand. But he keeps looking back at the assistant, fascinated, as if reluctant to leave.

又问了一些问题后,助理说:“没什么大碍。”这些天来,她给医生排了一次会诊。那位母亲牵着小孩的手把他带出房间。但小男孩一直出神地看着那位助理,似乎不舍得离开。

Maybe that is because the assistant is the disembodied likeness of a woman’s face on a computer screen — a no-frills avatar. Her words of sympathy are jerky, flat and mechanical. But she has the right stuff — the ability to understand speech, recognize pediatric conditions and reason according to simple rules — to make an initial diagnosis of a childhood ailment and its seriousness. And to win the trust of a little boy.

或许是因为这位助理只是一张电脑屏幕上的女性面孔,而没有真实的躯体——一个只提供必要服务的虚拟电脑人物化身“阿凡达”(Avatar)。她的声音干涩、低沉还很机械。但她是有内涵的——她能听懂对话,能识别儿科的症状并能根据简单的原则推测病因,能够对小孩轻微疾病做出初步诊断,并判断其严重性。还有,能够赢得小孩子的信任。

“Our young children and grandchildren will think it is completely natural to talk to machines that look at them and understand them,” said Eric Horvitz, a computer scientist at Microsoft’s research laboratory who led the medical avatar project, one of several intended to show how people and computers may communicate before long.

“我们的小孩以及小孙子们会觉得,和一个看着他们并且理解他们的机器对话非常正常,”微软研究实验室的电脑科学家埃里克·霍维茨说。他主持着“阿凡达”项目,这是显示在不久的将来人与电脑来如何交流的数个尝试之一。

For decades, computer scientists have been pursuing artificial intelligence — the use of computers to simulate human thinking. But in recent years, rapid progress has been made in machines that can listen, speak, see, reason and learn, in their way. The prospect, according to scientists and economists, is not only that artificial intelligence will transform the way humans and machines communicate and collaborate, but will also eliminate millions of jobs, create many others and change the nature of work and daily routines.

几十年来,电脑科学家们在不断追寻人工智能——电脑模仿人类思考的能力。近些年来,进展巨大,机器以它们的方式听、说、看、推理以及学习。通过科学家和经济学家的努力,该领域的前景是,人工智能不仅可以转换人与机器间的交流及合作,还可以消除成千上万的工作,创造很多其他的工作,并改变工作的属性和日常惯例。

The artificial intelligence technology that has moved furthest into the mainstream is computer understanding of what humans are saying. People increasingly talk to their cellphones to find things, instead of typing. Both Google’s and Microsoft’s search services now respond to voice commands. More drivers are asking their cars to do things like find directions or play music.

主流人工智能技术技术更进一步的方向是电脑能理解人类在说什么。人们对他的手机说去找些东西,而不需要打出来。谷歌和微软的搜索功能都能识别声讯命令,更多的司机可以命令他们的车子找到正确的方向或播放音乐等。

The number of American doctors using speech software to record and transcribe accounts of patient visits and treatments has more than tripled in the past three years to 150,000. The progress is striking. A few years ago, supraspinatus (a rotator cuff muscle) got translated as “fish banana.” Today, the software transcribes all kinds of medical terminology letter perfect, doctors say. It has more trouble with other words and grammar, requiring wording changes in about one of every four sentences, doctors say.

过去的三年里,使用语音软件记录翻录病人问诊和治疗方法的美国医生的数量增加了三倍,达到15万人,这个进展是显著的。几年前,冈上肌(一种肩部的旋转肌肉)被翻译成“鱼香蕉”。如今,软件可以把所有的专业术语转录得更好, 但在其他词汇和语法方面,仍有较大的麻烦,每四个句子中就有一个需要改变措辞,医生说。

“It’s unbelievably better than it was five years ago,” said Dr. Michael A. Lee, a pediatrician in Norwood, Mass., who now routinely uses transcription software. “But it struggles with ‘she’ and ‘he,’ for some reason. When I say ‘she,’ it writes ‘he.’ The technology is sexist. It likes to write ‘he.’ ”

“五年前,这几乎是难以理解的。”来自马萨诸塞诺伍德的小儿科医生马克尔·A·李医生说,他现在通常使用转录软件,“但是出于一些原因,软件在‘她’和‘他’上比较纠结。当我说‘她’时,软件写了‘他’,软件有大男子主义,总喜欢写‘他’。”

Meanwhile, translation software being tested by the Defense Advanced Research Projects Agency is fast enough to keep up with some simple conversations. With some troops in Iraq, English is translated to Arabic and Arabic to English. But there is still a long way to go. When a soldier asked a civilian, “What are you transporting in your truck?” the Arabic reply was that the truck was “carrying tomatoes.” But the English translation became “pregnant tomatoes.” The speech software understood “carrying,” but not the context.

同时,经国防高级研究计划局测试的翻译软件,足够能跟上简单对话的速度。在进入伊拉克的部队中,英语和阿拉伯语实现互译,但这还有很长的一段路要走。但一个士兵问一个当地人:“你的卡车里装的是什么?”阿拉伯人回答说卡车“装着马铃薯。”但英语翻译变成了“怀孕的马铃薯。”语音软件理解了“装着的”的意思,但在这个语境里意思并不对。

Yet if far from perfect, speech recognition software is good enough to be useful in more ways all the time. Take call centers. Today, voice software enables many calls to be automated entirely. And more advanced systems can understand even a perplexed, rambling customer with a misbehaving product well enough to route the caller to someone trained in that product, saving time and frustration for the customer. They can detect anger in a caller’s voice and respond accordingly — usually by routing the call to a manager.

虽然还远不“完美”,一直以来,语音识别系统在很多方面都是很不错的。比如说话务中心,语音软件使许多来电实现了自动化。并且,更先进的系统甚至能很好地理解一个思维凌乱的顾客,指引来电者通过软件进入到正确的通道中,节约了时间,免于懊恼。它们能够从声音中识别出来电者的生气语调,并据此做出反应——通常是把电话转接给经理。

So the outlook is uncertain for many of the estimated four million workers in American call centers or the nation’s 100,000 medical transcriptionists, whose jobs were already threatened by outsourcing abroad. “Basic work that can be automated is in the bull’s-eye of both technology and globalization, and the rise of artificial intelligence just magnifies that reality,” said Erik Brynjolfsson, an economist at the Sloan School of Management at the Massachusetts Institute of Technology.

因此,对于美国大约400万话务员及10万录写员而言,未来是不确定的,他们的工作正受到外包业务的冲击。“关键是,不管是技术还全球化层面,基础工作都可以形成自动化,并且随着人工智能技术的进一步发展,这将很快实现。”麻省理工学院斯隆管理学院的经济学家埃里克·布林约尔弗松说。

布林约尔弗松说,包括个人和企业公司在内,人工智能也将迸发革新、创造机会,因为互联网已经引领了新型的商业模式,例如谷歌和博客、社交网络等新型交际形式。专家预计,聪明的机器有一天将能当学生导师、外科助理以及技术过硬的驾驶员。

电子助理

“你好,你在找埃里克么?”微软公司埃里克·霍维茨办公室门外的接待员问。

这个助理是个电脑化身,是公司员工的时间管理者。屏幕中女性面孔的背后是诸多电脑技术的集成,包括语音理解、图像识别和机械学习。这个电子助理监视的数据库包括老板数年前的会议和预约日程表,以及他的工作伙伴。这款软件还能长距离地监听电话、说话对像、以及在一周间的哪一天哪一时刻。它也能追踪老板的行动轨迹,以及计算机的应用程序——电子邮件、文档、浏览网页——使用了多久,在何时使用过。

当一个同事问霍维茨先生的会面或电话将何时结束时,电脑虚拟人将会浏览数据库以寻求匹配的答案。例如,在一周相似时间段里,通常这个人的电话会持续多久,霍维兹先生在说话的同时浏览着网页。“可能在五六分钟后吧。”电脑虚拟人回答道。

电脑虚拟人有一个老板所有同事及朋友的数据库,从研究小组成员到高级管理部门,并且,它也能做好会面的安排,霍维兹先生告诉了虚拟人各种会见可以有的长短间断。一个仔细探讨需要深入的对话,相比于和高级经理的会见,不允许有太多的打断。“可以打断他了,”助理告诉来访者。“进去吧。”

作为研究的一部分,研究者们计划通过编程,让虚拟人同等待着的同事进行“和工作相关的聊天”。

对话可以是老板的一天:“埃里克下午要进行一个又一个的会议,但他很希望能见见你。”或者,老板做的工作:“是的,上个月你是和埃里克见得最多的一位。”甚至可以是当地的球队:“昨晚西雅图水手的比赛怎样?”

霍维兹先生和其他高级科学家制作的虚拟人面孔,是以一个真正的行政助理为原型的。在微软,工作者们通常握着他们自己的日程表。因此,霍维兹先生说,人类助理最大的好处是可以将他的时间表和与同事间的合作安排得更好。“我想这是对我的扩展。”他说,“这样的结果是,可以有一个更全面、更高效的埃里克。”

拥有人工智能的计算机可以被认为是一台相当于白痴专家的机器,他们擅长于那些挑战了最聪明的人类的技能,如像大师一样玩国际象棋,或者,像冠军一样回答“危险!”。虽然,这些技能只属于知识的狭小范畴。对电脑而言,难得多的是常识类的技巧,就像对话时理解语言段落,以及社交状况,比如轮流对话。

安排日程的助理可以将大量的数据在极短时间内插入合适的地方,但一些不太熟悉的词汇可能会使计算机助理陷入僵局,笑话、反讽、挖苦它们都无法识别。

这种脆弱性会导致错误。在办公室助理那里,可能会是一次会面的遗漏或者日程表的混乱。但如果是医生助理,可能会造成严重得多的错误,例如错误的诊断,或者把病得很重的孩子送回家。

微软的这项计划还仅仅在研究的起步阶段,但他们认为事情正朝前发展。并且,随着对话识别和其他人工智能技术承担了越来越多的任务,他们确信这项技术的社会影响可以使其局限性不那么受关注。

一些人警告说,聪明的机器可以被当成孤立公司、政府和富人们的工具使用。他们说,不必去理会那些焦躁不安的来访者和市民,机器可以做这些。

“机器人的声音成为那些不想处理抱怨的机构的完美屏障。”计算机科学家杰伦·拉尼尔说,他是《你并不是一个器具》(克洛夫出版社,2010)的作者。

智能装置

“我想明晚八点在一个浪漫的饭店预定两个位置,不用走太远的。”

这个命令看起来很简单,但对于一台智能计算机而言,这需要一大堆的技术支持。

一些公司,AT&T,微软、谷歌和其他一些公司,已有迹象表明,它们在开发能够识别语音命令的服务。除了互联网语音搜索之外,他们也进展得很好。

或许进展最快的是西丽公司,这是一家硅谷的公司,它提供“可视化个人助理”服务,这是一款集成软件程序,能够听从命令,查找信息以及完成动作。

作为iPhone应用程序出品方的西丽公司,通过由Nuance交流系统操控的电脑给有浪漫情调的饭店发送音频请求——Nuance交流系统是最大的语音识别系统公司——Nuance交流系统将语音转化成文本,文本再回传给西丽公司的电脑,然后识别其中的含义。

“这有点像嘈杂饭店中的服务生,面对着一个英语是其第二语言的顾客,”汤姆· 格鲁伯说,他是一位人工智能研究者,同时也是西理工的创立者之一,“虽然并不完美,但是在语境中,服务生能明白你想要什么。”

西丽系统获取更多的数据,以确定系统是在寻找一家有浪漫情调的饭店还是一出戏剧。它知道电话的位置,有相关的法则去理解类似于词组“不用走很远”的意思。它通过Yelp以及谷歌等在线搜索服务寻找“有浪漫情调的”。

西丽列出饭店的清单,使用“开桌”在线预定服务,找到第二天晚上8点还有空余座位的匹配饭店。符合条件的饭店呈现在用户的手机上,并且可以通过敲击屏幕上的按钮完成预定。当其运行时,这些详尽的数据可以在几秒钟的跳转后完成。

令人印象深刻的是,苹果公司五月份买下了西丽公司,估计交易额超过2000万美元

尼尔森·沃尔特斯是纽约的一位音乐电视制片人,他是西丽的粉丝。西丽节约了他的时间,并给他的女朋友留下了深刻印象。“我再也不会在Yelp上推荐的饭店清单中迷失了。”他说。但有时,沃尔特斯先生说,西丽挺笨的。现在,他让西丽查找一间他知道的寿司饭店,它却返回的却是亚洲护卫队服务的信息。“我发誓这不是我要找的。”

格鲁伯先生说,西丽可以听懂一个不太熟悉的日语词汇,但因不知道语境而造成错误。

在汽车行业,语音识别系统也进展很大。仅仅三年,福特汽车公司使用了Nuance软件,已经使其产品的语音识别从100个词语增加到10000个词语和词组。

类似于福特同步这样的系统在新车里越来越流行。相比于GPS (全球定位系统)、智能手机的小屏幕中令人眼花缭乱的道路,它们也被一些安全专家当做防御工具。

这个夏末,新的福特埃奇模型将可以识别完整的地址,包括用单独的词组表述的城市和州,并且能够反馈回路线信息。

解救顾客

“请从我们的菜单中选择一样产品。”电子厂品巨头松下公司曾让来电者从覆盖了力量工具到等离子电视的产品中选择所需的帮助。

这并不奏效。念完整个菜单需要2分半钟,百分之四十的顾客失望地挂掉了电话。“我们淹没在电话中,”客服中心副经理唐纳德·斯津潘尼克回忆道。2005年,松下向 AT&T 实验室寻求帮助。

AT&T公司的研究者们花了很长时间研究弗吉尼亚州切萨皮克市的松下客服中心里的电话记录,以建立来电者用以描述产品和问题的词语、词汇结构模型,并且建立不断更新的数据库。“就像是一个婴儿,你给他的数据越多,他就会越聪明。”麦辛·吉尔伯特说,他是AT&T 实验室的一位语音信息专家。

这个系统旨在能识别话语中出现的词组和句子中的关键字,因此,自动助理可以智能地回复。

“请问有什么可以帮助您?”录音机里的自动女性声音问道。

“我正和我的狗狗看第五频道的‘美国偶像’,”电话那头一位心急如焚的妇女说,“突然,我的电视卡在西班牙语上了。”

“你的电视是什么种类的?”‘自动助理问,备选答案包括等离子、液晶屏以及其他。

“液晶的。”那妇女回答道,然后她的电话被转接给一位专门解决液晶电视问题的客服。

一些简单的问题,例如产品登记、产品维修点等,可以完全由自动系统独立解决。技术提升了,而来电者也更愉快地和系统对话。令人惊喜的是,以“谢谢”为结束的来电者数量上升了。

一些来电者,特别是年轻人,他们通过输入“等离子帮助”之类的关键词可以让事情变得更加简单。斯津潘尼克先生说:“我把这个叫作顾客的谷歌定位。”

总体看来,松下客服一半的来电由自动系统接听,五年前这个数字是10%。据一位经理洛兰·罗宾斯估计。

而另一半的来电是复杂得多的问题,像给电缆箱接入数字电视。这些情况中,语音系统很快把电话转给产品的专业代理人,因此,更多的问题由其他的电话解决。现在,相比于五年前的1600万宗,松下每年解决1000万宗售后问题,而解决每宗售后问题的花费减少了50%。

随着在菲律宾和牙买加客服中心关于老款以及简单产品的询问,语音技术的问题自动分类使松下的客户服务更加国际化。弗吉尼亚中心现在把精力放在松下的高端产品上,例如等离子电视和家庭影院设备。由于能经常接受再培训,话务员现在更熟练了。

安东尼·安德加在话务中心已经当了五年的代理人,他参加了客服中心组织的电气学课程,这个课程由当地一所社区大学的导师授课。他曾负责许多产品,但现在他专门负责等离子及液晶电视的事务。

安德加先生去年拿到了他的电气学认证,并继续深造。“你必须在技术上获得提升,”他说。“你必须获得电气方面的认证,只有这样,你才能进入松下的大门。”

高效的听众

“为了保证服务质量,您的电话可能会被录音。”

虽然客服中心的数量在不断攀升,但技术支持服务台和公司热线电话的听众只是一台计算机。它不仅可以识别话语,也能识别出情绪,并能容忍用户的抱怨。

例如,在电话行业,公司用语音识别软件获取竞争者在通讯上的计划,提出早期预警。通过探听AT&T及其他运输公司的使用频率。例如,这款软件能给公司提出竞争对手的低价报警,这比几百个客服代理人的效率还要高得多。这时,公司就可以让他们的客户代理同来电者还价,表示将会取消服务。

Aetna公司使用了相同的软件,在去年成千上万打往客服中心的电话中,以注意“旧车换现金” 这个词组。结果发现,数以万计的汽车销售商反应政府刺激需要保险业的引证。Aetna公司为这些特殊的来电者开发了相关的保险服务,并且增加了掌控音频的员工。

数年前,苹果智能手机风靡一时,一家互联网服务公司,GoDaddy,从中学习了其电话监听软件,但用户并不知道在他们的iPhone上要如何使用。于是这家公司马上训练了大批的代理人去接听这类电话,并推出了可以让用户直接在iPhone上可以使用该服务的应用程序。

在很多话务中心,一般的情绪通常都能被识别出来,通过识别特殊的词语词组,或者在对话中的另一些属性。“声感”,是一种以色列开发的语音分析软件,已经计算出了许多信号的数据,包括呼吸、对话速率及音调,来提醒客服代表及管理者,来电方变得心烦意乱或者易于动怒。

像很多技术一样,人工智能的现实问题是将会被怎么应用。自动化是高效方便的优秀工具。使用A.T.M.(自动取款机)进行现金存储,就不用在柜台前拍长队等待。如果话务中心的自动语音系统能够回答问题,那么,比起一直提供客服的客服代表,机器就是一种更好的解决方法。

确实,人工智能日益增多的用处——回答问题、完成简单的任务、提供个人助理服务——意味着这项技术能推广开去,当然,其中也有风险。人们将很快被指导着应该如何使用它们。

“这不是人类的智慧,但这将是很好的机器的智慧。”布朗大学计算机科学的一位教授安德里斯·范·丹说,“可能会有各种错误和问题需要进行人工检测和平衡,但使用人工智能是一条良好的途径。”

参考文献编辑本段回目录

http://article.yeeyan.org/view/109905/137590
http://www.businessweek.com/technology/content/sep2010/tc20100920_838814.htm
http://article.yeeyan.org/view/148023/113423

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 人工智能时代 人工智能

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。