人v机器: 可以在电脑库克, 写和比我们更好的涂料?

Man v Machine: Can Computers Cook, Write and Paint Better Than Us?

人工智能现在可以赢得一场比赛, 认识你的脸, 即使提出上诉,反对你的停车票. 但它可以做的东西甚至人类发现猫腻?


技术Guardian.co.uk这篇文章题为 “男人v机器: 可以在电脑做饭, 写和油漆比我们好?” 被写了利奥本尼迪塔斯, 为监护人上周六6月4日 2016 08.00 世界标准时间

一个视频, 为了我, 改变了一切. 这是一个从旧的雅达利游戏画面 爆发, 一,你离开滑动挡板和沿着屏幕的右下方, 试图通过弹跳球放进去摧毁砖. 你可能已经了解了游戏的玩家: 由开发了一种算法 DeepMind, 英国人工智能公司,其AlphaGo方案还击败最大的人会去的球员, 李世石, 今年早些时候.

也许你希望一台电脑,要善于电脑游戏? 一旦他们知道该怎么做, 他们肯定做的更快,更一致的比任何人. DeepMind的突破球员什么都不知道, 然而. 这不是与说明如何游戏作品编程; 它甚至没有告知如何使用控件. 所有它必须是在屏幕和命令上的图像,试图得到尽可能多的点尽可能.

视频. 首先, 桨让球落入遗忘, 明知没有更好的. 终于, 只是瞎, 它敲回球, 摧毁一个砖和得一分, 所以它认识到这一点,更经常做它. 经过两小时的练习, 或约 300 游戏, 它已成为严重良好, 比你或我将永远不会. 然后, 经过约 600 游戏, 事情变得怪异. 该算法开始针对同一地点, 一遍又一遍, 为了通过砖块钻入空间背后. 一旦出现, 任何突围玩家都知道, 球会反弹一段时间了, 聚集自由点. 这是计算机自身想出了一个好策略.

“当我们的研究人员看到这个, 实际上他们感到震惊,“DeepMind的CEO, 杰米斯Hassabis, 告诉观众在巴黎的技术会议. 您可以 看他的示范, 太, 听到笑声和掌声时,机器计算出它的穴居战略. 电脑已经成为智能, 有点像我们.

“人工智能”是只是最古老和最大肆宣传的所有计算的嗡嗡声短语. 这个想法最初是由严重的酝酿 阿兰·图灵美国计算机和情报, 该 1950 一篇论文,他提出了后来被称为 图灵测试: 如果一台机器能说服你通过交谈,这是人类的, 它是做不亚于任何人能证明它的真实想法. 但长期AI没有得到普遍使用,直至 1955, 什么时候 美国数学家约翰·麦卡锡 提出了专家会议. 这发生的次年, 自那时以来,领域运行的狂热和绝望的大约二十年的周期. (研究人员甚至有一个新的名词 - “AI冬天” - 来形容它的法术不兴. 20世纪70年代和90年代是特别苛刻。)

今天有一个新的热潮, 它看起来和别人不同: 它适合在你的口袋里. 一个电话可以击败国际象棋世界冠军, 认识你的孩子在电台歌曲和图片, 和你的声音翻译成另一种语言. 审计署机器人图为 Yotam Ottolenghi 可以用两条腿走路, 说话, 找到一个球,甚至舞蹈. (这是一个机器人, 虽然, 没有AI: 它不能设计的菜单。)

听到人工智能的进步, 你不需要专家来告诉你兴奋, 或恐惧. 你刚开始得到的感觉: 智力是这里. 显然,谷歌却感觉, 太, 因为它买DeepMind一个传言$650米. 在 2013, Facebook推出自己的项目, 并计划制定脸部和自然语言识别的网站. 开发商已经开始对智能聊天机器人的工作, 其中Facebook用户将能够使用它的Messenger服务召唤.

到目前为止, 电脑已经没有被“聪明”的说法, 或仅狭如此. 他们已经擅长这让我们目不暇接简单的任务, 如数学, 但糟糕的那些我们习以为常, 这变成是认真刻苦. 行走的行为是值得现代机器人学像婴儿和仍在奋斗; 基本慢条斯理任务依然遥远的梦. “一个例子是,你或我可以做一杯茶在别人的厨房缓解,“说 阿兰·温菲尔德教授, 在西英格兰大学的机器人专家. “有没有可能做到这一点,地球上的机器人。”

要理解为什么做人这么难, 想想你会如何让计算机能够识别从照片的人. 没有AI, 你必须知道你自己先做到这一点, 为了该计算机程序. 你必须收集和思考所有可能的模式, 颜色和面的形状, 以及它们如何在光,并在不同的角度改变 - 你必须知道什么是显著的,什么是镜头上只是泥. 随着AI, 你不必解释: 你只要给真实数据的山路到电脑,让它学习. 你如何设计学习软件仍然是一个深奥的事, 一些抢手的计算机科学家省, 但很显然,他们已经通过设计在结构松散的,基于数据处理的结构在大脑中得到了上一个赢家. (这就是所谓的“深度学习”。) 至于真实数据的山区, 很好, 这就是谷歌, Facebook的, 亚马逊, 尤伯杯和所有其余碰巧躺在附近.

在这个阶段, 我们还不知道的AI,它使用会变成最好的. 乔希Newlan, 加州编码器在上海工作, 厌倦了听着无尽的电话会议, 所以 他建立了一些软件来听他. 现在, 每当Newlan的名字被提及, 他的电脑立刻送他最后一分半钟的成绩单, 等待 15 秒, 然后播放了他一句话也记录, “抱歉, 我不知道我的麦克风是静音。“去年, 约什 - 布劳德, 一个英国小将, 建成了 自由人为律师,呼吁对停车罚单; 他计划再建通过外国的法律制度,以指导难民. 这种可能性是......好吧, 也许一个算法可以算的可能性.

因此,将机器的头脑1天超越我们自己? 我发言的研究人员谨慎, 并采取煞费苦心地强调什么他们的机器不能做. 但我决定把AI的测试: 它可以规划一顿饭以及Ottolenghi? 它可以画本人的肖像? 是技术还是人工智能 - 抑或是开始智能化, 真的?

烹饪试验

很好, 我会说这是不可怕. 人类已经担任我厉害. 虽然在真理的名义,IBM的沃森厨师给这个菜 (“鸡肝酱咸味”) 是因为它值得大约开胃.

为了公平对待厨师沃森, 和卫报周末自己的厨师专栏作家Yotam Ottolenghi, 我已经将它们相当的任务. 我问基于四种成分的菜,似乎无处属于彼此靠近: 鸡肝, 希腊酸奶, 芥末和龙舌兰酒. 他们可以添加他们喜欢其他任何, 但是这四个必须是在成品菜, 我会煮来吃. 厨师沃森没有犹豫, 瞬间给我两面酱. Ottolenghi更谨慎. “当我的挑战我认为, “这是行不通的,“他告诉我,.

我认为同样的. 或者至少,我想我会最终吃的管理是,尽管其成分确定了两个菜, 而不是因为他们,. 事实上 - 你会认为我是爬行, 还等什么呢 - Ottolenghi的食谱是一个启示: 肝脏和洋葱和减少龙舌兰酒, 与苹果供应, 萝卜, 甜菜和菊苣色拉, 用芥末和酸奶敷料. 这道菜可以使纸张上意义不大, 但我狼吞虎咽地吃一盘的感觉,每一个环节都属于. (和香醋增厚酸奶和芥末,而不是芥末: 认真地, 试一试。) Ottolenghi告诉我几招只是发布的晶须短.

事情是, 那道菜把他和他的团队三天完善. 他们能够品尝和洽谈口味, 纹理, 颜色, 温度, 在某种程度上,沃森不能 - 虽然有过“讨论”关于在未来增加一个反馈机制, 厨师屈臣氏首席工程师, 弗洛里安皮内尔, 告诉我. “配方是一个复杂的事情,“Ottolenghi说. “这对我来说很难,即使了解如何计算机将接近它。”

Yotam Ottolenghi和厨师屈臣氏菜
Yotam Ottolenghi和厨师屈臣氏菜 照片: 周杰伦为布鲁克斯卫

沃森最早是由IBM建造 赢得电视智力竞赛节目危害! 在 2011. 在某些方面,这是一个误导性的挑战, 因为对于一个计算机测验的艰难的部分是理解问题, 不知道答案; 人类, 它周围的其他方法. 但沃森赢得了, 其技术开始被应用在其他地方, 包括作为厨师, 产生新的配方基础上 10,000 取自真实案例 胃口好杂志.

首先,软件不得不“摄取”这些食谱, 作为沃森团队把它. 大量的运算走进了解什么成分是, 他们是如何准备, 他们多久熟, 为了能够解释如何在新菜中使用它们. (这个过程仍然可以出差错. 即使是现在厨师沃森建议称作“软体动物”的成分, 它有益解释是“第六届全长 册页由Ween的“。)

一个更大的问题是试图给机器的味觉. “这是很容易为计算机创建一个新的组合,“皮内尔说, “但怎么能评价1?“沃森被教导要考虑每种成分为特殊的风味化合物的组合 - 其中有数以千计的 - 然后成分,有化合物结合共同. (这一原则, 食物配搭, 人与人之间是公认的。) 最后, 该软件生成一步一步的指示,是有意义的人类厨师. 重点是惊喜,而不是实际的膳食计划. “厨师沃森是真的要激发你,“皮内尔解释. 每个配方自带的提醒“用自己的创造力和判断力”.

我需要. 所述第一步骤是“烤面包平叶欧芹”, 刚刚是不是一个好主意. 我正在做, 有效, 一个慢煮五香猪肉和牛肉肉酱, 包括我所有的四种成分, 但奇怪的是沃森还包括黄瓜和不断告诉我“赛季五香粉”, 我拒绝在原则上做. 到底, 我有一个丰富的酱相当接近的农家风味, 但不uneatable. 我不能品尝芥末或龙舌兰酒, 我很高兴约.

Yotam Ottolenghi与机器人淖
Yotam Ottolenghi与淖机器人借给希伯小学的礼貌, 伦敦. 照片: 杰伊·布鲁克斯. 造型: 李Flude

沃森是聪明的,任务是艰难, 但我愿意说,这是不超过一点乐趣食品书呆子, 直到Ottolenghi阻止我. “我认为慢烹调肝脏有一点肉的想法是伟大的,“他说,. “这加剧了味. 一切都将走到一起. 如果我不得不重新开始使用这个配方, 显然酸奶不适合 - 但我会离开橘子皮还有, 一些调料. 我不认为这是一个非常糟糕的食谱. 它可以工作“。

判决书 沃森隐藏成分的怪事, 但Ottolenghi让他们唱.

写作考试

放小 语言大师 毗邻IBM和谷歌的可怕机器, 它看起来计算作为一个袖珍计算器先进. 然而,尽管沃森摸索通过其学徒, 语言大师已经开始工作. 如果你读美联社股市报告, 或雅虎的体育新闻, 还有,你会觉得他们写一个人的好机会.

语言大师是一种人为的作家. 在北卡罗莱纳州的一家名为自动化开发的启示, 它拨弄从数据集中最有趣的金块,并使用它们来组织文章 (或发电子邮件, 或产品上市). 当遇到真正的大新闻, 它采用更感性的语言. 它改变用词和语法,使工作更具可读性. 即使是一个笨拙的机器人厨师可以有用武之地, 但是写为人类的读者必须光滑. 挂接到一个语音识别装置,诸如 亚马逊的回声, 语言大师,甚至可以应对口语人的问题 - 关于一个人的投资业绩, 说 - 一个精心口语答案, 宣布有趣第一, 并留下了什么都不有趣. 如果你不知道的伎俩, 你会觉得 案件 9000 已经抵达.

诀窍是这样的: 语言大师确实编写人不知道的部分很容易. Locky斯图尔特 从自动见解给了我一个教程. 你写成语言大师的句子,如, “新美国广播公司的数据显示,纽约询价的发行量上升 3% 在四月“,然后你玩. 该 3% 有来自您的数据, 所以你选择单词“玫瑰”,写一个规则, 被称为“分支”, 其中如果比例超过“涨”字将变为“狂涨”一词 5%. 然后你分支“玫瑰”成为“下跌”如果百分比为负. 如果该比例 -5% 或更低, “玫瑰”变成了“暴跌”.

然后,你给它的同义词. 因此,“暴跌”,也可以“通过大幅下跌”. “询问者的流通”可以“循环在询问者”. “狂涨”可以“飙”等. 然后你添加更多的句子, 或许大概在线流量, 或者哪些天的打印张的销量最好, 或约一年的比较上一年. 然后你弄巧. 你告诉语言大师,首先把句子最有新闻价值的信息, 也许是指那些拥有最大百分比变化. 也许你添加一个分支说,一个结果是“质量标题中最好/最差表现”. 地狱, 你甚至可以教它一些老舰队街的技巧, 因此,如果发行量骤降片开始“编辑查尔斯·凯恩面临着激烈的批评”, 但如果循环有“狂涨”这成为“查尔斯·凯恩已经沉默的批评有消息称”. 将“多”或“试”或“继续”,如果你得到同样的事情两个月连续.

“人工智能实际上是正在建设的逻辑网络的人类智慧,“斯图尔特说:, “在同一个网络,你会写故事的时候使用. 它可能已被开发 10 或 15 几年前, 代码, 但要使其工作在这个规模只可能最近。“显然,这需要更长的时间准备语言大师上的一篇文章,而不是传统上写一个, 但一旦你这样做, 计算机可以每个月发布一个新的报纸发行量的故事, 每报纸, 接收信息的几秒钟内. 它可以发布数以百万计的故事在几分钟内 - 或者只发布其中的一些, 如果数据未到达新闻价值的一个给定的阈值. 因而它成为一种自动编辑, 太, 在彻底调节口味, 频率和歇斯底里.

对于语言大师的任务, 我认为足球: 它是产生大量的数据,并具有个性化的希望文章的读者现场. 卫足球作家 雅各布斯坦伯格 志愿者以计算机上, 我提供从最近的英超联赛的事实表: 上赛季的联赛排名和本赛季在圣诞节和结束位置, 进球失球和, 最佳射手的名字,总, 夏季转会的价值,并从管理者报价.

仅由该数据加工, 计算机和人类必须在每次写本赛季的审查对于给定的俱乐部. 斯坦伯格选择莱切斯特城,其数量应该包含一个故事,任何人看见的基础上,. 文字匠并不需要选择. 这将尽一切 20.

而事实上,计算机和人类迅速产生相当类似的工作:

莱切斯特城足球杰米Vardy

无论斯坦伯格和语言大师带来显着的第一个句子. 也许热衷于原汁原味的声音, 自动见解使用一些聪明的技巧把感情到了后者的文章, 敏锐地猜测,莱斯特是“希望能在上面完成 10 上赛季第14名的成绩“之后. 我期待通过语言大师的其他文章和南安普敦, 在完成第七个赛季, 有“眼睛对欧洲现货”, 而曼城“赛季开始的第二名后,梦想着一个联赛冠军”.

反过来, 斯坦伯格挖掘更有意义的进入数字, 可见 杰米Vardy 不仅拿下 24 目标, 但不是被所有但其他两名球员管理,这是他的团队的目标比例更高. 语言大师知道如何工作的, 当然, 人们可以很容易地设置它做同样的. 其实翻翻它, Steinberg的整个制品可能已创建由熟练语言大师程序员 - 与一条线的异常. “这是一个神奇的赛季,“他引用莱斯特经理的话说,, 前加入, “如此名正言顺, 鉴于对转让26.7米£一个夏天的支出使得他们的第八最低挥金如土“. 这种“理直气壮所以”显示究竟是谁知道他在写作的作家.

判决书 斯坦伯格是一个更好的作家, 除非你想 20 数据重物品 10 分钟.

这幅画测试

一台笔记本电脑要我微笑. “这是一个好心情,” 西蒙·科尔顿 说. 他知道,因为他是谁编写它的科学家. 我们在伦敦科学博物馆, 其中绘画傻瓜, 因为它是所谓, 是给一个公开演示. 我不显示我的牙齿很重要, 科尔顿说:, 因为一些有关的光使他们看起来绿色绘画傻瓜.

从我的无牙的笑容笔记本电脑创建了一个它想画什么“概念”, 基于它的情绪. 情绪来源于最近卫报的文章的“情绪分析”, 当它发生的时候 (平均阅读Guardian是一个令人沮丧, 似乎, 除了对园艺的东西). 昨天愚人节是这样的心情不好,它派人走上漆; 今天是感觉“转正”.

接下来,傻瓜试图与模拟刷和模拟手画 (其实, 科尔顿的手的图像) 我身后的屏幕上. 它学会了反映工作的心情 图拉, 另一台计算机科学家, 在犹他州杨百翰大学, 谁训练神经网络坐在成千上万的人在数以万计的画作面前,并要求他们来标记每一个都用什么形容词来识别图像的情感属性来考虑. 愚者现在知道鲜艳的色彩反映出一个好心情, 和“紧孵化铅笔”创建一个图片是“冷”. 当它完成, 它打印出一个网页,一个类型的自我批判. “总体, 这是一个相当光明的肖像,“ 它说. “没关系, 但我的风格在这里降低了明亮的水平. 所以我有点恼火了。“

和我们一起在这里, 好奇,但在她的画架观看太忙, 是 莎拉简月亮, 谁与展品的艺术家 肖像画家皇家社会. 她不希望看到我的牙齿, 或. “我们写生,“她说, “你不能举行的微笑坐在后坐. 这就是为什么所有的传统形象表现相当轻松的特点。“

绘画傻瓜是一种特殊的机器, 甚至稍有名气, 但我不能否认,月亮是几乎所有的,为什么我很高兴能在这里. 由一个真正的人正在绘制的感觉, 让他们看着你,想你的时候, 是令人兴奋和奉承. 情感分析和培训资料, 另一方面, 加起来还不到任何东西的我的看法我在乎, 和完成的肖像画不会改变我的脑海里. 月球是一个可爱, 动真格, 这感觉马上像被另一个见过一个人. 愚人节的三大工作有气质,我喜欢, 但主要是他们看起来像已经通过某种软件过滤了照片. 科尔顿坚持傻子在这里“学习会更好”,但我期待和思考: 所以呢?

狮子座本尼迪塔斯的绘画由莎拉简月亮
狮子座本尼迪塔斯由莎拉简文所看到...
狮子座本尼迪塔斯绘画的绘画傻瓜电脑
......和想象的绘画傻瓜笔记本电脑. 照片: 穆雷巴拉德

然后,我觉得多一些. 一方面, 事实证明,艺术是更多的机械比我意识到. “我试图在狮子座看作一个抽象的集合形状, 形式, 颜色, 音,“月亮代表科尔顿, “从事实,这是一个鼻子脱身. 因为当你开始做, 你在你赶上了 认为 看起来像一个鼻子“。

“什么软件做的是把它分解成彩色区域,“科尔顿说:.

“是, 究竟,“月亮同意. “我认为这就是最好的画家办. 它抄录。“后来她告诉我,她感到了一种”血缘关系“的软件,因为他们并肩工作.

更重要的是, 我认识到,重要的不是机器油漆如何; 这是我怎么看. 月亮我明白, 我认为. 她是一个人,我知道那是感觉, 所以我很在乎她的照片. 但到底是什么感觉想成为绘画傻瓜? 那是什么的画像想告诉我?

判决书 月球的画更丰富; 愚人节仍然在学习和实践了几个世纪的去.

翻译考试

谷歌翻译是第一块合适的科幻成真, 和 它已经十年的老. 它在许多方面,其中典型代表有AI来了. 有用, 当然; 有声有色, 毫无疑问; 但还是笨重的地狱, 尽管重大改进.

如果你还没有使用它, 它的工作原理是这样: 在任意的输入文本或网页链接 103 支持的语言和您在任何其他人得到一个粗略的翻译秒钟后. 您手机上的应用程序将抄写你说的话,然后说回去, 翻译 (32 语言支持); 无论你将相机指向它可以代替外语标志或菜单的文本. 不需要解释如何的酷是 (并且它是免费的).

在全球范围内, 一个半十亿人使用谷歌每个月翻译, 大多那些不会讲英语谁 (这就是 80% 人) 但谁想要了解互联网 (这就是 50% 英语). “我们的大部分增长, 实际上我们大部分的流量, 来自发展中国家或新兴市场,如巴西, 印度尼西亚, 印度, 泰国,“巴拉克说TUROVSKY, 在谷歌产品管理和用户体验的负责人翻译. 它是令人惊讶的约会流行, 太, 他补充说. “喜欢的东西:”我爱你“和”你的眼睛很漂亮“, 这是非常普遍的。“

该软件一直使用的统计机器学习的一种形式: 在网上淘的已翻译的文本 - 联合国声明, 欧盟文件 - 和测绘一定的单词和短语相应彼此的可能性. 更多的数据它收集, 它变得更好, 但改善趋于平缓几年前. 不久, TUROVSKY说, 他们将部署新的深度学习算法, 这将产生更流畅的翻译.

即便如此, 有限制, 有的似乎根本当你跟一个人的翻译,实现他们的工作是如何微妙的是. 罗斯·施瓦茨安妮·德Freyman 志愿者这个任务. 无论是专业的法语/英语翻译, 我需要两个,因为, 为了判断翻译有多好,而不精通两种语言, 我们需要翻译的两倍 - 从英语一旦进入法国, 一次回来. 谷歌翻译没有保留原来的内存,并且可以做同样的事情.

我选择了与众不同的,但不是特别野生的还是暧昧的散文很短的通道从一开始 赫尔佐格索尔贝娄. 译者通常需要上下文, 所以我告诉施瓦茨和德Freyman它来自一个著名的世纪中期的美国小说.

在几天之内, 施瓦茨和德Freyman返回原来的文字很流畅传真. 这里有一些细微之处都没有存活, 但仍然通过一个快乐阅读, 和主要含义遇到完全相同.

谷歌翻译只需要几秒钟, 其结果是既令人印象深刻的和不充分, 在古怪的地方好, 在其他古怪坏 - 转动“他”变成了“它”,而赫尔佐格爱上炮制的想法. 奇迹般地, 它不断“破解”为主人公的描述. 法国没有字结合,在英国破获coveys的“破”与“狂”的感觉, 所以德Freyman使得“绦”, 从施瓦茨回来为“疯狂”.

“谷歌翻译会看统计概率,并说, 什么是'裂'是什么意思?“TUROVSKY解释. “和统计, 它会尝试决定是否意味着'破裂'或'疯子'或什么. 那, 一台机器, 是一个不平凡的任务“。它也不是简单的对于人, 即使我们发现很容易. 你必须要问娄是否可能意味着赫尔佐格被“破解”,如物理破碎. 然后,你就必须承担不, 因为人体一般不这样做. 所以,你会不知道他确实意味着,承担,而不是, 如果你不熟悉的使用, 他一定意味着“疯狂”, 因为你明白你读过休息. 但要做到这一切, 不会谷歌翻译必须非常清醒, 我问? TUROVSKY笑. “我不认为我有资格回答这个问题。”

判决书 从谷歌的一些bullseyes和howlers翻译, 而Schwartz和德Freyman流利和详细.

guardian.co.uk©卫报新闻 & 传媒有限公司 2010

相关文章