人v機器: 可以在電腦庫克, 寫和比我們更好的塗料?

Man v Machine: Can Computers Cook, Write and Paint Better Than Us?

人工智能現在可以贏得一場比賽, 認識你的臉, 即使提出上訴,反對你的停車票. 但它可以做的東西甚至人類發現貓膩?


技術Guardian.co.uk這篇文章題為 “男人v機器: 可以在電腦做飯, 寫和油漆比我們好?” 被寫了利奧本尼迪塔斯, 為監護人上週六6月4日 2016 08.00 世界標準時間

一個視頻, 對我來說, 改變了一切. 這是一個從舊的雅達利遊戲畫面 爆發, 一,你離開滑動擋板和沿著屏幕的右下方, 試圖通過彈跳球放進去摧毀磚. 你可能已經了解了遊戲的玩家: 由開發了一種算法 DeepMind, 英國人工智能公司,其AlphaGo方案還擊敗最大的人會去的球員, 李世石, 今年早些時候.

也許你希望一台電腦,要善於電腦遊戲? 一旦他們知道該怎麼做, 他們肯定做的更快,更一致的比任何人. DeepMind的突破球員什麼都不知道, 然而. 這不是與說明如何遊戲作品編程; 它甚至沒有告知如何使用控件. 所有它必須是在屏幕和命令上的圖像,試圖得到盡可能多的點盡可能.

視頻. 首先, 槳讓球落入遺忘, 明知沒有更好的. 終於, 只是瞎, 它敲回球, 摧毀一個磚和得一分, 所以它認識到這一點,更經常做它. 經過兩小時的練習, 或約 300 遊戲, 它已成為嚴重良好, 比你或我將永遠不會. 然後, 經過約 600 遊戲, 事情變得怪異. 該算法開始針對同一地點, 一遍又一遍, 為了通過磚塊鑽入空間背後. 一旦出現, 任何突圍玩家都知道, 球會反彈一段時間了, 聚集自由點. 這是計算機自身想出了一個好策略.

“當我們的研究人員看到這個, 實際上他們感到震驚,“DeepMind的CEO, 傑米斯Hassabis, 告訴觀眾在巴黎的技術會議. 您可以 看他的示範, 太, 聽到笑聲和掌聲時,機器計算出它的穴居戰略. 電腦已經成為智能, 有點像我們.

“人工智能”是只是最古老和最大肆宣傳的所有計算的嗡嗡聲短語. 這個想法最初是由嚴重的醞釀 阿蘭·圖靈美國計算機和情報, 該 1950 一篇論文,他提出了後來被稱為 圖靈測試: 如果一台機器能說服你通過交談,這是人類的, 它是做不亞於任何人能證明它的真實想法. 但長期AI沒有得到普遍使用,直至 1955, 什麼時候 美國數學家約翰·麥卡錫 提出了專家會議. 這發生的次年, 自那時以來,領域運行的狂熱和絕望的大約二十年的週期. (研究人員甚至有一個新的名詞 - “AI冬天” - 來形容它的法術不興. 20世紀70年代和90年代是特別苛刻。)

今天有一個新的熱潮, 它看起來和別人不同: 它適合在你的口袋裡. 一個電話可以擊敗國際象棋世界冠軍, 認識你的孩子在電台歌曲和圖片, 和你的聲音翻譯成另一種語言. 審計署機器人圖為 Yotam Ottolenghi 可以用兩條腿走路, 說話, 找到一個球,甚至舞蹈. (這是一個機器人, 雖然, 沒有AI: 它不能設計的菜單。)

聽到人工智能的進步, 你不需要專家來告訴你興奮, 或恐懼. 你剛開始得到的感覺: 智力是這裡. 顯然,谷歌卻感覺, 太, 因為它買DeepMind一個傳言$650米. 在 2013, Facebook推出自己的項目, 並計劃制定臉部和自然語言識別的網站. 開發商已經開始對智能聊天機器人的工作, 其中Facebook用戶將能夠使用它的Messenger服務召喚.

到目前為止, 電腦已經沒有被“聰明”的說法, 或僅狹如此. 他們已經擅長這讓我們目不暇接簡單的任務, 如數學, 但糟糕的那些我們習以為常, 這變成是認真刻苦. 行走的行為是值得現代機器人學像嬰兒和仍在奮鬥; 基本慢條斯理任務依然遙遠的夢. “一個例子是,你或我可以做一杯茶在別人的廚房緩解,“說 阿蘭·溫菲爾德教授, 在西英格蘭大學的機器人專家. “有沒有可能做到這一點,地球上的機器人。”

要理解為什麼做人這麼難, 想想你會如何讓計算機能夠識別從照片的人. 沒有AI, 你必須知道你自己先做到這一點, 為了該計算機程序. 你必須收集和思考所有可能的模式, 顏色和面的形狀, 以及它們如何在光,並在不同的角度改變 - 你必須知道什麼是顯著的,什麼是鏡頭上只是泥. 隨著AI, 你不必解釋: 你只要給真實數據的山路到電腦,讓它學習. 你如何設計學習軟件仍然是一個深奧的事, 一些搶手的計算機科學家省, 但很顯然,他們已經通過設計在結構鬆散的,基於數據處理的結構在大腦中得到了上一個贏家. (這就是所謂的“深度學習”。) 至於真實數據的山區, 好, 這就是谷歌, Facebook的, 亞馬遜, 尤伯杯和所有其餘碰巧躺在附近.

在這個階段, 我們還不知道的AI,它使用會變成最好的. 喬希Newlan, 加州編碼器在上海工作, 厭倦了聽著無盡的電話會議, 所以 他建立了一些軟件來聽他. 現在, 每當Newlan的名字被提及, 他的電腦立刻送他最後一分半鐘的成績單, 等待 15 秒, 然後播放了他一句話也記錄, “抱歉, 我不知道我的麥克風是靜音。“去年, 約什 - 布勞德, 一個英國小將, 建成了 自由人為律師,呼籲對停車罰單; 他計劃再建通過外國的法律制度,以指導難民. 這種可能性是......好吧, 也許一個算法可以算的可能性.

因此,將機器的頭腦1天超越我們自己? 我發言的研究人員謹慎, 並採取煞費苦心地強調什麼他們的機器不能做. 但我決定把AI的測試: 它可以規劃一頓飯以及Ottolenghi? 它可以畫本人的肖像? 是技術還是人工智能 - 抑或是開始智能化, 真的?

烹飪試驗

很好, 我會說這是不可怕. 人類已經擔任​​我厲害. 雖然在真理的名義,IBM的沃森廚師給這個菜 (“雞肝醬鹹味”) 是因為它值得大約開胃.

為了公平對待廚師沃森, 和衛報週末自己的廚師專欄作家Yotam Ottolenghi, 我已經將它們相當的任務. 我問基於四種成分的菜,似乎無處屬於彼此靠近: 雞肝, 希臘酸奶, 芥末和龍舌蘭酒. 他們可以添加他們喜歡其他任何, 但是這四個必須是在成品菜, 我會煮來吃. 廚師沃森沒有猶豫, 瞬間給我兩麵醬. Ottolenghi更謹慎. “當我的挑戰我認為, “這是行不通的,“他告訴我,.

我認為同樣的. 或者至少,我想我會最終吃的管理是,儘管其成分確定了兩個菜, 而不是因為他們,. 事實上 - 你會認為我是爬行, 還等什麼呢 - Ottolenghi的食譜是一個啟示: 肝臟和洋蔥和減少龍舌蘭酒, 與蘋果供應, 蘿蔔, 甜菜和菊苣色拉, 用芥末和酸奶敷料. 這道菜可以使紙張上意義不大, 但我狼吞虎咽地吃一盤的感覺,每一個環節都屬於. (和香醋增厚酸奶和芥末,而不是芥末: 認真地, 試一試。) Ottolenghi告訴我幾招只是發布的晶須短.

事情是, 那道菜把他和他的團隊三天完善. 他們能夠品嚐和洽談口味, 紋理, 顏色, 溫度, 在某種程度上,沃森不能 - 雖然有過“討論”關於在未來增加一個反饋機制, 廚師屈臣氏首席工程師, 弗洛里安皮內爾, 告訴我. “配方是一個複雜的事情,“Ottolenghi說. “這對我來說很難,即使了解如何計算機將接近它。”

Yotam Ottolenghi和廚師屈臣氏菜
Yotam Ottolenghi和廚師屈臣氏菜 照片: 周杰倫為布魯克斯衛

沃森最早是由IBM建造 贏得電視智力競賽節目危害! 在 2011. 在某些方面,這是一個誤導性的挑戰, 因為對於一個計算機測驗的艱難的部分是理解問題, 不知道答案; 人類, 它周圍的其他方法. 但沃森贏得了, 其技術開始被應用在其他地方, 包括作為廚師, 產生新的配方基礎上 10,000 取自真實案例 胃口好雜誌.

首先,軟件不得不“攝取”這些食譜, 作為沃森團隊把它. 大量的運算走進了解什麼成分是, 他們是如何準備, 他們多久熟, 為了能夠解釋如何在新菜中使用它們. (這個過程仍然可以出差錯. 即使是現在廚師沃森建議稱作“軟體動物”的成分, 它有益解釋是“第六屆全長 冊頁由Ween的“。)

一個更大的問題是試圖給機器的味覺. “這是很容易為計算機創建一個新的組合,“皮內爾說, “但怎麼能評價1?“沃森被教導要考慮每種成分為特殊的風味化合物的組合 - 其中有數以千計的 - 然後成分,有化合物結合共同. (這一原則, 食物配搭, 人與人之間是公認的。) 最後, 該軟件生成一步一步的指示,是有意義的人類廚師. 重點是驚喜,而不是實際的膳食計劃. “廚師沃森是真的要激發你,“皮內爾解釋. 每個配方自帶的提醒“用自己的創造力和判斷力”.

我需要. 所述第一步驟是“烤麵包平葉歐芹”, 剛剛是不是​​一個好主意. 我正在做, 有效, 一個慢煮五香豬肉和牛肉肉醬, 包括我所有的四種成分, 但奇怪的是沃森還包括黃瓜和不斷告訴我“賽季五香粉”, 我拒絕在原則上做. 到底, 我有一個豐富的醬相當接近的農家風味, 但不uneatable. 我不能品嚐芥末或龍舌蘭酒, 我很高興約.

Yotam Ottolenghi與機器人淖
Yotam Ottolenghi與淖機器人借給希伯小學的禮貌, 倫敦. 照片: 傑伊·布魯克斯. 造型: 李Flude

沃森是聰明的,任務是艱難, 但我願意說,這是不超過一點樂趣食品書呆子, 直到Ottolenghi阻止我. “我認為慢烹調肝臟有一點肉的想法是偉大的,“他說,. “這加劇了味. 一切都將走到一起. 如果我不得不重新開始使用這個配方, 顯然酸奶不適合 - 但我會離開橘子皮還有, 一些調料. 我不認為這是一個非常糟糕的食譜. 它可以工作“。

判決書 沃森隱藏成分的怪事, 但Ottolenghi讓他們唱.

寫作考試

放小 語言大師 毗鄰IBM和谷歌的可怕機器, 它看起來計算作為一個袖珍計算器先進. 然而,儘管沃森摸索通過其學徒, 語言大師已經開始工作. 如果你讀美聯社股市報告, 或雅虎的體育新聞, 還有,你會覺得他們寫一個人的好機會.

語言大師是一種人為的作家. 在北卡羅萊納州的一家名為自動化開發的啟示, 它撥弄從數據集中最有趣的金塊,並使用它們來組織文章 (或發電子郵件, 或產品上市). 當遇到真正的大新聞, 它採用更感性的語言. 它改變用詞和語法,使工作更具可讀性. 即使是一個笨拙的機器人廚師可以有用武之地, 但是寫為人類的讀者必須光滑. 掛接到一個語音識別裝置,諸如 亞馬遜的迴聲, 語言大師,甚至可以應對口語人的問題 - 關於一個人的投資業績, 說 - 一個精心口語答案, 宣布有趣第一, 並留下了什麼都不有趣. 如果你不知道的伎倆, 你會覺得 案件 9000 已經抵達.

訣竅是這樣的: 語言大師確實編寫人不知道的部分很容易. Locky斯圖爾特 從自動見解給了我一個教程. 你寫成語言大師的句子,如, “新美國廣播公司的數據顯示,紐約詢價的發行量上升 3% 在四月“,然後你玩. 該 3% 有來自您的數據, 所以你選擇單詞“玫瑰”,寫一個規則, 被稱為“分支”, 其中如果比例超過“漲”字將變為“狂漲”一詞 5%. 然後你分支“玫瑰”成為“下跌”如果百分比為負. 如果該比例 -5% 或更低, “玫瑰”變成了“暴跌”.

然後,你給它的同義詞. 因此,“暴跌”,也可以“通過大幅下跌”. “詢問者的流通”可以“循環在詢問者”. “狂漲”可以“飆”等. 然後你添加更多的句子, 或許大概在線流量, 或者哪些天的打印張的銷量最好, 或約一年的比較上一年. 然後你弄巧. 你告訴語言大師,首先把句子最有新聞價值的信息, 也許是指那些擁有最大百分比變化. 也許你添加一個分支說,一個結果是“質量標題中最好/最差表現”. 地獄, 你甚至可以教它一些老艦隊街的技巧, 因此,如果發行量驟降片開始“編輯查爾斯·凱恩面臨著激烈的批評”, 但如果循環有“狂漲”這成為“查爾斯·凱恩已經沉默的批評有消息稱”. 將“多”或“試”或“繼續”,如果你得到同樣的事情兩個月連續.

“人工智能實際上是正在建設的邏輯網絡的人類智慧,“斯圖爾特說:, “在同一個網絡,你會寫故事的時候使用. 它可能已被開發 10 或 15 幾年前, 代碼, 但要使其工作在這個規模只可能最近。“顯然,這需要更長的時間準備語言大師上的一篇文章,而不是傳統上寫一個, 但一旦你這樣做, 計算機可以每個月發布一個新的報紙發行量的故事, 每報紙, 接收信息的幾秒鐘內. 它可以發布數以百萬計的故事在幾分鐘內 - 或者只發布其中的一些, 如果數據未到達新聞價值的一個給定的閾值. 因而它成為一種自動編輯, 太, 在徹底調節口味, 頻率和歇斯底里.

對於語言大師的任務, 我認為足球: 它是產生大量的數據,並具有個性化的希望文章的讀者現場. 衛足球作家 雅各布斯坦伯格 志願者以計算機上, 我提供從最近的英超聯賽的事實表: 上賽季的聯賽排名和本賽季在聖誕節和結束位置, 進球失球和, 最佳射手的名字,總, 夏季轉會的價值,並從管理者報價.

僅由該數據加工, 計算機和人類必須在每次寫本賽季的審查對於給定的俱樂部. 斯坦伯格選擇萊切斯特城,其數量應該包含一個故事,任何人看見的基礎上,. 文字匠並不需要選擇. 這將盡一切 20.

而事實上,計算機和人類迅速產生相當類似的工作:

萊切斯特城足球傑米Vardy

無論斯坦伯格和語言大師帶來顯著的第一個句子. 也許熱衷於原汁原味的聲音, 自動見解使用一些聰明的技巧把感情到了後者的文章, 敏銳地猜測,萊斯特是“希望能在上面完成 10 上賽季第14名的成績“之後. 我期待通過語言大師的其他文章和南安普敦, 在完成第七個賽季, 有“眼睛對歐洲現貨”, 而曼城“賽季開始的第二名後,夢想著一個聯賽冠軍”.

反過來, 斯坦伯格挖掘更有意義的進入數字, 可見 傑米Vardy 不僅拿下 24 目標, 但不是被所有但其他兩名球員管理,這是他的團隊的目標比例更高. 語言大師知道如何工作的, 當然, 人們可以很容易地設置它做同樣的. 其實翻翻它, Steinberg的整個製品可能已創建由熟練語言大師程序員 - 與一條線的異常. “這是一個神奇的賽季,“他引用萊斯特經理的話說,, 前加入, “如此名正言順, 鑑於對轉讓26.7米£一個夏天的支出使得他們的第八最低揮金如土“. 這種“理直氣壯所以”顯示究竟是誰知道他在寫作的作家.

判決書 斯坦伯格是一個更好的作家, 除非你想 20 數據重物品 10 分鐘.

這幅畫測試

一台筆記本電腦要我微笑. “這是一個好心情,” 西蒙·科爾頓 說. 他知道,因為他是誰編寫它的科學家. 我們在倫敦科學博物館, 其中繪畫傻瓜, 因為它是所謂, 是給一個公開演示. 我不顯示我的牙齒很重要, 科爾頓說:, 因為一些有關的光使他們看起來綠色繪畫傻瓜.

從我的無牙的笑容筆記本電腦創建了一個它想畫什麼“概念”, 基於它的情緒. 情緒來源於最近衛報的文章的“情緒分析”, 因為它發生 (平均閱讀Guardian是一個令人沮喪, 似乎, 除了對園藝的東西). 昨天愚人節是這樣的心情不好,它派人走上漆; 今天是感覺“轉正”.

接下來,傻瓜試圖與模擬刷和模擬手畫 (其實, 科爾頓的手的圖像) 我身後的屏幕上. 它學會了反映工作的心情 圖拉, 另一台計算機科學家, 在猶他州楊百翰大學, 誰訓練神經網絡坐在成千上萬的人在數以萬計的畫作面前,並要求他們來標記每一個都用什麼形容詞來識別圖像的情感屬性來考慮. 愚者現在知道鮮豔的色彩反映出一個好心情, 和“緊孵化鉛筆”創建一個圖片是“冷”. 當它完成, 它打印出一個網頁,一個類型的自我批判. “總體, 這是一個相當光明的肖像,“ 它說. “沒關係, 但我的風格在這裡降低了明亮的水平. 所以我有點惱火了。“

和我們一起在這裡, 好奇,但在她的畫架觀看太忙, 是 莎拉簡月亮, 誰與展品的藝術家 肖像畫家皇家社會. 她不希望看到我的牙齒, 或. “我們寫生,“她說, “你不能舉行的微笑坐在後坐. 這就是為什麼所有的傳統形象表現相當輕鬆的特點。“

繪畫傻瓜是一種特殊的機器, 甚至稍有名氣, 但我不能否認,月亮是幾乎所有的,為什麼我很高興能在這裡. 由一個真正的人正在繪製的感覺, 讓他們看著你,想你的時候, 是令人興奮和奉承. 情感分析和培訓資料, 另一方面, 加起來還不到任何東西的我的看法我在乎, 和完成的肖像畫不會改變我的腦海裡. 月球是一個可愛, 動真格, 這感覺馬上像被另一個見過一個人. 愚人節的三大工作有氣質,我喜歡, 但主要是他們看起來像已經通過某種軟件過濾了照片. 科爾頓堅持傻子在這裡“學習會更好”,但我期待和思考: 所以呢?

獅子座本尼迪塔斯的繪畫由莎拉簡月亮
獅子座本尼迪塔斯由莎拉簡文所看到...
獅子座本尼迪塔斯繪畫的繪畫傻瓜電腦
......和想像的繪畫傻瓜筆記本電腦. 照片: 穆雷巴拉德

然後,我覺得多一些. 一方面, 事實證明,藝術是更多的機械比我意識到. “我試圖在獅子座看作一個抽象的集合形狀, 形式, 顏色, 音,“月亮代表科爾頓, “從事實,這是一個鼻子脫身. 因為當你開始做, 你在你趕上了 認為 looks like a nose.”

“What the software does is break it down into colour regions,” Colton says.

“是, 究竟,” Moon agrees. “I think that’s what the best painters do. It’s transcribing.” Afterwards she tells me she felt a kind of “kinship” with the software as they worked side by side.

更重要的是, I realise that what matters isn’t how the machine paints; it’s how I see. Moon I understand, 我認為. She’s a person and I know how that feels, so I care about her picture. But what does it feel like to be the Painting Fool? Is that what its portraits are trying to tell me?

判決書 Moon’s painting is far richer; the Fool is still learning and has centuries of practice to go.

The translation test

Google Translate was the first piece of proper science fiction to come true, 和 it’s already a decade old. In many ways it typifies where AI has got to. Useful, 當然; impressive, without question; but still clunky as hell, despite big improvements.

If you haven’t used it, it works like this: enter text or web links in any of 103 supported languages and you get a rough translation seconds later in any of the others. The app on your phone will transcribe what you say and then speak it back, 翻譯 (32 languages supported); it can replace the text of a foreign language sign or menu wherever you point the camera. No explanation is needed of how cool that is (and it’s free).

Globally, half a billion people use Google Translate each month, mostly those who don’t speak English (這就是 80% of people) but who want to understand the internet (這就是 50% 英語). “Most of our growth, and actually most of our traffic, comes from developing or emerging markets such as Brazil, 印度尼西亞, 印度, 泰國,” says Barak Turovsky, head of product management and user experience at Google Translate. It’s surprisingly popular for dating, 太, he adds. “Things like ‘I love you’ and ‘You have beautiful eyes’, that’s very prevalent.”

The software has always used a form of statistical machine learning: scouring the internet for already translated text – UN declarations, EU documents – and mapping the likelihood of certain words and phrases corresponding to one another. The more data it gathers, the better it gets, but the improvement levelled off a couple of years ago. 不久, Turovsky says, they will deploy new deep learning algorithms, which will produce much more fluent translations.

即便如此, there are limits, and some seem fundamental when you talk to a human translator and realise how subtle their work is. Ros SchwartzAnne de Freyman volunteer for this task. Both are professional French/English translators, and I need two because, in order to judge how good the translation is without being fluent in both languages, we need to translate twice – once out of English into French, once back again. Google Translate keeps no memory of the original and can do the same thing.

I choose a short passage of distinctive but not especially wild or ambiguous prose from the beginning of Herzog by Saul Bellow. Translators normally require context, so I tell Schwartz and De Freyman that it comes from a famous mid-century American novel.

Within a few days, Schwartz and De Freyman return a very smooth facsimile of the original text. Here and there some nuances have not survived, but the passage remains a pleasure to read, and the main meanings come across exactly.

Google Translate takes only a few seconds, and the result is both impressive and inadequate, weirdly good in places, in others weirdly bad – turning “he” into “it” and concocting the idea that Herzog is in love. Miraculously, it keeps “cracked” as a description of the hero. French has no word that combines the sense of “broken” and “mad” that cracked coveys in English, so De Freyman makes it “cinglé”, which comes back from Schwartz as “crazy”.

“Google Translate would look at statistical probability and say, what does ‘cracked’ mean?” Turovsky explains. “And statistically, it will try to decide whether it means ‘cracked’ or ‘crazy’ or whatever. 該, for a machine, is a non-trivial task.” Nor is it simple for a human, even though we find it easy. You’d have to ask whether Bellow could have meant that Herzog was “cracked” as in physically fractured. Then you’d have to assume not, because human bodies don’t generally do that. So you’d wonder what he did mean and assume instead, if you were not already familiar with the usage, that he must mean “crazy”, because you understand the rest of what you’ve read. But to do all this, wouldn’t Google Translate have to be pretty much conscious, I ask? Turovsky laughs. “I don’t think I’m qualified to answer that question.”

判決書 Some bullseyes and howlers from Google Translate, while Schwartz and De Freyman are fluent and exact.

guardian.co.uk©衛報新聞 & 傳媒有限公司 2010

相關文章