Човекот против машината: Може Компјутери Кук, Пишување и наслика подобро од нас?

Man v Machine: Can Computers Cook, Write and Paint Better Than Us?

Вештачка интелигенција сега може да победи на еден натпревар, препознавање на лицето, дури и поднесе жалба против вашите паркинг билет. Но, може да го направи тоа на работи дури и луѓето се најде незгодно?


Powered by Guardian.co.ukОваа статија со наслов “Човекот против машината: може да се готви компјутери, пишуваат и да се наслика подобро од нас?” е напишана од страна на Лав Бенедиктус, за Гардијан во саботата 4-ти-ти јуни 2016 08.00 Според зоната: UTC

едно видео, за мене, промени се '. Тоа е снимка од стариот Atari игра Збег, онаа каде што слајд гребло лево и десно по дното на екранот, обидува да го уништи тули од бие топката во нив. Што може да прочитате за играч на играта: алгоритам развиен од страна на Deepmind, Британскиот вештачка интелигенција компанија чија AlphaGo програма, исто така, победи една од најголемите некогаш одат играчи, Ли Sedol, почетокот на оваа година.

Можеби може да се очекува на компјутерот да се биде добар во компјутерски игри? Откако тие знаат што да прават, тие сигурно го направи тоа побрзо и подоследно од секое човечко. Збег играч DeepMind знаеја ништо, Меѓутоа. Тоа не е програмиран со инструкции за тоа како функционира играта; тоа не беше дури ни кажа како да ги користите и контролите. Сите што имаа, беше сликата на екранот и командата за да се обиде да добие што повеќе поени што е можно.

Гледајте видеото. Прво, лопатка овозможува на капка топката во заборав, знаејќи дека нема подобар. Со текот на времето, само mucking околу, го удира топката назад, уништи тули и добива точка, па тоа го препознава ова и тоа го прави почесто. По пракса два часа ", или околу 300 игри, тоа беше сериозно добра, подобро од било кога ќе биде вие ​​или јас. потоа, по околу 600 игри, работите се плашлив. Алгоритмот започнува со цел истото место, одново и одново, со цел да се закопуваат низ тули, што во просторот зад. Откако таму, како и секој Збег играч знае, топката ќе отскокнување околу некое време, собирање слободен поени. Тоа е добра стратегија, која на компјутерот излезе со на свој.

"Кога нашите истражувачи го виде тоа, кои, всушност, ги шокираше,"Извршниот директор DeepMind е, Демис Hassabis, кажа на толпата на технологија конференција во Париз. Ти можеш види неговата демонстрација, премногу, и да го слушнете смеа и аплауз кога машината фигури од својата стратегија копајќи. На компјутерот стана интелигентни, малку како нас.

"Вештачка интелигенција" е само за најстарите и најпознатите hyped зуи фрази сите компјутери е. Идејата беше првпат ја објавил сериозно од страна на Алан Тјуринг во Компјутери машини и интелигенција, на 1950 документ во кој тој го предложи она што стана познато како на Туринг тест: Ако машината може да ви убедат преку разговор дека тоа е човекот, што го прави исто како и секој човек може да докаже дека е навистина мислечките. Но терминот АИ не е генерално се користи до 1955, кога Американскиот математичар Џон McCarthy предложи конференција за експерти. Ова се случи следната година, и од тогаш на терен ја работат на околу две-деценија циклус на манија и очај. (Истражувачите дури и да има нов термин - "АИ зима" - да ги опишат своите магии надвор од мода. 1970-тите и 1990-тите години беа особено суров.)

Денес има нова манија, што изгледа различно од другите: тоа се вклопува во вашиот џеб. А телефон може да го победи Светскиот шампион во шах, признае песни на радио и слики од вашите деца, и да се преведат на вашиот глас на друг јазик. робот Нао на сликата тука со Yotam Ottolenghi може да оди на две нозе, зборува, најдете топката, па дури и танц. (Тоа е робот, иако, не АИ: тоа не може да се дизајнира мени.)

По веста за напредокот во АИ, вие не треба експерт да ви кажам да се биде возбуден, или исплашени. Само на проектот за да се добие чувство: интелигенција е тука. Јасно е дека Google добив чувство, премногу, бидејќи го купи DeepMind за шпекулира $ 650 милиони. Во 2013, Фејсбук започна свој проект, со планови за развој на лицето и природни признавање на јазикот на сајтот. Програмери веќе почнаа да работат на интелигентни chatbots, кој корисниците на Фејсбук ќе биде во можност да повика помош на своите услуги Messenger.

Досега, компјутери не се "интелигентни" на сите, или само тесно така. Тие сте биле добри во лесни задачи кои нè маѓепса, како што се математика, но лошо на оние кои ги земаме здраво за готово, кои испаднат да биде сериозно тешко. Чинот на одење е нешто модерна роботи да научат како бебиња и се уште се борат со; Петеринг основни задачи остануваат далечни соништата. "Еден пример за ова е леснотијата со која може или би можел да направи една чаша чај во кујната некој друг," вели Професор Алан Winfield, на roboticist на Универзитетот на Западна Англија. "Не е робот на планетава што може да го направи тоа."

За да се разбере зошто да се биде човек е толку тешко, размислуваат за тоа како може да се добие компјутер да го препознае луѓе од фотографии. без АИ, што треба да знаете како да го направи тоа себе прво, со цел да се програмира на компјутер. Мора да се соберат и да размислуваат за сите можни модели, бои и форми на лицата, и како тие промени во светлината и во различни агли - и вие треба да знаете што е значајно, а што е само кал на леќата. со AI, вие не мора да се објасни: можете само да се даде една планина на реални податоци на компјутер и нека се учат. Како да дизајн на софтвер за учење останува езотерично прашање, провинцијата неколку баран компјутерски научници, но јасно е дека тие го добивме на за победник од страна на осмислување структури на обработка на податоци засновани глобално на структури во мозокот. (Ова се нарекува "длабоко учење".) Што се однесува до планините на реални податоци, и, тоа е она што Google, Фејсбук, Амазон, Желбата и сите останати се случи да се мота.

Во оваа фаза, се 'уште не се знае кој го користи на АИ ќе излезат на најдобрите. Џош Newlan, Калифорнија coder работат во Шангај, досади со слушање на бескрајните конференциски повици, така тој изградил некој софтвер за да се слуша за него. Сега, секаде каде се споменува името Newlan е, неговиот компјутер веднаш го испраќа препис на последниот половина минута, чека 15 секунди, потоа игра снимањето на него, велејќи, "Жалам, Не знаев дека мојот микрофон беше нем. "Минатата година, Џош Browder, еден британски тинејџер, изградено бесплатни вештачки адвокат приговорите против паркинг билети; тој планира да изгради уште да ги води бегалци преку странски правни системи. Можностите се ... Па, можеби еден алгоритам може да смета на можностите.

Така ќе машина умови еден ден надминуваат нашите сопствени? Истражувачите им зборувам се претпазливи, и се потруди да се нагласи она што нивните машини не може да го направи. Но, решив да се стави на тест АИ: да го планираат оброк, како и Ottolenghi? Може да го сликам мојот портрет? Е технологија сеуште вештачки интелигентни - или тоа е почнуваат да се интелигентни, стварно?

тест за готвење

Па, Јас ќе го кажам тоа не е страшно. Луѓето се служи мене полошо. Иако во вистината името што готвач Watson на IBM дава ова јадење ("Пилешки црн дроб Деликатесни сос") е за како апетитот што заслужува.

Да се ​​биде фер да Готвач Вотсон, и Гардијан Викенд е готвач-колумнист Yotam Ottolenghi, Јас ги постави доста задача. Го прашав за јадење врз основа на четири состојки кои се чинеше дека припаѓаат никаде во близина на едни со други: пилешки џигер, грчки јогурт, Васаби и текила. Тие би можеле да додадете нешто што ќе им се допаднала, но овие четири требаше да биде во готовиот сад, што би готви и јаде. Готвач Вотсон не се двоумеше, веднаш ми даде две тестенини сосови. Ottolenghi беше повеќе внимателен. "Кога ја добив предизвик Мислев, "Ова не се случува на работа,"Тој ми кажува.

Мислев дека истите. Или барем јас мислев дека ќе завршуваат јаде две јадења, кои успеаја да биде во ред и покрај нивните состојки, а не затоа што од нив. Всушност - и ќе ме натера да мислам лази, но така што - рецепт Ottolenghi беше откровение: црниот дроб и кромид и намалување на текила, служи со јаболко, ротквица, цвекло и цикорија салата од зеле, со Васаби и јогурт облекување. Садот може да се направи малку смисла на хартија, но јас проголта полна чинија чувство дека секој елемент припадна. (И винегрет задебелена со јогурт и Васаби наместо сенф: сериозно, го даде да се проба.) Ottolenghi ми кажува рецепт е само мустак помалку од издавачките.

Работата е, Антена него и тимот на трите дена зеде за да се усоврши. Тие беа во можност да ги вкусите и да дискутираат за вкусови, текстури, бои, температури, на начин кој Вотсон не може да се - иако имало "дискусии" за додавање на повратни информации механизам во иднина, Готвач водечки инженер Вотсон, Флоријан Pinel, ми кажува. "А рецепт е толку комплексна работа,"Ottolenghi вели. "Тоа е тешко за мене дури и да се разбере како компјутер ќе го пристап."

Yotam Ottolenghi и јадења готвач Вотсон
Yotam Ottolenghi и јадења готвач Вотсон Фотографија: Џеј Брукс за Гардијан

Вотсон првпат беше изграден од страна на IBM за да победи телевизија gameshow ги доведе во опасност! во 2011. На некој начин, тоа беше погрешно предизвик, бидејќи за компјутер на тешки дел на квиз е разбирање на прашањата, не се знае одговорите; за луѓето, тоа е обратно. Но, Вотсон ја доби, и својата технологија почна да се применува на друго место, вклучувајќи ги и како готвач, генерирање на нови рецепти врз основа на 10,000 вистински примери превземени од списание Бон appetit.

Прво на софтвер мораше да "голтаат" овие рецепти, како тим Вотсон го стави. Многу пресметка отиде во разбирањето на она што беа состојки, како тие се подготвени, колку долго тие се готват за, со цел да биде во можност да се објасни како да ги користите во нови јадења. (Процесот се уште може да оди во погрешна насока. Дури и сега готвач Вотсон препорачува состојка наречена "мекотели", што објаснува helpfully е "шестиот целосна должина албум на ween".)

Поголем проблем се обидува да им даде на машина чувство на вкус. "Тоа е лесно доволно за компјутер да се создаде еден роман комбинација,"Pinel вели, "Но, како може да се оцени еден?"Вотсон учеа да се разгледа секоја состојка што е комбинација на специфичен вкус соединенија - од кои постојат илјадници - и потоа да се комбинираат состојките кои имале соединенија во заеднички. (овој принцип, Комбинација со храна, е добро воспоставена меѓу луѓето.) Конечно, Софтверот генерира чекор-по-чекор инструкции кои имаат смисла за човечкото готвач. Акцентот е ставен на изненадувања отколку практична оброк планирање. "Готвач Вотсон е навистина таму да ве инспирира,"Објаснува Pinel. Секој рецепт доаѓа со потсетување за "ја користите вашата сопствена креативност и пресуда".

И јас треба да. Првиот чекор е да се "Здравица рамен лист магдонос", кои едноставно не е добра идеја. Правам, ефикасно, бавно готви зачинето свинско и говедско месо ragu, вклучувајќи ги и моите четири состојки, уште Вотсон чудно исто така вклучува и краставица и постојано ми вели да "сезона со allspice", којашто одбивам да се направи на принципот. На крајот, Имам богат сос со вкус, а во близина на селските дворови, но не и Неможеш да ја јаде. Не можам да ги вкусите Васаби или текила, кој Мило ми е за.

Yotam Ottolenghi со НАО робот
Yotam Ottolenghi со НАО робот позајмени учтивост на Хевер основно училиште, Лондон. Фотографија: Џеј Брукс. стил: Ли Flude

Вотсон е умен и задача е тешка, но јас сум подготвен да кажам дека ова не е ништо повеќе од малку забава за храна генијалци, до Ottolenghi ме запира. "Мислам дека идејата за споро готвење на црниот дроб со малку месо е голема," тој вели. "Се засилува вкусот. Сè што ќе се здружат. Ако морав да се започне одново со овој рецепт, очигледно јогурт не се вклопува - но јас ќе ја напушти портокалова кожа има, неколку од зачини. Јас не мислам дека тоа е многу лош рецепт. Тоа може да работи. "

Пресуда Вотсон крие необичноста на состојки, но Ottolenghi прави да пее.

тест за пишување

Ставете малку Wordsmith до страшни машини на IBM и Google, и тоа изгледа како изчислителна напредни како џебен калкулатор. Сепак, додека Вотсон изгубени топки преку школување, Wordsmith е веќе на работа. Ако ги прочитате извештаите берзата од Асошиетед прес, или Јаху спорт новинарство, постои добра шанса ќе мислат дека се напишани од страна на лице.

Wordsmith е вештачка писател. Развиена од страна на компанијата во Северна Каролина се нарекува Автоматски Увид, тоа plucks најинтересните грутки од базата и да ги користи за структурирање на една статија (или е-мејл, или производ листата). Кога станува збор низ навистина голема вест, тоа го користи повеќе емотивен јазик. Таа варира дикција и синтакса да се направи својата работа повеќе може да се чита. Дури и несмасна робот готвач може да има користи, но пишувањето за човековите читателите мора да бидат мазни. Уредила на уред за препознавање на глас, како што се Ехо на Амазон, Wordsmith дури и може да одговори на говорниот човечки прашање - за извршување на една инвестиции, велат - со смислено зборува одговор, најавувајќи она што е интересно прв, и оставајќи го она што не е интересно на сите. Ако не сте знаеле трик, што се очекуваше случај 9000 пристигнал.

Трикот е во тоа: Wordsmith прави дел од пишување дека луѓето не сфаќаат е лесно. Locky Стјуарт од Автоматската Увид ми дава упатство. Ти пишувам во Wordsmith казна, како што се, "Новите бројки ABC покажуваат дека циркулацијата на Њујорк Inquirer се зголеми 3% во април. "Тогаш ќе се позанимавам. На 3% Дојде од вашите податоци, така да изберете го зборот "Роза" и да пишува по правило, познат како "гранка", која ќе го промени зборот "се искачи" на фразата "скокна" ако процентот е повеќе од 5%. Потоа можете да филијала "Роза" да стане "падна" ако процентот е негативен. Ако процентот е -5% или помала, "Роза" станува "полета".

Тогаш ви се хранат синоними. Така, "падна", исто така, може да биде "значително се намали од страна на". "Циркулација на Inquirer" може да биде "циркулација на Inquirer". "Скокна" може да "порасна" и така натаму. Потоа, можете да додадете повеќе реченици, можеби за онлајн сообраќај, или за кои печати копии дена продава најдобрите, или околу споредби за период од една година. Тогаш ќе го добиете паметен. Ви кажам Wordsmith да се стави на реченици со најмногу топ вест информации од прва, дефинирани можеби како и оние кои имаат најголем процент промени. Можеби ќе додадете гранка да се каже дека резултатот е "најдобриот / најлошите перформанси меѓу насловите на квалитет". пеколот, Можете дури да го научи на некои стари Флит Стрит трикови, така што ако циркулацијата паѓа започнува делото "уредник Чарлс Кејн се соочува со жестоки критики како", но ако циркулацијата има "скокна" ова ќе стане "Чарлс Кејн ги замолче критичарите со веста дека". Вметни "повеќе" или "повторно" или "продолжува" ако се иста работа два месеци по ред.

"Вештачката интелигенција е всушност на човековата интелигенција кој е изградба на мрежата на логиката,"Стјуарт вели, "Иста мрежа ќе се користи кога пишувате приказна. Тоа можеше да се развива 10 или 15 Пред години, во кодот, но за да го направите да работи на оваа скала е можно само во последно време. "Јасно е дека е потребно подолго време за да се подготви една статија на Wordsmith отколку да се напише еден конвенционално, но еднаш сте го направиле тоа, компјутерот може да објави нов тираж весник приказна секој месец, на секој весник, за неколку секунди на приемот на известувањето. Тоа може да се објавуваат милиони приказни во минути - или објавуваат само некои од нив, ако податоците не се постигне одреден праг на актуелност. Така станува автоматски уредник, премногу, со прилагодување на вкусови во будност, фреквенцијата и хистерија.

За задача Wordsmith е, Предлагам фудбал: тоа е област која произведува голем број на податоци и има читателска публика која сака персоналните статии. Гардијан фудбал писател Јаков Стајнберг волонтери за преземање на компјутер, and I provide a table of facts from the recent Premier League: last season’s league position and this season’s position at Christmas and at the end, goals scored and conceded, top scorer’s name and total, value of summer transfers and a quote from the manager.

Working solely from this data, computer and human must each write a review of the season for a given club. Steinberg chooses Leicester City on the basis that its numbers should contain a story that anyone would see. Wordsmith doesn’t need to choose. It will do all 20.

And in fact both computer and human quickly produce quite similar work:

Leicester City footballer Jamie Vardy

Both Steinberg and Wordsmith deliver dramatic first sentences. Perhaps keen to sound authentic, Automated Insights use some clever tricks to put feeling into the latter’s article, astutely guessing that Leicester were “hoping to finish in the top 10 after a 14th place finish last season”. I look through Wordsmith’s other articles and Southampton, having finished seventh last season, have “eyes on a European spot”, while Manchester City “began the season dreaming of a league title after finishing second”.

Conversely, Steinberg digs more meaningfully into the numbers, showing that Jamie Vardy not only scored 24 цели, but that this was a higher percentage of his team’s goals than was managed by all but two other players. Knowing how Wordsmith works, се разбира, one could easily set it up to do the same. In fact looking through it, Steinberg’s entire article could have been created by a skilled Wordsmith programmer – with the exception of one line. “It’s a magical season,” he quotes the Leicester manager as saying, before adding, “justifiably so, given that a summer expenditure of £26.7m on transfers made them the eighth lowest spenders”. That “justifiably so” shows a writer who actually understands what he is writing.

Пресуда Steinberg is a much better writer, unless you want 20 data-heavy articles in 10 минути.

The painting test

A laptop wants me to smile. “It’s in a good mood," Simon Colton вели. He knows because he’s the scientist who programmed it. We are in the Science Museum in London, where the Painting Fool, as it is called, is giving a public demonstration. It’s important that I don’t show my teeth, Colton says, because something about the light makes them look green to the Painting Fool.

From my toothless smile the laptop creates a “conception” of what it would like to paint, based on its mood. The mood comes from a “sentiment analysis” of recent Guardian articles, as it happens (on average reading the Guardian is a downer, очигледно, apart from the stuff about gardening). Yesterday the Fool was in such a bad mood that it sent someone away unpainted; today it is feeling “positive”.

Next the Fool attempts to paint with a simulated brush and a simulated hand (actually, an image of Colton’s hand) on the screen behind me. It learned to reflect its mood from the work of Dan Ventura, another computer scientist, at Brigham Young University in Utah, who trained a neural network to recognise the emotional attributes of images by sitting thousands of people in front of tens of thousands of paintings and asking them to tag each one with whatever adjectives came to mind. The Fool now knows that bright colours reflect a good mood, and “pencils with tight hatching” create a picture that is “cold”. When it is done, it prints out a page with a typed self-critique. “Overall, this is quite a bright portrait,” it says. “That’s OK, but my style has lowered the level of bright here. So I’m a bit annoyed about that.”

Here along with us, intrigued but too busy at her easel to watch, е Sarah Jane Moon, an artist who exhibits with the Royal Society of Portrait Painters. She doesn’t want to see my teeth, either. “We paint from life," таа рече, “and you can’t hold a smile for sitting upon sitting. That’s why all the traditional portraits show quite relaxed features.”

The Painting Fool is a special machine, and even slightly famous, but I can’t deny that Moon is almost all of why I’m excited to be here. The feeling of being painted by a real person, having them look at you and think about you, is exciting and flattering. Sentiment analysis and training data, од друга страна, don’t add up to anything whose view of me I care about, and the finished portraits do not change my mind. Moon’s is a lovely, real thing, which feels straight away like one person seen by another. The Fool’s three efforts have qualities I like, but mostly they look like photographs that have gone through some kind of software filter. Colton insists the Fool is here “to learn to be better” but I look and think: so what?

Painting of Leo Benedictus by Sarah Jane Moon
Leo Benedictus as seen by Sarah Jane Moon…
Painting of Leo Benedictus by the Painting Fool computer
…and as imagined by the Painting Fool laptop. Фотографија: Murray Ballard

Then I think some more. For one thing, it turns out that art is more mechanical than I’d realised. “I try to look at Leo as an abstract set of shapes, форми, бои, tones,” Moon tells Colton, “to get away from the fact that that’s a nose. Because when you start to do that, you get caught up in what you мислам looks like a nose.”

“What the software does is break it down into colour regions,” Colton says.

"Да, точно,” Moon agrees. “I think that’s what the best painters do. It’s transcribing.” Afterwards she tells me she felt a kind of “kinship” with the software as they worked side by side.

Уште поважно, I realise that what matters isn’t how the machine paints; it’s how I see. Moon I understand, Мислам дека. She’s a person and I know how that feels, so I care about her picture. But what does it feel like to be the Painting Fool? Is that what its portraits are trying to tell me?

Пресуда Moon’s painting is far richer; the Fool is still learning and has centuries of practice to go.

The translation test

Google Translate was the first piece of proper science fiction to come true, и it’s already a decade old. In many ways it typifies where AI has got to. Useful, дека; impressive, without question; but still clunky as hell, despite big improvements.

If you haven’t used it, it works like this: enter text or web links in any of 103 supported languages and you get a rough translation seconds later in any of the others. The app on your phone will transcribe what you say and then speak it back, translated (32 languages supported); it can replace the text of a foreign language sign or menu wherever you point the camera. No explanation is needed of how cool that is (and it’s free).

Globally, half a billion people use Google Translate each month, mostly those who don’t speak English (which is 80% of people) but who want to understand the internet (which is 50% Англиски). “Most of our growth, and actually most of our traffic, comes from developing or emerging markets such as Brazil, Индонезија, Индија, Тајланд,” says Barak Turovsky, head of product management and user experience at Google Translate. It’s surprisingly popular for dating, премногу, he adds. “Things like ‘I love you’ and ‘You have beautiful eyes’, that’s very prevalent.”

The software has always used a form of statistical machine learning: scouring the internet for already translated text – UN declarations, EU documents – and mapping the likelihood of certain words and phrases corresponding to one another. The more data it gathers, the better it gets, but the improvement levelled off a couple of years ago. наскоро, Turovsky says, they will deploy new deep learning algorithms, which will produce much more fluent translations.

И покрај тоа, there are limits, and some seem fundamental when you talk to a human translator and realise how subtle their work is. Ros Schwartz и Anne de Freyman volunteer for this task. Both are professional French/English translators, and I need two because, in order to judge how good the translation is without being fluent in both languages, we need to translate twice – once out of English into French, once back again. Google Translate keeps no memory of the original and can do the same thing.

I choose a short passage of distinctive but not especially wild or ambiguous prose from the beginning of Herzog by Saul Bellow. Translators normally require context, so I tell Schwartz and De Freyman that it comes from a famous mid-century American novel.

Within a few days, Schwartz and De Freyman return a very smooth facsimile of the original text. Here and there some nuances have not survived, but the passage remains a pleasure to read, and the main meanings come across exactly.

Google Translate takes only a few seconds, and the result is both impressive and inadequate, weirdly good in places, in others weirdly bad – turning “he” into “it” and concocting the idea that Herzog is in love. Miraculously, it keeps “cracked” as a description of the hero. French has no word that combines the sense of “broken” and “mad” that cracked coveys in English, so De Freyman makes it “cinglé”, which comes back from Schwartz as “crazy”.

“Google Translate would look at statistical probability and say, what does ‘cracked’ mean?” Turovsky explains. “And statistically, it will try to decide whether it means ‘cracked’ or ‘crazy’ or whatever. дека, for a machine, is a non-trivial task.” Nor is it simple for a human, even though we find it easy. You’d have to ask whether Bellow could have meant that Herzog was “cracked” as in physically fractured. Then you’d have to assume not, because human bodies don’t generally do that. So you’d wonder what he did mean and assume instead, if you were not already familiar with the usage, that he must mean “crazy”, because you understand the rest of what you’ve read. But to do all this, wouldn’t Google Translate have to be pretty much conscious, I ask? Turovsky laughs. “I don’t think I’m qualified to answer that question.”

Пресуда Some bullseyes and howlers from Google Translate, while Schwartz and De Freyman are fluent and exact.

guardian.co.uk © Гардијан Вести & Медиа Limited 2010

Поврзани написи