Omul v Mașină: Can Computers Cook a, Scrie și vopsea mai bună decât noi?

Man v Machine: Can Computers Cook, Write and Paint Better Than Us?

inteligență artificială poate câștiga acum un joc, recunoaște fața, chiar face apel împotriva biletul de parcare. Dar poate face lucruri chiar oameni găsi complicat?


Realizat de Guardian.co.ukAcest articol intitulat “Omul v mașină: poate calculatoare găti, scrie și vopsea mai bine decât noi?” a fost scris de către Leo BENEDICTUS, pentru The Guardian sâmbătă 4 iunie 2016 08.00 UTC

un singur film, pentru mine, a schimbat totul. Este imagini din vechiul joc Atari Izbucni, cel în care glisați o paletă la stânga și la dreapta de-a lungul partea de jos a ecranului, încercând să distrugă cărămizi de viguros o minge în ele. Este posibil să fi citit despre player-ul jocului: un algoritm dezvoltat de DeepMind, britanic compania de inteligență artificială al cărui program AlphaGo, de asemenea, bate unul dintre cei mai mari Go vreodată jucători, Lee Sedol, mai devreme anul asta.

Poate că vă așteptați un calculator pentru a fi bun la jocuri pe calculator? Odată ce ei știu ce să facă, ei cu siguranță o fac mai rapid și mai consistent decât orice om. jucător Breakout DeepMind știa nimic, totuși. Nu a fost programat cu instrucțiuni privind modul în care funcționează jocul; Nici măcar nu a fost spus cum să utilizați controalele de. Tot ce a avut a fost imaginea de pe ecran și comanda pentru a încerca să obțină cât mai multe puncte posibil.

Ceas videoclipul. La început, zbaturi permite picătură mingea în uitare, știind mai bine. În cele din urmă, doar despre mucking, acesta bate mingea înapoi, distruge o cărămidă și devine un punct, așa că recunoaște acest lucru și o face mai des. După două ore de practică ", sau despre 300 jocuri, ea a devenit serios bun, mai bine decât tine sau voi fi vreodată. Apoi, după aproximativ 600 jocuri, lucrurile devin infricosatoare. Algoritmul începe vizează în același loc, peste si peste, în scopul de a se ingroapa prin cărămizi în spațiul din spatele. Odata acolo, ca orice jucător Breakout știe, mingea va sări în jurul pentru un timp, colectarea de puncte gratuite. Este o bună strategie pe care computerul a venit cu pe cont propriu.

"Când cercetătorii noștri au văzut acest lucru, care de fapt le-a șocat,"CEO-ul lui DeepMind, Demis Hassabis, a declarat o audiență la o conferință de tehnologie din Paris. Poti ceas demonstrația, de asemenea, și auzi râsete și aplauze când mașina cifrele strategia vizuini. Computerul a devenit inteligent, un pic ca noi.

"Inteligență artificială" este doar despre cel mai vechi și cel mai exagerat de fraze buzz toate de calcul a lui. Ideea a fost analizată pentru prima dată în mod serios de Alan Turing în Tehnica de calculare și inteligență, the 1950 hârtie în care el a propus ceea ce a devenit cunoscut sub numele de testul Turing: dacă o mașină ar putea convinge printr-o conversație că a fost uman, făcea la fel de mult ca și orice om ar putea să dovedească faptul că a fost de gândire cu adevărat. Dar termenul AI nu a fost utilizat, în general, până 1955, cand matematician american John McCarthy a propus o conferință pentru experți. Acest lucru a avut loc în anul următor, și de atunci câmpul a rulat pe un ciclu de aproximativ două decenii de manie si disperare. (Cercetatorii au chiar un nou termen - "AI iarnă" - pentru a descrie vrăji sale de modă. Anii 1970 și 1990 au fost deosebit de dure.)

Astăzi, există o nouă manie, care are un aspect diferit de celelalte: se potrivește în buzunar. Un telefon poate bate campion mondial de șah, recunosc melodii la radio și imagini ale copiilor tăi, și traduce vocea ta într-o altă limbă. Robotul Nao ilustrat aici cu Yotam Ottolenghi poate merge pe două picioare, vorbi, găsi o minge și chiar dans. (Este un robot, deşi, nu AI: nu se poate proiecta un meniu.)

Auzind despre progresele realizate în AI, nu aveți nevoie de un expert pentru a-ți spun să fii excitat, sau speriat. Tu începe doar pentru a obține sentimentul: inteligenta este aici. În mod clar Google a primit sentimentul, de asemenea, pentru că a cumpărat DeepMind pentru un $ 650m zvonește. În 2013, Facebook a lansat propriul proiect, cu planuri de a dezvolta recunoașterea limbii faciale și naturale pentru site-ul. Dezvoltatorii au început deja să lucreze la chatbots inteligente, pe care utilizatorii Facebook vor putea convoca folosind serviciul său Messenger.

Până acum, calculatoarele nu au fost "inteligente", la toate, sau numai restrâns, astfel încât. Au fost bune la sarcini ușoare, care ne uimi, cum ar fi matematica, dar rău la cele pe care le iau de la sine, care se dovedesc a fi în mod serios greu. Actul de mers pe jos este ceva de roboți moderni invata cum ar fi copii și încă se luptă cu; sarcinile pottering de bază rămân vise îndepărtate. "Un exemplu este ușurința cu care sau aș putea face o ceașcă de ceai în bucătărie altcuiva,"spune Profesorul Alan Winfield, un roboticist la Universitatea din vestul Angliei. "Nu este un robot de pe planeta care ar putea face acest lucru."

Pentru a înțelege de ce ființă umană este atât de dificil, gândiți-vă cum s-ar putea obține un calculator pentru a recunoaște persoanele din fotografii. Fără a AI, trebuie să știi cum o faci tu însuți mai întâi, în scopul de a programa calculatorul. Trebuie să colecteze și să se gândească la toate modelele posibile, culori și forme de fețe, și modul în care se schimbă în lumină și la unghiuri diferite - și trebuie să știi ce este important și ceea ce este doar noroi pe lentila. cu AI, nu trebuie să explice: da doar un munte de date reale la un calculator și lăsați-l să învețe. Cum de ai proiecta software-ul de învățare rămâne o chestiune ezoterice, provincia câțiva oameni de știință de calculator a căutat-după, dar este clar că au ajuns pe un câștigător prin elaborarea unor structuri de prelucrare a datelor, bazate pe structurile slab din creier. (Aceasta se numește "învățare profundă".) În ceea ce privește munții de date reale, bine, asta e ceea ce Google, Facebook, Amazon, Uber și tot restul se întâmplă să fi situată în jurul valorii de.

În această etapă, noi nu știm încă ce folosește de AI-ul se va dovedi cel mai bine. Josh Newlan, un codificator California, care lucrează în Shanghai, sa plictisit de a asculta apeluri conferință fără sfârșit, așa el a construit unele software-ul pentru a asculta pentru el. Acum, de fiecare dată când numele Newlan este menționat, computerul instantaneu îl trimite o transcriere ultima jumătate de minut, așteaptă 15 secunde, apoi redă o înregistrare de el spunând, "Ne pare rău, Nu mi-am dat seama microfonul meu a fost pe mut. "Anul trecut, Josh Browder, un adolescent britanic, a construit un Avocatul artificial gratuit care face apel împotriva biletelor de parcare; el intenționează să construiască un alt pentru a ghida refugiați prin intermediul sistemelor juridice străine. Posibilitățile sunt ... Ei bine, poate un algoritm poate conta posibilitățile.

Așa că va minți mașină de o zi ale noastre? Cercetatorii vorbesc eu sunt precaut, și fac eforturi pentru a sublinia ceea ce mașinile lor nu pot face. Dar am decis să pun la încercare AI: poate planifica o masă precum Ottolenghi? Pot să-l picteze portretul meu? Este tehnologie încă în mod artificial inteligent - sau este începe să fie inteligent, adevărat?

Testul de gătit

Bine, Voi spune că nu este oribil. Oamenii s-au servit pe mine mai rău. Cu toate că, în adevăr numele pe care IBM Chef Watson dă acest fel de mâncare ("Sos de pui Ficat conferă gust") este la fel de apetisant ca ea merita.

Pentru a fi corect Chef Watson, și la propriul tutore pentru weekend chef-cronicar Yotam Ottolenghi, Le-am stabilit destul de o sarcină. Am cerut un fel de mâncare bazat pe patru ingrediente care părea să aparțină nicăieri în apropiere unul de altul: Ficat de pui, iaurt grecesc, wasabi și tequila. Ele ar putea adăuga orice altceva le-a plăcut, dar cei patru au trebuit să fie în vasul finit, pe care le-ar găti și mânca. Bucătar Watson nu a ezitat, instantaneu oferindu-mi două sosuri pentru paste. Ottolenghi a fost mai circumspectă. "Când am primit provocarea am crezut, "Acest lucru nu va funcționa,"Îmi spune el.

M-am gândit la fel. Sau cel puțin am crezut că voi încheia cu mâncarea de două feluri de mâncare care au reușit să fie OK în ciuda ingredientelor acestora, mai degrabă decât din cauza lor. De fapt - și o să mă crezi un ciudat, dar, astfel încât ceea ce - reteta Ottolenghi a fost o revelație: ficat si ceapa si o reducere Tequila, servit cu un măr, ridiche, sfeclă roșie și cicoare slaw, cu wasabi și iaurt sos. Platanul poate face prea mult sens pe hârtie, dar am mâncat un sentiment plateful că fiecare element a aparținut. (Și vinaigrette îngroșat cu iaurt și wasabi în loc de muștar: Serios, incearca.) Ottolenghi îmi spune că rețeta este la doar o scurtă mustăți de publicabil.

Lucrul este, că antena de el si echipa sa de trei zile, a luat pentru a perfecta. Ei au fost capabili să guste și să discute arome, texturi, colorate, temperaturile, într-un mod care Watson nu poate - deși au existat "discuții" despre adăugarea unui mecanism de feedback în viitor, Bucătar-șef inginer de plumb Watson, Florian Pinel, îmi spune. "O reteta este un astfel de lucru complex,,"Ottolenghi spune. "Este dificil pentru mine chiar să înțeleagă modul în care un calculator ar apropia."

Yotam Ottolenghi și feluri de mâncare Chef Watson
Yotam Ottolenghi și feluri de mâncare Chef Watson Fotografie: Jay Brooks pentru Guardian

Watson a fost construit de IBM pentru a câștiga Jeopardy gameshow de televiziune! în 2011. În unele privințe a fost o provocare înșelătoare, deoarece pentru un calculator din partea grea a unui test este înțelegerea întrebărilor, fără să știe răspunsurile; pentru oameni, este invers. Dar, Watson a câștigat, iar tehnologia a început să fie aplicat în altă parte, inclusiv ca bucătar, generând noi rețete bazate pe 10,000 exemple reale preluate din Revista Bon Appetit.

În primul rând software-ul a trebuit să "înghită" aceste rețete, ca echipa Watson a pus. O mulțime de calcul a intrat în înțelegerea a ceea ce au fost ingredientele, modul în care acestea au fost preparate, cât timp au fost fierte pentru, pentru a fi în măsură să explice cum să le folosească în noi feluri de mâncare. (Procesul poate merge în continuare într-o parte. Chiar și acum Chef Watson recomanda un ingredient numit "moluscă", which it helpfully explains is “the sixth full-length album by Ween”.)

A bigger problem was trying to give the machine a sense of taste. “It’s easy enough for a computer to create a novel combination,” Pinel says, “but how can it evaluate one?” Watson was taught to consider each ingredient as a combination of specific flavour compounds – of which there are thousands – and then to combine ingredients that had compounds in common. (This principle, food pairing, is well established among humans.) În cele din urmă, the software generates step-by-step instructions that make sense to a human cook. The emphasis is on surprises rather than practical meal planning. “Chef Watson is really there to inspire you,” Pinel explains. Each recipe comes with the reminder to “use your own creativity and judgment”.

And I need to. The first step is to “toast flat-leaf parsley”, which just isn’t a good idea. I am making, effectively, a slow-cooked spiced pork and beef ragu, including all my four ingredients, yet Watson oddly also includes cucumber and keeps telling me to “season with allspice”, which I refuse to do on principle. La sfarsit, I have a rich sauce with a flavour rather close to the farmyard, but not uneatable. I can’t taste the wasabi or the tequila, which I’m glad about.

Yotam Ottolenghi with Nao robot
Yotam Ottolenghi with Nao robot loaned courtesy of Heber primary school, Londra. Fotografie: Jay Brooks. Styling: Lee Flude

Watson is clever and the task is tough, but I am ready to say that this is no more than a bit of fun for food nerds, until Ottolenghi stops me. “I think the idea of slow-cooking the livers with a bit of meat is great,", spune el. “It intensifies the flavour. Everything will come together. If I had to start afresh with this recipe, obviously the yoghurt doesn’t fit – but I would leave the orange skin there, a few of the spices. I don’t think it’s a very bad recipe. It could work.”

Verdict Watson hides the weirdness of the ingredients, but Ottolenghi makes them sing.

The writing test

Put little Wordsmith next to the fearsome machines of IBM and Google, and it looks as computationally advanced as a pocket calculator. Yet while Watson fumbles through its apprenticeship, Wordsmith is already at work. If you read stock market reports from the Associated Press, or Yahoo’s sports journalism, there is a good chance you’ll think they were written by a person.

Wordsmith is an artificial writer. Developed by a company in North Carolina called Automated Insights, it plucks the most interesting nuggets from a dataset and uses them to structure an article (or email, or product listing). When it comes across really big news, it uses more emotive language. It varies diction and syntax to make its work more readable. Even a clumsy robot chef can have its uses, but writing for human readers must be smooth. Hooked up to a voice-recognition device such as Echo Amazon, Wordsmith can even respond to a spoken human question – about the performance of one’s investments, say – with a thoughtfully spoken answer, announcing what’s interesting first, and leaving out what isn’t interesting at all. If you didn’t know the trick, you’d think Hal 9000 had arrived.

The trick is this: Wordsmith does the part of writing that people don’t realise is easy. Locky Stewart from Automated Insights gives me a tutorial. You write into Wordsmith a sentence such as, “New ABC figures show that the New York Inquirer’s circulation rose 3% in April.” Then you play around. The 3% has come from your data, so you select the word “rose” and write a rule, known as a “branch”, which will change the word “rose” to the phrase “shot up” if the percentage is more than 5%. Then you branch “rose” to become “fell” if the percentage is negative. If the percentage is -5% or lower, “rose” becomes “plummeted”.

Then you feed it synonyms. So “plummeted” can also be “fell sharply by”. “The Inquirer’s circulation” can be “circulation at the Inquirer”. “Shot up” can be “soared” and so on. Then you add more sentences, perhaps about online traffic, or about which days’ print copies sold best, or about comparisons year-on-year. Then you get clever. You tell Wordsmith to put the sentences with the most newsworthy information first, defined perhaps as those that feature the greatest percentage changes. Maybe you add a branch to say that a result is “the best/worst performance among the quality titles”. Hell, you can even teach it some old Fleet Street tricks, so that if circulation plummets the piece begins “Editor Charles Kane is facing fierce criticism as”, but if circulation has “shot up” this becomes “Charles Kane has silenced critics with news that”. Insert “more” or “again” or “continues” if you get the same thing two months in a row.

“The artificial intelligence is actually the human intelligence that is building the network of logic,” Stewart says, “the same network you would use when writing a story. It could have been developed 10 sau 15 ani in urma, in code, but to make it work at this scale has only been possible lately.” Clearly it takes longer to prepare an article on Wordsmith than to write one conventionally, but once you’ve done so, the computer can publish a fresh newspaper circulation story every month, on every newspaper, within seconds of receiving the information. It can publish millions of stories in minutes – or publish only some of them, if the data doesn’t reach a given threshold of newsworthiness. Thus it becomes an automated editor, de asemenea, with adjustable tastes in thoroughness, frequency and hysteria.

For Wordsmith’s task, I suggest football: it’s a field that produces a lot of data and has a readership that wants personalised articles. Guardian football writer Jacob Steinberg volunteers to take on the computer, and I provide a table of facts from the recent Premier League: last season’s league position and this season’s position at Christmas and at the end, goals scored and conceded, top scorer’s name and total, value of summer transfers and a quote from the manager.

Working solely from this data, computer and human must each write a review of the season for a given club. Steinberg chooses Leicester City on the basis that its numbers should contain a story that anyone would see. Wordsmith doesn’t need to choose. It will do all 20.

And in fact both computer and human quickly produce quite similar work:

Leicester City footballer Jamie Vardy

Both Steinberg and Wordsmith deliver dramatic first sentences. Perhaps keen to sound authentic, Automated Insights use some clever tricks to put feeling into the latter’s article, astutely guessing that Leicester were “hoping to finish in the top 10 after a 14th place finish last season”. I look through Wordsmith’s other articles and Southampton, having finished seventh last season, have “eyes on a European spot”, while Manchester City “began the season dreaming of a league title after finishing second”.

Conversely, Steinberg digs more meaningfully into the numbers, showing that Jamie Vardy not only scored 24 goals, but that this was a higher percentage of his team’s goals than was managed by all but two other players. Knowing how Wordsmith works, desigur, one could easily set it up to do the same. In fact looking through it, Steinberg’s entire article could have been created by a skilled Wordsmith programmer – with the exception of one line. “It’s a magical season,” he quotes the Leicester manager as saying, before adding, “justifiably so, given that a summer expenditure of £26.7m on transfers made them the eighth lowest spenders”. That “justifiably so” shows a writer who actually understands what he is writing.

Verdict Steinberg is a much better writer, unless you want 20 data-heavy articles in 10 minute.

The painting test

A laptop wants me to smile. “It’s in a good mood," Simon Colton spune. He knows because he’s the scientist who programmed it. We are in the Science Museum in London, where the Painting Fool, as it is called, is giving a public demonstration. It’s important that I don’t show my teeth, Colton says, because something about the light makes them look green to the Painting Fool.

From my toothless smile the laptop creates a “conception” of what it would like to paint, based on its mood. The mood comes from a “sentiment analysis” of recent Guardian articles, as it happens (on average reading the Guardian is a downer, aparent, apart from the stuff about gardening). Yesterday the Fool was in such a bad mood that it sent someone away unpainted; today it is feeling “positive”.

Next the Fool attempts to paint with a simulated brush and a simulated hand (actually, an image of Colton’s hand) on the screen behind me. It learned to reflect its mood from the work of Dan Ventura, another computer scientist, at Brigham Young University in Utah, who trained a neural network to recognise the emotional attributes of images by sitting thousands of people in front of tens of thousands of paintings and asking them to tag each one with whatever adjectives came to mind. The Fool now knows that bright colours reflect a good mood, and “pencils with tight hatching” create a picture that is “cold”. When it is done, it prints out a page with a typed self-critique. “Overall, this is quite a bright portrait,” it says. “That’s OK, but my style has lowered the level of bright here. So I’m a bit annoyed about that.”

Here along with us, intrigued but too busy at her easel to watch, este Sarah Jane Moon, an artist who exhibits with the Royal Society of Portrait Painters. She doesn’t want to see my teeth, fie. “We paint from life,", spune ea, “and you can’t hold a smile for sitting upon sitting. That’s why all the traditional portraits show quite relaxed features.”

The Painting Fool is a special machine, and even slightly famous, but I can’t deny that Moon is almost all of why I’m excited to be here. The feeling of being painted by a real person, having them look at you and think about you, is exciting and flattering. Sentiment analysis and training data, on the other hand, don’t add up to anything whose view of me I care about, and the finished portraits do not change my mind. Moon’s is a lovely, real thing, which feels straight away like one person seen by another. The Fool’s three efforts have qualities I like, but mostly they look like photographs that have gone through some kind of software filter. Colton insists the Fool is here “to learn to be better” but I look and think: so what?

Painting of Leo Benedictus by Sarah Jane Moon
Leo Benedictus as seen by Sarah Jane Moon…
Painting of Leo Benedictus by the Painting Fool computer
…and as imagined by the Painting Fool laptop. Fotografie: Murray Ballard

Then I think some more. For one thing, it turns out that art is more mechanical than I’d realised. “I try to look at Leo as an abstract set of shapes, forms, colorate, tones,” Moon tells Colton, “to get away from the fact that that’s a nose. Because when you start to do that, you get caught up in what you gândi looks like a nose.”

“What the software does is break it down into colour regions,” Colton says.

"Da, exact,” Moon agrees. “I think that’s what the best painters do. It’s transcribing.” Afterwards she tells me she felt a kind of “kinship” with the software as they worked side by side.

More importantly, I realise that what matters isn’t how the machine paints; it’s how I see. Moon I understand, Cred că. She’s a person and I know how that feels, so I care about her picture. But what does it feel like to be the Painting Fool? Is that what its portraits are trying to tell me?

Verdict Moon’s painting is far richer; the Fool is still learning and has centuries of practice to go.

The translation test

Google Translate was the first piece of proper science fiction to come true, și it’s already a decade old. In many ways it typifies where AI has got to. Useful, sigur; impressive, without question; but still clunky as hell, despite big improvements.

If you haven’t used it, it works like this: enter text or web links in any of 103 supported languages and you get a rough translation seconds later in any of the others. The app on your phone will transcribe what you say and then speak it back, tradus (32 languages supported); it can replace the text of a foreign language sign or menu wherever you point the camera. No explanation is needed of how cool that is (and it’s free).

Globally, half a billion people use Google Translate each month, mostly those who don’t speak English (which is 80% of people) but who want to understand the internet (which is 50% Engleză). “Most of our growth, and actually most of our traffic, comes from developing or emerging markets such as Brazil, Indonezia, India, Tailanda,” says Barak Turovsky, head of product management and user experience at Google Translate. It’s surprisingly popular for dating, de asemenea, he adds. “Things like ‘I love you’ and ‘You have beautiful eyes’, that’s very prevalent.”

The software has always used a form of statistical machine learning: scouring the internet for already translated text – UN declarations, EU documents – and mapping the likelihood of certain words and phrases corresponding to one another. The more data it gathers, the better it gets, but the improvement levelled off a couple of years ago. Soon, Turovsky says, they will deploy new deep learning algorithms, which will produce much more fluent translations.

Chiar și așa, there are limits, and some seem fundamental when you talk to a human translator and realise how subtle their work is. Ros Schwartz și Anne de Freyman volunteer for this task. Both are professional French/English translators, and I need two because, in order to judge how good the translation is without being fluent in both languages, we need to translate twice – once out of English into French, once back again. Google Translate keeps no memory of the original and can do the same thing.

I choose a short passage of distinctive but not especially wild or ambiguous prose from the beginning of Herzog by Saul Bellow. Translators normally require context, so I tell Schwartz and De Freyman that it comes from a famous mid-century American novel.

Within a few days, Schwartz and De Freyman return a very smooth facsimile of the original text. Here and there some nuances have not survived, but the passage remains a pleasure to read, and the main meanings come across exactly.

Google Translate takes only a few seconds, and the result is both impressive and inadequate, weirdly good in places, in others weirdly bad – turning “he” into “it” and concocting the idea that Herzog is in love. Miraculously, it keeps “cracked” as a description of the hero. French has no word that combines the sense of “broken” and “mad” that cracked coveys in English, so De Freyman makes it “cinglé”, which comes back from Schwartz as “crazy”.

“Google Translate would look at statistical probability and say, what does ‘cracked’ mean?” Turovsky explains. “And statistically, it will try to decide whether it means ‘cracked’ or ‘crazy’ or whatever. Acea, for a machine, is a non-trivial task.” Nor is it simple for a human, even though we find it easy. You’d have to ask whether Bellow could have meant that Herzog was “cracked” as in physically fractured. Then you’d have to assume not, because human bodies don’t generally do that. So you’d wonder what he did mean and assume instead, if you were not already familiar with the usage, that he must mean “crazy”, because you understand the rest of what you’ve read. But to do all this, wouldn’t Google Translate have to be pretty much conscious, I ask? Turovsky laughs. “I don’t think I’m qualified to answer that question.”

Verdict Some bullseyes and howlers from Google Translate, while Schwartz and De Freyman are fluent and exact.

guardian.co.uk © Guardian News & Media Limited 2010

Articole pe aceeași temă