Agham Deepmind

Ang Bagong Ai ng Google Ay Isang Master ng Mga Laro, ngunit Paano Ito Ihinahambing sa Pananaw ng Tao? | Makabagong

Para sa mga tao, ang chess ay maaaring tumagal ng isang habang buhay upang makabisado. Ngunit bago ang Google DeepMind artipisyal na katalinuhan Ang programa, ang AlphaZero, ay maaaring magturo sa sarili upang lupigin ang board sa loob ng ilang oras.

Pagbubuo sa dating tagumpay sa AlphaGo suite — isang serye ng mga programa sa computer dinisenyo upang i-play ang Chinese board game na Go — Ipinagmamalaki ng Google na ang bagong AlphaZero ay nakakamit ang isang antas ng higit sa tao pagganap sa hindi lamang isang board game, ngunit tatlo: Go, chess, at shogi (mahalagang, Japanese chess). Ang pangkat ng mga computer scientist at inhinyero, pinangunahan ng Google David Silver , iniulat mga natuklasan nito kamakailan lamang sa journal Agham .

Bago ito, sa pag-aaral ng makina, makakakuha ka ng isang machine na eksaktong gawin ang nais mo — ngunit ang bagay lamang na iyon, sabi Ayanna Howard , isang dalubhasa sa interactive computing at artipisyal na intelihensiya sa Georgia Institute of Technology na hindi lumahok sa pagsasaliksik. Ngunit ipinapakita ng AlphaZero na maaari kang magkaroon ng isang algorithm na hindi gaanong [tukoy], at maaari itong matuto sa loob ng ilang mga parameter.





saan nagmula ang ouija board

Ang matalino na programa ng AlphaZero ay tiyak na napapabago sa paglalaro para sa pantao at makina, ngunit matagal nang itinakda ng Google ang mga paningin sa isang bagay na mas malaki: katalinuhan sa engineering.

Maingat ang mga mananaliksik na huwag maangkin na ang AlphaZero ay nasa gilid ng pangingibabaw ng mundo (ang iba ay naging medyo mabilis na tumalon ang baril ). Gayunpaman, ang Silver at ang natitirang pangkat ng DeepMind ay umaasa na makikita nila balang araw makita ang isang katulad na sistema na inilapat sa disenyo ng droga o materyal na agham.



Kaya't bakit napakahanga ng AlphaZero?

Matagal nang iginagalang ang gameplay bilang isang pamantayan ng ginto sa pagsasaliksik ng artipisyal na katalinuhan. Ang mga nakabalangkas, interactive na mga laro ay pinapasimple ng mga sitwasyon sa totoong mundo: Ang mga mahirap na desisyon ay dapat gawin; ang mga panalo at pagkatalo ay nagtutulak sa pusta; at hula, kritikal na pag-iisip, at diskarte ay susi.

Ang pag-encode ng ganitong uri ng kasanayan ay nakakalito. Ang mga mas matatandang larong AI-kasama ang mga unang prototype ng orihinal na AlphaGo-ay tradisyonal na na-pump na puno ng mga code at data upang gayahin ang karanasang karaniwang kinukuha sa loob ng maraming taon ng natural, pantao gameplay (mahalagang, isang pasibo, basurang kaalaman na nagmula sa programmer). Kasama si AlphaGo Zero (ang pinakabagong bersyon ng AlphaGo), at ngayon AlphaZero, binigyan ng mga mananaliksik ang programa ng isang input lamang: ang mga patakaran ng pinag-uusapang laro. Pagkatapos, ang sistema ay bumagsak at aktibo natutunan ang mga trick ng kalakal mismo.



Punta ka na

Ang AlphaZero ay batay sa AlphaGo Zero, bahagi ng AlphaGo suite na idinisenyo upang i-play ang board game na Go na larawan, sa larawan sa itaas. Ang mga maagang pag-ulit ng orihinal na programa ay pinakain ng data mula sa mga larong pantao laban sa tao; mga susunod na bersyon ay nakikibahagi sa sariling pagtuturo, kung saan ang software ay naglaro ng mga laro laban sa sarili nito upang malaman ang sarili nitong diskarte.(Chad Miller / Flickr / CC BY-SA 2.0)

bituin ng david sa isang bilog

Ang diskarteng ito, na tinawag na pag-aaral ng pampalakas na self-play, ay eksaktong eksakto kung ano ang tunog nito: Upang sanayin para sa mga malalaking liga, ang AlphaZero ay naglaro mismo sa pag-ulit pagkatapos ng pag-ulit, na kinikilala ang mga kasanayan nito sa pamamagitan ng pagsubok at error. At nagbunga ang pamamaraang malupit. Hindi tulad ng AlphaGo Zero, ang AlphaZero ay hindi lamang naglalaro ng Go: Maaari nitong talunin ang pinakamahusay na mga AI sa negosyo sa chess at shogi, din. Ang proseso ng pag-aaral ay kahanga-hanga din, na nangangailangan lamang ng dalawa, apat, o 30 oras na self-tutelage upang higit na maisagawa ang mga programa na partikular na iniakma upang makabisado ang shogi, chess, at Go, ayon sa pagkakabanggit. Kapansin-pansin, ang mga may-akda ng pag-aaral ay hindi nag-ulat ng anumang mga pagkakataon na ang AlphaZero ay nakikipag-usap sa isang aktwal na tao, sabi ni Howard. (Maaaring ipagpalagay ng mga mananaliksik na, dahil sa ang mga programang ito ay pare-pareho ang clobber ng kanilang mga katapat na tao, ang gayong pag-match ay walang saysay.)

Nagawa din ng AlphaZero na ma-trunk ang Stockfish (ang unseated AI chess master) at si Elmo (dating dalubhasa sa AI shogi) sa kabila ng pagsusuri ng mas kaunting posibleng mga susunod na paglipat sa bawat pagliko habang nilalaro ang laro. Ngunit dahil ang mga pinag-uusapang algorithm ay likas na magkakaiba, at maaaring ubusin ang iba't ibang lakas, mahirap na ihambing nang direkta ang AlphaZero sa iba pang mga mas matatandang programa, binanggit Joanna Bryson , na nag-aaral ng artipisyal na intelihensya sa University of Bath sa United Kingdom at hindi nag-ambag sa AlphaZero.

Pinapanatili ng Google ang tungkol sa maraming pinong naka-print sa software nito, at ang AlphaZero ay walang kataliwasan. Habang hindi namin alam ang lahat tungkol sa pagkonsumo ng kuryente ng programa, ano ang malinaw na ito: Ang AlphaZero ay dapat na magbalot ng ilang mga seryosong ammo ng computational. Sa mga kaunting oras ng pagsasanay na iyon, pinapanatili ng programa ang sarili nitong abala, na nakikilahok sa sampu o daan-daang libu-libong mga kasanayan sa pagsasanay upang mapunta ang snap sa diskarte ng laro ng board-higit na higit sa kakailanganin ng manlalaro ng tao (o, sa karamihan ng mga kaso, maaaring kahit na magawa) sa paghabol ng kasanayan.

Ang masinsinang pamumuhay na ito ay gumamit din ng 5,000 ng Google pagmamay-ari ng mga yunit ng processor ng pag-aaral ng makina , o TPUs, na kung saan sa pamamagitan ng ilang mga pagtatantya ubusin ang paligid ng 200 watts bawat maliit na tilad . Hindi mahalaga kung paano mo ito hiwain, nangangailangan ang AlphaZero ng mas maraming enerhiya kaysa sa a utak ng tao , na tumatakbo sa mga 20 watts .

Ang ganap na pagkonsumo ng enerhiya ng AlphaZero ay dapat isaalang-alang, dagdag Bin Yu , na nagtatrabaho sa interface ng mga istatistika, pag-aaral ng makina, at artipisyal na intelihensiya sa University of California, Berkeley. Ang AlphaZero ay malakas, ngunit maaaring hindi mahusay na putok para sa usbong-lalo na kapag nagdaragdag sa mga oras ng tao na napunta sa paglikha at pagpapatupad nito.

Masigla na mahal o hindi, gumagawa ng isang splash ang AlphaZero: Karamihan sa mga AI ay dalubhasa sa isang solong gawain, ginagawa ang bagong program na ito — kasama ang triple na banta nito sa paglalaro-lubos na may kakayahang umangkop. Kahanga-hanga na nagamit ng AlphaZero ang parehong arkitektura para sa tatlong magkakaibang mga laro, sabi ni Yu.

Kaya, oo. Ang bagong Ai ng Google ay nagtakda ng isang bagong marka sa maraming paraan. Ito ay mabilis. Malakas ito. Ngunit ginagawa ba itong matalino?

Dito nagsisimulang maging malabo ang mga kahulugan. Ang AlphaZero ay nagawang matuto, simula sa simula nang walang anumang kaalaman sa tao, upang i-play ang bawat isa sa mga larong ito higit sa tao antas, sinabi ng DeepMind's Silver sa isang pahayag sa press.

Gumagamit ang google ng ___________ upang i-mow ang kanilang mga bukirin malapit sa view ng bundok hq.

Kahit na ang kadalubhasaan sa board game ay nangangailangan ng katalinuhan sa pag-iisip, lahat ng mga proxy para sa totoong mundo ay may kanilang mga limitasyon. Sa kasalukuyang pag-ulit nito, ang AlphaZero ay nagpapatalo sa pamamagitan ng panalong mga larong idinisenyo ng tao — na maaaring hindi makagarantiya ng potensyal na nakakaalarma na label ng superhuman. Dagdag pa, kung nagulat sa isang bagong hanay ng mga panuntunan sa kalagitnaan ng laro, ang AlphaZero ay maaaring maging flummoxed. Ang tunay na utak ng tao, sa kabilang banda, ay maaaring mag-imbak ng higit sa tatlong mga board game sa repertoire nito.

Ano pa, ihinahambing ang baseline ng AlphaZero sa a tabula rasa (blangkong slate) - tulad ng ginagawa ng mga mananaliksik - ay isang kahabaan, sabi ni Bryson. Pinapainom pa rin ito ng mga programmer ng isang mahalagang piraso ng kaalaman ng tao: ang mga patakaran ng larong malapit na nitong i-play. Mayroon itong mas maliliit na upang magpatuloy kaysa sa anumang mayroon bago, idinagdag ni Bryson, ngunit ang pinaka-pangunahing bagay ay, binibigyan pa rin ng mga panuntunan. Ang mga iyon ay tahasang.

At ang mga pesky na patakaran na iyon ay maaaring maging isang makabuluhang saklay. Kahit na natutunan ng mga programang ito kung paano gumanap, kailangan nila ng mga patakaran sa kalsada, sabi ni Howard. Ang mundo ay puno ng mga gawain na walang mga patakarang ito.

Pagdating ng tulak, ang AlphaZero ay isang pag-upgrade ng isang malakas na programa — paliwanag ng AlphaGo Zero JoAnn Paul , na nag-aaral ng artipisyal na katalinuhan at pangarap na computational sa Virginia Polytechnic Institute at State University at hindi kasangkot sa bagong pagsasaliksik. Gumagamit ang AlphaZero ng marami sa parehong mga bloke ng gusali at algorithm tulad ng AlphaGo Zero, at bumubuo pa lamang ng isang subset ng totoong mga matalinong. Akala ko ang bagong pag-unlad na ito ay mas evolutionary kaysa sa rebolusyonaryo, dagdag niya. Wala sa mga algorithm na ito ang makakaya lumikha . Ang intelihensiya ay tungkol din sa pagkukuwento. Iniisip ang mga bagay na wala pa. Hindi namin iniisip ang mga term na iyon sa mga computer.

Bahagi ng problema ay, wala pa ring pinagkasunduan sa isang tunay na kahulugan ng katalinuhan, sabi ni Yu-at hindi lamang sa domain ng teknolohiya. Hindi pa rin malinaw kung paano namin sinasanay ang mga kritikal na pag-iisip na nilalang, o kung paano namin ginagamit ang walang malay na utak, idinagdag niya.

Sa puntong ito, maraming mga mananaliksik ang naniniwala na may posibilidad maraming uri ng katalinuhan . At ang pag-tap sa isang malayo mula sa ginagarantiyahan ang mga sangkap para sa iba pa. Halimbawa, ang ilan sa mga pinakamatalinong tao doon ay kakila-kilabot sa chess.

Sa mga limitasyong ito, ang pangitain ni Yu sa hinaharap ng artipisyal na katalinuhan sa mga tao at machine sa isang uri ng coevolution. Ang mga makina ay tiyak na magpapatuloy na magaling sa ilang mga gawain, paliwanag niya, ngunit ang pag-input at pangangasiwa ng tao ay maaaring palaging kinakailangan upang mabayaran ang hindi naisip.

Siyempre, walang masasabi kung paano ang mga bagay ay tatag sa arena ng AI. Pansamantala, marami tayong mapag-isipan. 'Ang mga computer na ito ay makapangyarihan, at maaaring gumawa ng ilang bagay na mas mahusay kaysa sa makakaya ng tao,' sabi ni Paul. 'Ngunit nababagsak pa rin iyon sa misteryo ng katalinuhan.'


Ang artikulong ito ay orihinal na na-publish noong BAGO.



^