作者:邊驛卒
2016-01-28 第272期
機器人闖進了圍棋界,?
《自然》雜志27日發(fā)文,圍棋電腦軟件“AlphaGo”(以下稱“阿爾法圍棋”)打敗了職業(yè)棋手,,震撼了國際棋壇,。這個軟件由谷歌旗下的人工智能(AI)開發(fā)商“DeepMind”所研發(fā),所以這個消息也令人工智能科學家們感到震撼,。
自然雜志封面
這款名為“阿爾法圍棋”的人工智能,,在沒有任何讓子的情況下以5:0完勝歐洲冠軍,職業(yè)圍棋二段樊麾,。
你可能想到了1997年計算機程序“深藍”和國際象棋大師卡斯帕羅夫的世紀之戰(zhàn),。在那次比賽中,,卡斯帕羅夫輸給了這個IBM開發(fā)的計算機程序。這是人工智能歷史上的劃時代事件,。
而這次比賽的意義毫不遜色,。
1997年,,當IBM深藍計算機在象棋上稱霸時,,它使用的是手工編碼的規(guī)則,在搜索時將窮盡所有可能發(fā)生的步法,。Alpha Go從本質(zhì)上則是隨著時間而學習的,,可以識別出可能具有優(yōu)勢的模式,然后模擬出數(shù)量有限的潛在結(jié)果,。
完成這個成就有多難,?
東方的圍棋被認為更加復雜,更加需要棋手難以置信的直覺,。
國際象棋中,,平均每回合有35種可能,一盤棋可以有80回合,;相比之下,,圍棋每回合有250種可能,一盤棋可以長達150回合,。
就博弈的局面來講,,一般認為國際象棋為10的123乘方,而圍棋則有10的360乘方以上,。這導致軟件來不及列舉出所有能贏的方案,,導致不敵職業(yè)棋手。
所以,,在此前的比賽中,,圍棋AI一般和業(yè)余段位的棋手比賽,而且人類選手都會讓子,。但是“阿爾法圍棋”的對手是法國國家圍棋隊教練,、歐洲圍棋冠軍,而且沒有讓子,。
阿爾法圍棋是怎么做到的,?
DeepMind團隊表示,“阿爾法圍棋”的關(guān)鍵在于使用的深度神經(jīng)網(wǎng)絡,。
在這樣的網(wǎng)絡中,,如果你將足夠多的關(guān)于樹木的照片輸入進去,它們就能學會識別出一棵樹,。如果輸入足夠多的對話,,它們就能學會如何進行一段得體的對話,。如果輸入足夠多的圍棋走法,它們就能學會下圍棋,。
實際上,,在“阿爾法圍棋”中有兩種不同的神經(jīng)網(wǎng)絡:“策略網(wǎng)絡”(policy network)和“值網(wǎng)絡”(value network)。
它們的任務在于合作“挑選”出那些比較有前途的棋步,,拋棄明顯的差棋,,從而將計算量控制在計算機可以完成的范圍里,本質(zhì)上和人類棋手所做的一樣,。
“阿爾法圍棋”利用這兩個工具來分析局面,判斷每種下子策略的優(yōu)劣,,就像人類棋手會判斷當前局面以及推斷未來的局面一樣,。這樣“阿爾法圍棋”在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高,。
也有許多專家相信,人類掌握圍棋的秘訣在于模式識別——通過棋子組成的圖形形狀來判斷優(yōu)勢和弱點,,而不是預測幾步棋后的走向。
也正是因為這個原因,,模式識別算法的最新進展有可能會大大改進計算機的表現(xiàn),。新算法利用大型的圖片數(shù)據(jù)庫,,訓練深度卷積神經(jīng)網(wǎng)絡(deep convolutional neural networks)來識別物體和面孔。這一網(wǎng)絡借鑒了人腦的信息處理機制,,與人腦的神經(jīng)結(jié)構(gòu)有相似之處,。
因此,可以預想,,這樣的算法用在圍棋棋局自動評估上,也能發(fā)揮巨大的作用,。
根據(jù)研發(fā)者的介紹,,這種神經(jīng)網(wǎng)絡可以自主學習,而非傳統(tǒng)的對人工智能進行“監(jiān)督訓練”的算法,。
此外,AI很容易通過大量的訓練積累足夠多的經(jīng)驗,。人類或許一年可以下1000局圍棋,,但AI一天就能玩100萬局,,不會疲勞。
所以理論上來講,,只要“阿爾法圍棋”經(jīng)過足夠的訓練,,就可以擊敗所有的人類選手。
李世石
今年3月,,“阿爾法圍棋”將挑戰(zhàn)全球頂級的韓國九段棋手李世石,,獎金是100萬美元。李世石表示:“(人工智能)厲害得讓人吃驚,,聽說一直在進化,,不過我有信心取勝。”
微博網(wǎng)友表達了無奈的釋然:“只要是存在規(guī)則的game,,隨著計算能力的提升和算法的優(yōu)化,,最終人類一定會敗給電腦。 而人類的能力在于面對沒有已知規(guī)則的困局,,能夠創(chuàng)造出路走出泥潭,。”
人工智能一日千里 未來應用:語音識別、自動駕駛
相對于棋盤上的勝負,,人工智能一日千里的進展更加激動人心,。
《自然》雜志將“阿爾法圍棋”的成果歸功于“深度學習”(Deep Learning)。
深度學習是目前人工智能領(lǐng)域中最熱門的科目,,它能完成筆跡識別,面部識別,,駕駛自動汽車,,自然語言處理,識別聲音,,分析生物信息數(shù)據(jù)等非常復雜的任務,。
2006年之后,深度學習實際使用多于三層的神經(jīng)網(wǎng)絡,,即深度神經(jīng)網(wǎng)絡,。這是復雜的非線性模型,擁有復雜的結(jié)構(gòu)和大量的參數(shù),,有非常強的表示能力,,特別適合于復雜的模式識別問題。
這種能力在“阿爾法圍棋”身上就體現(xiàn)的很充分,。另外,,這一能力將能幫助人類在未來揭示豐富的信息,并對未來或未知事件做出更精準的預測。
這些能力也是自動駕駛的汽車,、Siri 等語音識別技術(shù)以及Face.com(Facebook 最近獲得的面部識別軟件)的基礎,,越來越精準的翻譯軟件也歸功于這樣的AI技術(shù)。
谷歌高級工程師也還預測神經(jīng)網(wǎng)絡會在其他科學領(lǐng)域扮演重要工具,,例如在基因行為預測,,藥物,蛋白質(zhì),,新的醫(yī)療方案等,。
果殼網(wǎng)寫下了一段意味深長的評論:“AI一定會進入我們的生活,我們不可能躲開,。這一接觸雖然很可能悄無聲息,,但意義或許不亞于我們第一次接觸外星生命。”
人工智能飛躍史
1950年,,計算機科學先驅(qū)阿蘭·圖靈預測到2000年計算機就可以思考:擁有與人類同等水平的創(chuàng)造力,、解決問題的能力、個性和適應性行為,。他提出了一種判斷機器能否進行思考的測試:圖靈測試,。
1956年,在達特茅斯會議上,,一些研究者提出創(chuàng)造一個人工大腦,,人工智能(AI)領(lǐng)域終于誕生。
在1980年代,,“專家系統(tǒng)”的概念被計算機公司廣泛應用,,這是對于人工智能山野探索的開端。
1989年,,卡內(nèi)基梅隆大學研發(fā)了名為“Deep Thought”的專家系統(tǒng),,能夠像大師一樣下象棋。
1997年,,IBM的計算機深藍第一次擊敗了國際象棋大師卡斯帕羅夫,。2006年,人類最后一次打敗頂尖的國際象棋AI,。
2005年,斯坦福大學延至的機器人贏得了美國Darpa大挑戰(zhàn),,在這個美國國防高級研究計劃局組織的自動駕駛汽車挑戰(zhàn)中,,它在荒漠賽道中行駛了131英里。
2011年,,Watson 戰(zhàn)勝了電視智力競賽Jeopardy 的冠軍,。