close

AlphaGo:謎一樣的第37手

2016年12月,美國著名的科普網站,科學新聞(ScienceNew.org)在評選十大新聞中,名列第一的是“AlphaGo戰台中產後護理機構勝李世石”。

“AlphaGo在克服復雜問題上爬過瞭一座陡峭的山峰,在最復雜的智力遊戲中戰勝瞭人類”,在回顧中,科學新聞評價道,“現實世界的復雜程度遠超這些遊戲,但AlphaGo的進步讓大傢看到瞭電腦解決復雜問題的曙光。”

是的,由於AlphaGo的出現,人類作為一個整體應該意識到,世界不一樣瞭,另一種文明,已經嶄露頭角。

“我代表人類”

時間倒回到2016年3月10日,首爾光化門的四季酒店,這裡正在進行圍棋“人機大戰”第二局。在9日進行的第一局比賽中,谷歌的程序AlphaGo擊敗瞭李世石,取得瞭歷史性的突破。在第二局的比賽中,AlphaGo下出的第37手,一個簡單的肩沖,又讓李世石進入瞭難局。

觀戰室裡還有一名職業圍棋選手,他是三屆歐洲圍棋冠軍樊麾(FanHui)。一開始,第37手也令他感到困惑。但他和AlphaGo很熟悉,有五個月時間,樊麾與這臺機器進行過成百上千局對弈。樊麾經常輸給AlphaGo,但他也漸漸比任何人都明白它。在樊麾眼裡,那一步肩沖不像是人類會下的一步棋。思索瞭十秒後,樊麾才恍然大悟。“這步太漂亮瞭,”他又重復瞭一遍,“太漂亮瞭。”

日後這一手不斷被職業棋手所模仿,包括世界排名第一的柯潔,棋迷們也將這手稱為“阿狗流”,與圍棋戰法中著名的“秀策流”、“中國流”並列。在李世石眼中,37手的阿狗流,表現出瞭圍棋棋手所說的“直覺”——一種讓它能以像人類一樣的方式,甚至超越人類的方式下出優美棋局的能力。

在決定與谷歌的AlphaGo對決前,李世石對他的對手幾乎一無所知,雖然AlphaGo已經以5:0戰勝瞭歐洲冠軍樊麾,但五盤棋譜尚未公佈,李世石並不知道AlphaGo有多厲害,甚至沒過問獎金一事。直到簽完保密合同後才知道,獎金為100萬美元。李世石說,“這個比賽本身的意義,比獎金大得多。這是因為,我代表人類同計算機對戰。”

人類的代表李世石,在第37手面前陷入沉默。一分鐘過去,又一分鐘過去——整整15分鐘過去瞭,最終,李世石拿起瞭一枚棋子放在瞭棋盤上,在對方肩沖的黑子上貼瞭一手,事後證明,這一手是本局的敗招,4小時20分鐘後,李世石選擇認輸。

第一滴血台中月子中心餐點

谷歌雖然是一個美國公司,但AlphaGo的創造者是兩個英國人,大衛·席爾瓦(DavidSilver)和戴米斯·哈薩比斯(DemisHassabis),他們是劍橋同學,專業都是計算神經科學。1998年畢業後,兩人合開瞭一傢電子遊戲公司。

哈薩比斯經常和一名同事下圍棋,席爾瓦在他的影響下也台中坐月子中心價格開始自學圍棋。他們還加入瞭當地圍棋俱樂部,和二三段棋手對弈,這是圍棋中非常低的水平,兩個高智商的傢夥並不滿足於此。他們忍不住思考,為什麼電腦可以打敗西洋跳棋、國際象棋的選手,卻從未破解圍棋。

DeepMind創始人戴密斯·哈薩比

對人工智能來說,圍棋遊戲的難度在於,決策空間實在太大。決策(DecisionMaking)是人工智能的關鍵要素,使得機器能夠在人類的世界中發揮作用。在圍棋以及任何遊戲中,一次決策往往使得遊戲更新到一個新局面,於是影響到接下來的決策,一直影響到最終遊戲的勝負。人工智能的關鍵就是在決策空間中搜索達到最大效益的路徑,最終體現在當前決策中。圍棋棋盤上棋子可能的組合方式的數量就有10的170次方之多,超過宇宙原子總數。在近乎無窮的決策空間中,去暴力搜索出當前棋盤的下一步最優定子是絕對不可能的事情。

2010年,哈薩比斯在倫敦成立瞭一個名為DeepMind的人工智能公司,席爾瓦隨後而來,在這裡他們開始瞭真正的人工智能之旅。這傢公司之後又被谷歌公司收購,這也解決瞭他們的資金問題。

在倫敦國王十字車站附近的DeepMind辦公室中,這支團隊將3000萬步人類下出的圍棋步法輸入到一個深度神經網絡中,這個網絡的硬件和軟件能大致模擬人腦中的神經網。

神經網絡其實很常見,Facebook用它給照片中的人臉加上標簽,谷歌則用它來識別安卓手機收到的語音命令——給它輸入足夠的話語,它就能識別你所說的話。輸入3000萬步圍棋步法,它就能學會下圍棋。在經過五年的進化之後,AlphaGo取得瞭重大突破,成為第一位擊敗職業棋手的程序,而第一滴血,就是觀戰室的樊麾二段。

樊麾樊麾

樊麾是西安人,職業二段,2000年移居法國,隨後成為歐洲最強棋手。2015年9月底,樊麾第一次去Deepmind公司參觀,純粹抱著旅遊的心態。雙方確定瞭比賽時間、比賽方式等等。樊麾發現他們對於人工智能方面可能很擅長,但對於這個比賽要怎麼弄,一點經驗都沒有。最讓他驚訝的是對方詢問:“萬一機器贏瞭,下圍棋的人會不會恨我們?會不會因此傷害到很多人的利益?”

樊麾和AlphaGo的比賽定在瞭2015年10月5日至9日,共5天。比賽是一天兩場,一共10盤。5盤正式的,還有5盤非正式的快棋。正式的比賽樊麾0:5敗,非正式的快棋樊麾2勝3負。2016年1月,哈薩比斯等人在英國《自然》雜志上發文說,在英國圍棋協會見證下,AlphaGo以5:0戰勝歐洲圍棋冠軍、前中國職業棋手樊麾,成為第一個擊敗人類職業棋手的電腦程序。

在圍棋界,職業棋手第一次輸給電腦是個非常令人震驚的“意外事件”,在AlphaGo戰勝樊麾之前,最好的電腦圍棋也要被頂級棋手讓四五子。職業圍棋選手紛紛對這個結果表示震驚,他們不願意接受這個消息,甚至開始懷疑樊麾的水平隻有業餘五段左右。但隨即,AlphaGo團隊向李世石發起瞭挑戰,人類和人工智能的重要對決終於到來。

強人工智能紀元

在與李世石進行的五場比賽中,兩位解說員都稱AlphaGo為“他”,而不是“它”。李世石剛出場時,還向那個看不見摸不著的對手——不知疲倦亦無憂懼的AlphaGo君鞠瞭一個躬。

比賽之前,誰也沒有想到AlphaGo會強到如此地步。世界冠軍常昊預計正常情台中產後護理之家況下李世石是一盤都不會輸,如果AlphaGo贏一盤已經是非常大的突破瞭。在職業圍棋界,99%的人都和常昊做出同樣的預測。隻有一些計算機領域專傢,審慎認為AlphaGo能贏一到兩局,比如李開復。但結果,AlphaGo第一局就贏瞭。圍棋界一片驚呼不說,韓國的媒體甚至將這一局的意義和人類登月相提並論。

Alphago與李世石對決

從第二局開始,形勢已經發生瞭逆轉。在此之前,是AlphaGo挑戰李世石,但在此之後,已經是李世石在挑戰AlphaGo瞭。韓國報紙上開始稱AlphaGo為“阿爾法十段”。在韓國,圍棋九段與中國古代的一品一樣,稱為“入神”,十段差不多就是“神”的意思瞭。

李世石緊接著輸掉瞭第三局,AlphaGo在五局三勝中取得瞭勝利。在後來的新聞發佈會上,李世石坐在哈薩比斯旁邊,因為讓人類失望而道歉:“我本可以拿出更好的成績,帶來更好的結局。”

李世石發言時,一種意料之外的感覺開始啃食哈薩比斯的內心。作為AlphaGo的創造人之一,看著這臺機器實現瞭人們認為其不能實現的成績,他感到驕傲,甚至飄飄然,但他同時也因為自己是人類的一員而感到不甘。他開始希望李世石能夠贏下一局。

第四局下瞭2個小時。李世石這局下得咄咄逼人,對棋盤上的特定區域發起猛攻。但是AlphaGo采取瞭更加豪邁的風格,以著眼整體的方式對整局局勢進行衡量。

AlphaGo已經贏得瞭整場比賽。李世石不再為瞭勝利下棋,而是為瞭人類。他用右手的前兩個手指執起一枚白棋,放在瞭緊挨著棋盤中心的地方。台中產後月子中心這是這局棋的第78手,一步“挖”步,即在兩片大范圍緊密的地區中間插入一棋。在AlphaGo的控制室,運行機器的人們都停下瞭手裡的工作,盯著他們的顯示屏看。在李世石下出那絕妙的第78手前,AlphaGo計算自己的勝算為70%。八步之後,這一數字變得不值一提。李世石的78手被古力稱為“神之一手”,這手棋讓AlphaGo崩潰,讓人類棋手保留瞭最後一絲希望。

五局比賽的最終結果是四比一,AlphaGo也憑借這五局棋一直排在世界第二的位置,威脅著世界第一人,中國棋手柯潔。8月份,DeepMind團隊在波士頓宣佈,AlphaGo已經從李世石對戰的第18個版本進化到瞭V25,現在這個版本可以讓頂尖職業棋手兩子。隨後,中國棋聖聶衛平宣佈柯潔將不會與AlphaGo進行比賽,為職業棋手保全最後一絲顏面。

柯潔

然而,人工智能的大門已經打開,一個新時代,已經到來瞭。“2016年是人工智能走向主流的元年”,微軟亞太研發集團前主席、百度公司總裁張亞勤接受媒體采訪時說。這一年,除瞭AlphaGo與李世石的“人機大戰”,IBM、微軟、Facebook等互聯網巨頭,都投入巨大的人力、財力和精力在人工智能平臺。Facebook創始人紮克伯格甚至預言,“人類基本的聽、說、讀、寫等核心感知力,在未來5-10年,計算機一定能做得比人類自己更好。”

到那時,人們或許才會更真切理解這嘲人機大戰”的意義,也才會更清楚,公元2016年3月10日,AlphaGo下出37手的那一刻,對人類到底意味著什麼。

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow

    fvwm0ysek 發表在 痞客邦 留言(0) 人氣()