本篇文章3367字,讀完約8分鐘

ketqua net s? k?t qu?【科技在線】

在韓國(guó)圍棋界,獲得多項(xiàng)世界冠軍的職業(yè)九段李世石在與谷歌電腦alphago的人機(jī)大戰(zhàn)中,3連敗后,白手起家挽回一局。

大眾把這場(chǎng)圍棋人機(jī)大戰(zhàn)看得太重了,看成是人腦和計(jì)算機(jī)的徹底競(jìng)爭(zhēng),其實(shí)不然。 因?yàn)?,進(jìn)行比賽就像下圍棋一樣。 如果人類在圍棋人機(jī)大戰(zhàn)中輸了,人類的大腦也并不會(huì)比不上計(jì)算機(jī)。

事實(shí)上,圍棋變化多端,紛繁復(fù)雜,但理論上并不是無限的。 只不過可以看成是數(shù)學(xué)主題,用計(jì)算機(jī)編程運(yùn)算得到答案。 在假時(shí)間里,人類在國(guó)際象棋這方面遲早很難與計(jì)算機(jī)匹敵。 即使李世石3連敗后,挽回了2局,那又如何呢? 在圍棋方面,人類遲早比不上人工智能。

圍棋人工智能的第一代算法采用窮舉法,計(jì)算所有的棋步,選擇必勝的棋步。 但是圍棋的一些變化太多了,一時(shí)半會(huì)兒不會(huì)。

第二代算法是在抽樣判斷中選擇勝率高的算法,大幅削減運(yùn)算量,使得人工智能終于能夠與業(yè)余圍棋選手競(jìng)爭(zhēng)。

Googlealphago是第三代算法,利用人工智能的自我學(xué)習(xí)能力飛躍性地提高了自己的象棋實(shí)力。 看起來輾壓世界職業(yè)高手的阿爾法·戈在第四局中遭到了冷遇,有什么問題呢?

阿爾法go的算法有問題。 第三代算法的問題實(shí)際上也是第二代算法的問題。 因?yàn)榈谌惴ɑ诘诙惴ǖ牟蓸优袛噙M(jìn)行自我學(xué)習(xí)。 即使alpha go能和自己下國(guó)際象棋提高棋藝水平,它也能這樣下國(guó)際象棋是基于抽樣判斷的。

抽樣判斷有弱點(diǎn)。 勝率高的下法未必是正確的下法,只不過是統(tǒng)計(jì)。 有些冷門的方法,反而可能會(huì)贏得驚人的勝利。

阿爾法go下臭棋時(shí),思考速度特別快恰恰證明了此時(shí)樣本很少。 李世石78手是奇招,下這一手的棋手很少,阿爾法go按照程序運(yùn)算后認(rèn)為李世石的勝算不高,反應(yīng)特別快。 這是個(gè)大錯(cuò)誤。

在圍棋程序下象棋的棋手,感覺在計(jì)算機(jī)處于劣勢(shì)時(shí)的應(yīng)對(duì)非?;靵y。 不僅是阿爾法go,zen也是。 電腦處于勝率低的狀況,已經(jīng)很難考慮了。 根據(jù)樣本統(tǒng)計(jì),在勝率低的情況下當(dāng)然輸贏多,逆轉(zhuǎn)取勝的樣本很難找。 勝率越低的情況下,alpha go的想法越混亂。 極端的情況下,找到的樣本中勝率低的一方已經(jīng)認(rèn)輸,可能沒有之后的棋譜。 我不擅長(zhǎng)阿爾法戈該怎么辦。

阿爾法GO的失敗也是人類的失敗,畢竟程序也是人類編的。 另一方面,由于算法基于人類樣本,導(dǎo)致了alpha go的失敗。 如果李世石手上有對(duì)應(yīng)的樣本,alphago也不會(huì)這樣評(píng)價(jià)錯(cuò)誤。

alpha go的父親哈比斯說:“alpha go的訓(xùn)練并不是特別要和李世石比較,而是讓普通棋手像比賽前一樣,只做日常的準(zhǔn)備。 阿爾法go準(zhǔn)備就是從網(wǎng)上下載很多業(yè)余棋手的棋譜研究,沒有什么特別之處。 之后,和某棋手進(jìn)行比較準(zhǔn)備也不容易,我們至少需要幾百萬到幾億的棋譜,只有整體提供給alpha go,才能接收它進(jìn)行深度學(xué)習(xí)。

哈比斯的話也證實(shí)了圍棋人工智能第二代第三代的死穴,也就是樣本判斷的問題。 李世石逆轉(zhuǎn)取勝的奇招,能找到的樣本很少。 阿爾法go顯然有很多職業(yè)棋手的質(zhì)量很高,需要參考非常全面的對(duì)局,這是行不通的。

圍棋難題還得處理

第四局,李世石交手反而能贏,這很不可思議。 因?yàn)閵W賽羅有先手的特點(diǎn),勝率很高。

人機(jī)大戰(zhàn)引出了長(zhǎng)期困擾圍棋界的問題。 是圍棋規(guī)則中關(guān)于貼目的的規(guī)定。 不下圍棋的人可能不知道,但圍棋迷很清楚。 國(guó)際象棋棋手是先手,有其特點(diǎn),所以為了公平起見,黑棋棋手需要盯著白棋棋。

1949年(昭和24年)日本棋院圍棋規(guī)則規(guī)定,黑方貼4目半。 從1955年第三期王座戰(zhàn)開始,黑棋貼目從4目半變更為5目半。 但據(jù)統(tǒng)計(jì),黑方仍占特點(diǎn)。 截止到2001年底,在日本棋院近5年進(jìn)行的1.5萬局官方公開對(duì)局中,(黑膠5目半的情況下)黑膠勝率達(dá)到51.86% )。 雖然黑白勝率差別不大,但在激烈的圍棋比賽中,這種差別是致命的。

在國(guó)際比賽中實(shí)力明顯優(yōu)異的韓國(guó),在很多比賽中都轉(zhuǎn)入了第6輪半制。 中國(guó)也從2002年春天開始,全部改貼3/3/4子(相當(dāng)于7目半)。 日本棋院對(duì)50年來實(shí)行的黑白棋5目半的制度也進(jìn)行了改革,使一部分比賽接近中韓,從2003年開始使用了所有黑白棋6目半的規(guī)則。

截止到年底,中國(guó)大陸主辦的第3局和第3/4局(相當(dāng)于7局半)世界錦標(biāo)賽共有380局對(duì)局,其中小黑贏了200局,勝率為52.6% ( )前3局春蘭杯相當(dāng)于5局半,未計(jì)入)。 另一方面,在臺(tái)灣舉行的應(yīng)氏杯( 8點(diǎn)貼,相當(dāng)于7目半)為黑勝100局、白勝97局。 據(jù)此,即使貼上7目半,黑色似乎也有點(diǎn)特色。

那么,到底黑側(cè)對(duì)白側(cè)盯上多少才是公平的呢? 現(xiàn)在,這個(gè)數(shù)值是根據(jù)很多人的對(duì)局統(tǒng)計(jì)計(jì)算出來的,在數(shù)學(xué)上并不是完美的答案。

說不定是阿爾法go讓金庸武俠小說的周伯通和郭靖左右勢(shì)均力敵,用左手和右手下棋,根據(jù)大量?jī)?nèi)戰(zhàn)結(jié)果統(tǒng)計(jì)了粘貼目的的合理數(shù)值? o,這也不是完美的解答。

如前所述,alpha go之所以能自己下棋,還是根據(jù)與人類對(duì)局的抽樣來判斷的。 這和直接統(tǒng)計(jì)人類對(duì)局沒有區(qū)別。

完美的解答,還是要回到開頭,用原始的窮舉法,找到下圍棋的優(yōu)秀解。 這樣,就可以徹底確定粘貼目的的數(shù)值。 只是,運(yùn)算量這么大的工程,不知道什么時(shí)候才能實(shí)現(xiàn)。

想象一下圍棋被徹底解讀后的樣子。 某國(guó)際圍棋大賽開始引起全世界的關(guān)注,手持黑手的棋手獲得了第一個(gè)孩子。 裁判馬上宣布,手持白手的棋手不必再干了。 比賽結(jié)果已經(jīng)確定,很明顯是誰贏了還是打成平局。 觀眾發(fā)出了歡呼聲。

阿爾法go打麻將是如何兼具桌游設(shè)計(jì)的隨機(jī)性的?

雖然圍棋人機(jī)大戰(zhàn)人類輸了,但一些網(wǎng)民表示,人類的智慧中還保護(hù)著中國(guó)麻將。 (詳情請(qǐng)參閱鈦媒體的文案“贏了圍棋也沒什么大不了的。 阿爾法狗敢挑戰(zhàn)麻將嗎? |是鈦?zhàn)龅?。 但是,中搜網(wǎng)絡(luò)創(chuàng)始人、北京圍棋業(yè)余比賽陳沛對(duì)采訪他的記者說:“如果是麻將,人類會(huì)輸?shù)酶鼞K吧! 麻將一共那么多,很容易計(jì)算。

但是陳沛的話其實(shí)是錯(cuò)的。 如果有一棵傻大樹,他麻將打得不怎么樣,但是他運(yùn)氣好,快要爆炸了,一開局就自己摸13嗎? 阿爾法go有破解度高的招數(shù)嗎?

麻將之類的棋牌游戲是隨機(jī)抽牌的,所以有運(yùn)氣的因素。

一位網(wǎng)友對(duì)戲言說,如果麻將時(shí)三人聯(lián)手對(duì)付阿爾法go,阿爾法go會(huì)輸?shù)煤軕K。 這是作弊,但也有大問題。 多人游戲中,局面非常多且復(fù)雜,人工智能該如何應(yīng)對(duì)呢?

例如,3只身體在和alpha go打麻將,沒有人作弊,但是甲玩家技術(shù)不行,錯(cuò)了牌,乙玩家受益。 這是阿爾法go無法控制的。

本來,alpha go學(xué)習(xí)麻將也必須根據(jù)與眾多人類對(duì)局的樣本來判斷。 阿爾法go只知道什么樣的打法勝率高,但是麻將沒有必勝的打法。

圍棋棋子擺在棋盤上是有目共睹的。 你聽說過倒扣將棋棋子玩的黑暗將棋嗎? 陸戰(zhàn)隊(duì)員也有暗手的游戲。 麻將實(shí)際上也類似于國(guó)際象棋的游戲。 卡片加蓋玩。 建造的棋牌是什么,還得推測(cè)。 阿爾法go最多通過計(jì)算來判斷,被覆蓋的棋牌是什么的可能性很高,無法通過正確的推論得到結(jié)果。 也就是說,阿爾法go只有永遠(yuǎn)獲勝才能進(jìn)化。

圍棋沒有運(yùn)氣的要素,麻將有運(yùn)氣的要素,哪一個(gè)都有吸引力。

從廣義上說,圍棋、麻將這些棋牌游戲,其實(shí)屬于桌游的范疇。 圍棋英語(yǔ)是go,阿爾法GO GO就是從那里來的。 圍棋進(jìn)入bgg桌游排行榜前100名,中國(guó)國(guó)際象棋卡牌類游戲排名很高。

在民間,象棋和圍棋這種沒有運(yùn)氣要素的棋牌(桌游)正在沒落。 現(xiàn)在關(guān)注圍棋人機(jī)大戰(zhàn)的網(wǎng)民是圍棋迷嗎?

因?yàn)榇蟊娤胍氖歉鼕蕵返摹?像象棋和圍棋這樣沒有運(yùn)氣因素的,游戲水平比較穩(wěn)定。 他是名人。 普通人不容易贏。 除非你能找到象棋力量正好和你水平差不多的東西,否則玩起來沒意思。 強(qiáng)的東西太強(qiáng)了,太弱了。

因此,新興桌游的設(shè)計(jì)宗旨必須保證隨機(jī)性,具有運(yùn)氣因素。 像萬智牌、游戲王、爐石傳說那樣隨機(jī)抽牌,像國(guó)際象棋和大富翁一樣擲骰子,都會(huì)產(chǎn)生隨機(jī)數(shù),帶來運(yùn)氣成分。 如果有運(yùn)氣的要素,所有玩家發(fā)揮的水平就不會(huì)太大不同,可以聚在一起開心地玩。

另一方面,沒有運(yùn)氣因素的棋牌(桌游),理論上一定會(huì)存在優(yōu)秀的解,所以一旦出現(xiàn)優(yōu)秀的解,一定會(huì)引起興趣。 圍棋變化太多,至今也沒有優(yōu)秀的解,所以一直活到了今天。 現(xiàn)在,阿爾法go并沒有完全打敗李世石,圍棋的生命力看起來還很頑強(qiáng)。

標(biāo)題:“AlphaGo首出Bug,圍棋算法的死穴在哪兒?”

地址:http://xiucaiguan.cn//xwdt/40276.html