給人類支三招對付AlphaGo

2021-07-11 06:11:25 字數 1446 閱讀 7681

以下是根據鄙人對阿法狗的工作原理理解,想出的可以對付alphago的三招,從可行性最低到最高排序。

首先,我知道alphago是有專門演算法來處理征子的,但我還是認為在征子方面,人類可能有一些技巧可以利用。因為征子在圍棋裡是一種很特殊的形狀。通常乙個字落在某點,它的作用力是隨著距離而遞減的。但是一旦出現征子,那麼乙個棋盤上距離離征子很遠的乙個子就可以對征子的結果產生決定性影響。

而alphago的兩個大腦之一的策略網路是使用卷積神經網路技術來學習的,這種技術通常用在影象識別領域,所以alphago在區域性棋形的感覺特別好,它能飛快判斷區域性某個棋形的要點。但是「引徵」這一手的重要性是需要與棋盤很遠遠處的形狀結合判斷的,所以它的策略網路很可能忽略到這一手,或者說對引徵的子價值判斷較低。

另一方面,alphago的第二個大腦,價值網路又是使用蒙特卡洛演算法工作的,我不太清楚alphago如何判斷征子的發生。不過可以考慮這種情況,假設乙個區域性定式會導致征子發生,並且征子結果決定了這個區域性的好壞,那麼蒙特卡洛演算法演算法在這個區域性定式剛開始時是很難判斷清楚這個定式的結果的,因為你很難隨機性的正好走出征子,又能在征子出現後,隨機的產生正確的征子吃子步驟。這就可能導致價值網路漏算某些帶征子的結果。

所以,人可以採取的乙個辦法就是製造征子,然後來一部美妙的「引徵」。我看到有人跟我持類似觀點:

跟電腦下,模仿棋是個好東西啊。首先,我時間節省,讓你alphago去算吧,你算的結果我來用:)其次,因為盤面對稱,所以價值網路判斷的結果,每次都會有幾手顯得價值都很接近,所以alphago會難以取捨,迫使價值網路執行更多計算。

另外,人類棋手知道,破解模仿棋的關鍵在於誰先下在天元附近,並且要使這手棋成為好棋。下在天元附近,一般就會迫使模仿者停止模仿了。對alphago來說,它也許打過一些模仿棋的棋譜,但是很難說alphago知道自己打了乙份模仿棋的棋譜,它只是機械的學習每一步,並且使自己的策略網路能夠調整到「區域性這個形狀,接下來就可以下那裡」的這種狀態。所以,alphago不會知道自己需要設法把局面引向**,迫使對手停止模仿。

模仿棋是一種簡單易行的方法,值得一試。

所謂騙招,就是每一步都走的符合棋理,堂堂正正,最後卻掉入對手布置的陷阱中。職業棋手對局中基本沒有騙招,因為知道騙不了,所以alphago就很難從打譜中學習對付騙招的方法。而騙招每一步棋形又是堂堂正正的,所以,alphago的策略網路肯定能將被騙的下法列入優先的可能下法。這之後就要看alphago的價值網路能否正確的排除被騙的下法了。這就要看蒙特卡洛演算法了,但這是一種看運氣的演算法。

從alohago與李世石第四局的棋譜中,alphago明顯漏算了李世石第78手挖,也可以說李世石的從alphago下了第71手時,就看出挖這個好手,就開始著手醞釀,到78 下出挖,一下子把alphago打矇了。這也看出,alphago在對付騙招上可能有弱點。

這第三招我認為是對付alphago最有效的一招,但也是最難實施的,因為勉強去走騙招肯定是受損的,只有一步步巧妙的引誘對手走入陷阱才行,有時這是可遇不可求的局面。

對付alphago其實就兩個要點,分別攻擊它的兩個大腦:

AI思維 給人類教育的三項啟示

ai思維 給人類教育的三項啟示 by 高煥堂 台灣銘傳大學講師 前言 本文說明了ai思維啟迪了老師們的教育新方向。學校老師們除了人類學生之外,還有機器學生。就如同一位老師除了男學生之外,還有女學生一般。如何讓人類和機器兩種學生之間能夠相輔相成 心心相印,是當今學校老師們的重要課題了。這文章裡,敘述了...

人工智慧將給人類帶來什麼?

隨著人類科技的疾速開展,人工智慧曾經成為將來的一大開展方向,人類曾經進入人工智慧時代。關於人工智慧,我們有印象的就是幾年前的人機圍棋大戰,世界圍棋巨匠大戰人工智慧,最初以失敗告終。人工智慧相比人類有很多優越性,它的運算才能遠超人類,運算才能只是初級人工智慧的才能,隨著人工智慧的不時更新,真正的人工智...

AI與區塊鏈的融合會給人類帶來什麼

譯者注 作者在本文介紹了人工智慧和區塊鏈這兩大熱門技術整合的可能性,以及這兩者整合以後的標準定義是什麼,會遇到哪些挑戰,會帶來什麼好處。以下為譯文 不可否認,人工智慧和區塊鏈促進了創新,在不同行業裡面也都引起了根本性的變化。這兩種技術的技術複雜程度不一樣,商業意義也不一樣,但是如果能將兩者整合在一起...