A. 怎樣用ai進行圍棋訓練

今年對圍棋來說是載入史冊的一年。一月阿法狗初露端倪,毀譽參半。三月震驚世界,一戰驚天人。面對三千年未有之大變局,逃避是沒有絲毫益處的。我們能做的只是努力了解新科技,並且努力使自己適應這些變化。

筆者從小跟父親學習下圍棋。至今筆者仍然記得自己是怎樣被帶入這個坑的。當年年過三十並且依然中二的父親跟我說:「我覺得你學習是學不出來的(我去年買了個表,你哪隻眼睛看出來我學不出來?是不是親生的?)。想想能不能走別的路吧,我覺得你可以努力當運動員(納尼?)。我查了一下,獎金最高的是三個項目(獎金!獎金!)。第一個太貴了,咱們學不了(是啥?),是網球。教練場地咱都花不起那個錢。第二個你也學不了(還有我學不了的?),是拳擊(。。。。。。。。。。。。。。。。。。。)。第三個就是圍棋,你就學這個吧(好吧我就學圍棋吧。等等,好像哪裡不對。那時候沒有網,你從哪查到的獎金排名?套路,都是套路)。」

從那以後就開始學著下,自己看書,看CCTV5的紋枰論道,看一些掛盤講解。開始提高的還比較快,很快父親就下不過我了。可是到了一定程度,就怎麼也提高不了了。看死活題的書,要麼就是太容易沒價值,要麼就是太難,看得一頭霧水。書上沒有的參考圖,自己心中仍然也有很多疑問。布局,作戰方向上沒有老師的指導,終究是很難有突破的。終於到後來就放棄了圍棋,還是老老實實讀書去了。現在想來,如果小時候就有阿法狗給我玩,就算達不到職業水平,也不會僅僅是今天這個水平吧。

小學的時候偶然間接觸到了一個圍棋游戲,從那時開始關注計算機圍棋,距今已有十幾年了。玩過的有名的對戰程序有GNU Go,銀星圍棋,Crazy Stone和Zen。解死活題的程序有橫濱死活題。特別是Zen,從Zen4玩到Zen6,親眼目睹了程序的成長,同時在利用圍棋程序更高效地提高自身水平方面,有一些自己的心得。本文主要目的是針對想努力提高自身圍棋水平的業余愛好者,談一談怎樣利用世界中的「他者」,更好地為自己服務。

Zen6

Zen6是日本工程師開發的計算機對戰軟體。在比較好的個人電腦上運行可以達到弈城8段甚至9段的水平。可以說除了阿法狗之外,目前就數Zen6最強。

雖然Zen6沒有阿法狗強,但是對於一般的愛好者來說,Zen6比阿法狗更合適。首先,他們用的演算法相似,都是神經網路加蒙特卡洛樹搜索。其次,成本上來說阿法狗一般人根本玩不起,Zen6相當親民。最後,阿法狗太強了,對於一般業余愛好者來說,Zen6的實力更適合一些。

B. 人工智慧是如何挑戰下法無窮的圍棋的

你可以想像一下一個很便宜的計算器是如何運算大數字的。對於機器那些全不在話下。
所以人工智慧很強。所謂下法無窮的圍棋的抵擋不住的。

C. 如何看待人工智慧alphago戰勝圍棋九段高手李世石

「人工智慧」一詞最初是在1956 年Dartmouth學會上提出的。從那以後,研究者們發展了眾多理論和原理,人工智慧的概念也隨之擴展。人工智慧(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智慧是計算機科學的一個分支,它企圖了解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智慧從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,可以設想,未來人工智慧帶來的科技產品,將會是人類智慧的「容器」。

人工智慧是對人的意識、思維的信息過程的模擬。人工智慧不是人的智能,但能像人那樣思考、也可能超過人的智能。

D. 什麼樣的人工智慧擊敗了職業圍棋手

由谷歌英國研究團隊開發的計算機系統在圍棋比賽中擊敗了職業棋手。作為一種古老的東方棋類游戲,圍棋強調策略和直覺。過去數十年,圍棋一直是人工智慧專家未能攻克的堡壘。然而,人工智慧正在這一領域取得重要突破。
此前,計算機已在其他多種比賽,例如國際象棋、奧賽羅棋和智力競賽《危險邊緣》中勝過了人類對手。然而,圍棋是一種具有2500多年歷史的古老技藝,其復雜程度遠超國際象棋,因此人類高手此前幾乎不費吹灰之力就能勝過即使最強的計算機系統。本月早些時候,谷歌以外的人工智慧專家已提出這樣的問題,即人工智慧在圍棋領域的突破能否迅速實現。而直到去年,大部分人仍認為,計算機擊敗職業棋手還需要10年時間。
然而,谷歌已經做到了這一點。法國研究者雷米·庫洛姆(Remi Coulom)此前曾開發了全球最強大的人工智慧圍棋程序。他表示:「這一天的到來比我想像中更快。」
谷歌於2014年收購了自稱為「人工智慧領域阿波羅項目」的DeepMind。去年10月,DeepMind的研究團隊在倫敦辦公室里主持了人工智慧與人類選手的較量。DeepMind的這一系統名為AlphaGo,而它的對手是歐洲圍棋冠軍樊麾。在《自然》雜志編輯和英國圍棋協會裁判的監督下,AlphaGo在五番棋比賽中取得了5:0的壓倒性勝利。《自然》雜志編輯坦古伊·喬阿德(Tanguy Chouard)博士在本周二的媒體電話會議上表示:「無論作為研究者還是編輯,這都是我職業生涯中最令人興奮的時刻之一。
自然》雜志發表的一篇論文介紹了DeepMind的系統。這一系統利用了多種技術,其中也包括越來越重要的一種人工智慧技術,即深度學習。利用海量的人類高手棋譜(總步數約達3000萬),DeepMind的研究團隊訓練AlphaGo自主學習圍棋。然而這僅僅只是第一步。從理論上來說,這樣的訓練最多隻能培養出與最優秀人類選手同等棋力的人工智慧。而為了擊敗最優秀的人類選手,研究團隊使這一系統自己與自己對弈。這帶來了新的數據,而這些數據可被用於訓練新的人工智慧系統,最終勝過頂尖高手。
DeepMind負責人德米斯·哈薩比斯(Demis Hassabis)表示:「最重要的一點在於,AlphaGo不僅僅是專家系統,遵循人為設定的規則。實際上,這使用了通用的機器學習技術,能自行探索如何在圍棋比賽中取勝。」
人工智慧的這次勝利並不新鮮。谷歌、Facebook和微軟等互聯網服務早已利用深度學習技術去識別照片和語音,或是理解自然語言。DeepMind的技術結合了深度學習、增強學習,以及其他方法。關於現實世界機器人如何學習日常任務,並對周圍環境做出響應,這指明了未來的方向。哈薩比斯表示:「這非常適合機器人。」
他同時認為,這些方法能加速科學研究,通過在工作中引入人工智慧系統,科學家將可以取得更多成果。「這一系統能處理規模更大的數據集,分析得出結構化信息並提供給人類專家,從而提高效率。系統甚至能向人類專家提供方式方法的建議,協助帶來突破。」
不過目前,圍棋仍是他的關注重點。在關起門來擊敗一名職業選手之後,哈薩比斯及其團隊將目標瞄準了全球頂尖的圍棋選手。3月中旬,AlphaGo將在韓國公開挑戰李世石。李世石擁有的國際比賽冠軍頭銜數排名第二,而過去10年中,李世石有著最高的勝率。哈薩比斯認為,李世石就是「圍棋界的費德勒」。
比國際象棋更難
2014年初,庫洛姆的圍棋軟體Crazystone在日本的巡迴賽中挑戰了依田紀基九段,並取得了勝利。不過,這一勝利的成色不足:Crazystone獲得了四子的讓先。當時,庫洛姆預言,在沒有讓先的情況下,人工智慧擊敗頂尖圍棋高手還需要10年時間。
這一挑戰的難度在於圍棋本身。此前,在合理時間內,任何超級計算機都沒有足夠的處理能力,去預判每種可能的著法會帶來什麼樣的後續結果。1997年,IBM「深藍」擊敗了國際象棋大師卡斯帕羅夫,當時這台超級計算機採用了「暴力計算」的方式。從本質上來看,「深藍」分析了每一步走法可能出現的各種結果。然而,這樣做在圍棋比賽中行不通。在國際象棋比賽中,一個回合可能的走法平均為35種。而圍棋比賽採用了19x19的棋盤,平均每回合走法有250種。哈薩比斯指出,圍棋棋盤上的棋型類型要比宇宙中的原子總數還要多。
利用名為「蒙特卡洛樹搜索」的方法,類似Crazystone的系統能完成更多步的預判。而結合其他一些技術,計算機可以完成對多種可能性的必要分析。這樣的計算機能擊敗一些不錯的圍棋選手,但距離頂尖高手還有很大差距。對真正的高手來說,直覺是很重要的一部分。這些棋手會根據棋盤上棋型來選擇如何行動,而不是精確分析每一種著法可能會帶來的結果。哈薩比斯本人也是圍棋選手,他表示:「良好的棋型看起來就很漂亮。這似乎遵循某種美學。這也是這一游戲數千年來歷久不衰的原因。」
不過,在進入2015年之後,一些人工智慧專家,包括愛丁堡大學、Facebook和DeepMind的研究人員,開始探索利用深度學習技術去解決圍棋的難題。他們設想,深度學習技術能模擬圍棋比賽中必要的人類直覺。哈薩比斯表示:「圍棋有著許多暗示,模式匹配很重要。深度學習可以做得很好。」
自我增強
深度學習的基礎是神經網路。這種由軟硬體構成的網路能模擬人腦中的神經元,其運轉並非依靠「暴力計算」和人工制定的規則。神經網路會分析大量數據,以從事某項任務的「學習」。例如,如果向神經網路輸入足夠多的袋熊照片,那麼它就能識別出袋熊。如果向神經網路輸入足夠多的單詞發音,那麼它就能識別你的語音。如果向神經網路輸入足夠多的圍棋棋譜,那麼它就能學會如何下圍棋。
在DeepMind、愛丁堡大學和Facebook,研究人員希望,通過「觀察」棋盤棋型,神經網路能掌握下圍棋的方法。正如Facebook近期在一篇論文中所說,這一技術的運行情況良好。通過深度學習和蒙特卡洛樹方法的結合,Facebook的系統已經擊敗了一些人類選手。
不過,DeepMind在此基礎上更進一步。在學習了3000萬步人類選手的圍棋下法之後,這一神經網路預測人類選手下一步走法的准確率達到57%,遠高於之前的44%。隨後,哈薩比斯及其團隊對這一神經網路進行了小幅調整,使其與自己對弈,這種做法被稱作增強學習。在這一過程中,神經網路可以了解,什麼樣的走法能帶來最好的結果。

DeepMind研究員大衛·希維爾(David Silver)表示:「通過在神經網路之間進行數百萬局的對弈,AlphaGo學會自己發現新策略,並逐步改進。」
希維爾表示,這使得AlphaGo能勝過其他圍棋軟體,包括Crazystone。隨後,研究人員將結果輸入至另一個神經網路。在首先判斷對手的下一步行動之後,這一神經網路能利用同樣的技巧去預判每一步的結果。這與「深藍」等較老的系統類似,而不同之處在於AlphaGo能在過程中進行學習,並分析更多數據,不再使用暴力計算的方法去判斷所有可能的結果。通過這種方式,AlphaGo不僅能勝過當前的人工智慧系統,還能擊敗人類高手。
專用晶元
與大部分先進的神經網路類似,DeepMind的系統運行在基於GPU(圖形處理晶元)的計算機上。GPU最初的設計目的是游戲和其他圖像應用的圖形渲染,但近年來研究表明,這類晶元也非常適合深度學習技術。哈薩比斯表示,DeepMind的系統在配備多個GPU晶元的單台計算機上有著相當好的表現,但為了挑戰樊麾,研究人員搭建了更龐大的計算機網路,其中包括170塊GPU卡和1200個標准CPU處理器。這一龐大的計算機網路對AlphaGo進行了訓練,並參與了比賽。
哈薩比斯表示,在與李世石的比賽中,AlphaGo將採用同樣的硬體配置。目前,他們正在持續改進這一人工智慧系統。為了准備與李世石的比賽,他們還需要互聯網連接。哈薩比斯表示:「我們正在安裝自己的光纜。」
庫洛姆和其他一些專家指出,與李世石的比賽將更困難。不過,庫洛姆已經下注DeepMind。過去10年中,他一直希望開發出能勝過頂尖圍棋高手的系統,他認為,這一系統現在就在這里。他表示:「我正在購買一些GPU。」
未來之路
AlphaGo的重要性不言而喻。這一技術不僅可以應用於機器人和科學研究,也適合其他許多任務,例如類似Siri的移動語音助手以及金融投資決策。深度學習創業公司Skymind創始人克里斯·尼克爾森(Chris Nicholson)表示:「你可以將其用於任何具有對抗性的問題,例如需要用到策略的各種比賽,以及戰爭和商業交易。」
對一些人來說,這種情況令人擔憂,尤其考慮到DeepMind的系統已經有能力自學圍棋。AlphaGo的學習素材並不來自人類,而是可以通過自行生成數據來自我指導。近幾個月,特斯拉創始人伊隆·馬斯克(Elon Musk)等知名人士曾表示,這樣的人工智慧系統最終將超越人類智力,突破人類的控制。
不過,DeepMind的系統受到了哈薩比斯及其團隊的嚴格控制。AlphaGo被用於最復雜的棋類游戲,但這仍只是一款游戲。實際上,AlphaGo距離真正的人類智慧還有遙遠的距離,遠遠沒有達到超級智能的水平。
華盛頓大學專注於人工智慧的法學教授、科技政策實驗室創始人瑞安·卡洛(Ryan Calo)表示:「這仍是一種高度結構化的情況,並非真正人類水平的理解力。」不過,AlphaGo指明了未來的方向。如果DeepMind的人工智慧系統能理解圍棋,那麼就能理解更多信息。卡洛表示:「宇宙只不過是一場更大的圍棋游戲。」

E. 如何訓練自已的圍棋ai

圍棋吧不是有麗拉嗎,可以訓練一下那個啊。去了解 一下情況吧。

F. 究竟誰搞定了圍棋人工智慧

好多種
但Google應該是最牛的

Google日前宣布其程序AlphaGo擊敗了歐洲圍棋職業選手,這意味著人工智慧技術又或得了極大的突破。計算機目前已經在許多智力游戲比賽上戰勝了人類頂級選手,包括國際象棋、五子棋、黑白棋、拼字游戲等等。而對於有著2500年歷史的東方游戲圍棋——比國際象棋要復雜得多——人類始終能夠保持在和計算機對決中的勝利。不過,Google人工智慧專家表示, 這個壁壘或許很快將要被打破。隨著AlphaGo在沒有任何讓子的情況下以5:0完勝法國圍棋職業二段棋手樊麾,AlphaGo將在三月份對戰韓國九段棋手李世乭。今天早上,《自然》雜志發表了一篇Google DeepMind團隊——程序AlphaGo的創造者撰寫的關於深度學習系統的論文。根據論文描述,在AlphaGo中,DeepMind研究員在程序中錄入了大量職業棋手的棋譜——加起來多達3000萬步——他們用增強學習的方法訓練AI,讓它自己下棋,研習棋譜。不過這只是第一步。理論上,這樣的訓練只能讓這個人工智慧系統無法突破人類的計算。為了獲得更好的成績,研究員隨後讓系統進行自我博弈,計算出比基礎棋譜更多新的打點。也就是說,戰勝人類就要靠這些新的東西。
「這其中最重要的是,AlphaGo不僅記錄著大量的棋譜,還有一系列規則來指導 思考 ,」DeepMind CEO Demis Hassabis說道,「事實上,該程序能夠通過機器學習的方式掌握比賽技巧。」
DeepMind的技術核心結合了「強化學習」及其他人工智慧手段,這種技術能夠用於解決現實機器人執行物理任務和對環境作出回應的技術問題。就是說,要讓機器人變得更「自然」。

G. 如何看待人工智慧圍棋大戰

表面看是人工智慧發展程度的一種測試,而如果是AI互相比賽就沒有什麼意義了,因為圍棋的一種根本屬性是藝術性,並不是競技性,競技性只是商業化的外化表現。如果人類可以學習它的下法和思路還是對提高人類自身水平和改變思維固有定式很有好處,但這需要深層次的學習電腦的思維方式和計算方式。