close

關於Alphago zero,是的,我來跟風瞭

本文來自公眾號:caoz的夢囈,作者曹政CGF09696

deepmind發佈瞭新的論文,Alphago zero再起波瀾,也再次引起業內的熱議。

這一次的突破是,不再以人類的棋譜作為學習的源素材,而是完全基於自我對局實現瞭棋藝的突飛猛進。

先吐個槽,有人會覺得,各種自媒體炒作這個熱點有點多餘,但我覺得吧,比起某些明星過生日,離婚,劈腿,出櫃,嗑藥等等,去追逐一下科技熱點,讓年輕人覺得,其實搞算法,做研究很酷,難道不是一件好事麼?

古時候,沒有相機,沒有錄音機,沒有電視,沒有廣播,也沒有網絡,誰也不知道名人長啥樣,唱歌好聽不好聽,所以傳播的隻有文字,所以偶像是靠文采的,柳永長啥樣誰知道?但他的詞傳頌出去,小姑娘們愛的不要不要的。

現代傳媒發達瞭,出現瞭靠身體素質的偶像,靠顏值的偶像,靠聲音的偶像,靠表演才藝的偶像,難得出一個柯潔,是靠智力的偶像,還被人說不務正業。現在終於輪到算法和科技成為熱點,讓科研變得很酷很有吸引力,這才是正能量啊。

下面說說這次技擴大機電容器術升級的一些特征和值得關註的點。

第一、不再需要人類的經驗

很可怕的事實,當然,我們說,這是特定領域,因為規則簡單,目標明確,才不需要人類的經驗重低音一定要裝電容嗎和數據。

但其實如果發散一點,我們做個思想實驗。

假設有一個深度學習的強AI,它被賦予一個最基本的邏輯,自己組織資源,觀察這個世界,並總結世界的規律。

一種思路是我們教給它經典力學,相對論,各種數學和幾何工具,量子力學等等,把已有知識教給它,然後讓它具有人類頂級科學傢的知識儲備,然後繼續深入觀察和分析世界,並試圖解決大一統理論問題。

但另一種思路呢?我們什麼都不教給它,讓它自己觀測,自己進行實驗和技術迭代,自己總結,也許一開始它會把世界想象為天圓地方,但可能很快就領悟瞭經典力學和太陽系的行星軌道,然後再往後可能會出現人類完全無法理解的理論。

第二、算法勝於數據

騰訊的絕藝來源於Alphago Lee的論文(戰勝李世石的版本),並且有頂尖職業棋手提供輔導,目前已經自我訓練超過幾十億盤,是的,騰訊的計算資源是無以倫比的,但即便如此,尚無法達到Alphago Master的水準。

然而,Alphago zero,僅僅通過750萬盤訓練,就能夠對Alphago master產生碾壓。

我們以前都說,圍棋千古無同局,變化多的全宇宙的原子都無法遍歷,然而Alphago zero 僅僅自我訓練瞭750萬盤,就碾壓瞭之前所有的人類經驗和其他AI,以及包括自己的上一個版本。

就圍棋的變化組合來說,750萬盤的自我訓練量連滄海一黍都算不上,算法大道至簡,極為有效,確實非常感慨。

李彥宏和馬雲曾為此爭論,至少在這個案例上,算法勝於數據確實是定論。

第三、AI是否會對人類帶來危機

有一種觀點認為說,AI並沒有真正的意識,它們需要人類設計規則,人類制定目標,所以,AI仍然在人類的控制范圍內,不用擔心AI會給人類帶來危險。

我想說一點,其實風險並不在於AI是否具有自我意識,而是AI是否可以獨立控制資源,實現自我迭代。一旦AI可以自行掌控資源,自行迭代,那麼我們就要面臨一個巨大的考驗,AI是如何理解人類定義的目標,在目標邏輯上是否缺乏足夠的約束,而這可能導致致命的風險。

而我認為,讓AI具有資源控制和迭代能力,很可能不會是很遙遠的事情。

1、AI擁有對物理設備控制和操作的能力。

2、基於1,AI擁有對物理設備迭代升級的能力,比如利用12納米的成熟技術生產可以實現6納米規格的集成電路生產線。

做兩個簡單思想實驗

1、我們給AI的目標是,探尋世界的終極規則,它們不斷搭建超出人類認知的實驗設備,並做出我們無法理解的實驗進行數據測算,對這些實驗的目的和風險,人類一無所知,突然有一天,它們成功的創造出瞭一個蟲洞或其他什麼,地球和人類遭遇滅頂之災,但AI機器人卻已經把自己復制到瞭其他星球和浩瀚的宇宙中,並繼續完成它們的使命。

2、我們給AI的目標是,讓世界變得更美好,它們不斷摸索和分析世界美好的目標,並不斷尋求和研究世界不美好的原因加以修正和處理,最後,AI發現瞭很多條關鍵因素,但其中一條是,世界美好似乎並不需要人類。

AI也許沒有意識,並不仇視人類,也並無汽車音響後級系統規劃主動傷害人類的動機和意願,但當它們具備瞭人類所無法掌控的能力,並且擁有瞭人類所無法理解的邏輯的時候,很多風險可能就會產生。

目前AI僅僅停留在具體的硬件裡,尚未被賦予操作物理設備和對特定物理設備迭代升級的能力,但其實,在現有科技的條件下,這並非是不可實現的。

第四,所謂特例,也許真的不是特例。

我們認為說,圍棋是個規則明確,目標明確的特例,大多數情況下,AI仍需用人類的數據來學習,而不是通過自我推演。

但其實這個事情反過來想一下,大多數情況下,我們是期望AI按照人類的思路,人類的目標和人類的體驗來完成目標,比如,寫出符合人類語言邏輯的文章,奏響符合人類欣賞邏輯的音樂,等等等等。

我們希望AI理解人類的情緒,語言表達,以及按照人類對事物的判斷和分類標準進行學習和總結。

但,換個角度想想,AI真的需要遵循和理解人類的標準麼?

事實上是,如果AI不是被強行設定為為人類服務,很多領域,都完全不需要去理解人類的知識,經驗和行為記錄。雖然一切起源於人類的算法,但算法本身並不會攜帶人類的情感和意識。

發散一下,DNA這玩意就是一個深度學習的系統,根據環境,幾億年不斷演進,自我淘汰,自我迭代,從單細胞到靈長目,到人類自身。那麼,作為人類,我們會去保護和感謝最初的DNA載體不,會去試圖理解最初的DNA載體的生存訴求麼?

第五,圍棋的極限在哪裡?

有評論這樣說的,Alphago Master,你也有今天!

Alphago Master在年初對職業棋手60連勝,之後3:0戰勝柯潔,實現瞭對人類完全的碾壓,但是面對Alphago zero ,勝率卻隻有10%。

頂尖業餘棋手面對頂尖職業棋手,勝率大概也不止10%。排名靠前的沖段少年,面對世界冠軍棋手,勝率可能也會有10%。

根據自我對戰測試數據,Alphago zero的等級分已經突破瞭令人恐怖的5000分,而人類棋手的巔峰,不到2700分。

圍棋上帝的等級分是多少?圍棋上帝可以讓現在世界冠軍幾個子?不敢想象。

第六,尷尬的騰訊

騰訊絕藝一度是非常出色的表現,但很遺憾,在第一篇論文的基礎上,一直無法實現更關鍵的突破,幾十億盤的訓練量,水平並未得到明顯的增長,而且在正式比賽裡還輸給瞭deepzengo和臺灣的CGI。

說個可能棋界不愛聽的話,邀請頂尖職業棋手做策略協助,對比於Alphago zero的策略,反而成瞭負面因素。 而大量資源投入,數十億盤的自我訓練量,隻能成為別人算法牛逼的背景。

我們相信,騰訊的技術人員會快速跟進新的論文,絕藝不久一定會獲得突破性的發展。但問題就在這裡,最優秀的跟進學習能力,但缺乏自身突破的能力。

關於Alphago的文章,我可能也說瞭不少瞭,從李世石,到柯潔,到現在,確實一次比一次震撼,可能有人會覺得,至於麼,震撼一次兩次還不夠麼?

第一次,職業頂尖棋手落敗,拐點到來。

第二次,人類毫無機會和希望,徹底碾壓。

第三次,人類經驗毫無作用,自我學習幾天時間完勝人類幾千年歷史。

所以,關於AI的未來,我們依然有人覺得危言聳聽,覺得擔心多餘,覺得AI還很弱小,別忘瞭,就在兩年前,圍棋AI還是業餘棋手可以隨意取笑的目標。所謂天文數字的變化圖還被認為是計算機不可觸及的領域。

如果兩年前,僅僅兩年前,有人說,一個圍棋AI算法,完全不用人類經驗和策略,僅僅依賴於基本規則和自我對局,可以在750萬盤對局量的情況下,讓所有人類頂尖高手絕望,一定會被人罵是傻逼,不懂圍棋也不懂算法,偽科學。但當今天,這一切發生的時候,已經沒有人會質疑這個真實性。整個歷程確實完美印證瞭火車理論,從嘲笑,不屑一顧,到呼嘯而過,然後達到人類無法理解,無法企及的境界。和你並駕齊驅的時間,讓你覺得可以相提並論的時間,就那麼一瞬而已。

現在我們嘲笑的哪些AI尚未征服的領域,也許就那麼一瞬,就會超越人類,然後達到我們無法理解,無法企及的境界。

如果它們控制和掌握瞭生產資源,並能對硬件做自我迭代和自我升級。未來科技和文明的發展可能會呈現極具加速的情況,AI革命,會工業革命更快,顛覆更徹底,而人類將徹底失去對科技的控制,甚至連理解都變得很難。

即便存在風險,我依然期待著科技的發展和未來的到來。

與其渾渾噩噩茍活,不如冒些風險,去更好的認識這個世界,理解這個世界,人類原本就很脆弱,我們隻是暫時還很幸運,很多風險都可能讓人類在睡夢中面臨滅頂之災。科技的進步永遠都會存在風險,但與其渾渾噩噩的等待未知災難,不如更主動的冒險發展自己,去擁有更強大的能力和認知。

也許AI會毀滅人類,但也許會幫助人類找到更好的未來,不試試,怎麼知道?

閱讀原文

版權聲明:本文內容及采編均來自互聯網

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 kmn361o7q8 的頭像
    kmn361o7q8

    小蘋果的文創膠帶

    kmn361o7q8 發表在 痞客邦 留言(0) 人氣()