POST TIME:2018-12-03 17:23
deepmind發(fā)布了新的論文,Alphago zero再起波濤,也再次引起業(yè)內(nèi)的熱議。 這一次的突破是,不再以人類(lèi)的棋譜作為學(xué)習(xí)的源素材,而是完全基于自我對(duì)局實(shí)現(xiàn)了棋藝的突飛猛進(jìn)。 先吐個(gè)槽,有人會(huì)覺(jué)得,各種自媒體炒作這個(gè)熱點(diǎn)有點(diǎn)多余,但我覺(jué)得吧,比起某些明星過(guò)生日,離婚,劈腿,出柜,嗑藥等等,去追逐一下科技熱點(diǎn),讓年輕人覺(jué)得,其實(shí)搞算法,做研究很酷,難道不是一件好事么? 古時(shí)候,沒(méi)有相機(jī),沒(méi)有錄音機(jī),沒(méi)有電視,沒(méi)有廣播,也沒(méi)有網(wǎng)絡(luò),誰(shuí)也不知道名人長(zhǎng)啥樣,唱歌好聽(tīng)欠好聽(tīng),所以傳播的只有文字,所以偶像是靠文采的,柳永長(zhǎng)啥樣誰(shuí)知道?但他的詞傳頌出去,小姑娘們愛(ài)的不要不要的。 現(xiàn)代傳媒發(fā)達(dá)了,出現(xiàn)了靠身體本質(zhì)的偶像,靠顏值的偶像,靠聲音的偶像,靠演出才藝的偶像,難得出一個(gè)柯潔,是靠智力的偶像,還被人說(shuō)吊兒郎當(dāng)?,F(xiàn)在終于輪到算法和科技成為熱點(diǎn),讓科研變得很酷很有吸引力,這才是正能量啊。 下面說(shuō)說(shuō)這次技術(shù)升級(jí)的一些特征和值得關(guān)注的點(diǎn)。 第一、不再需要人類(lèi)的經(jīng)驗(yàn) 很可怕的事實(shí),當(dāng)然,我們說(shuō),這是特定領(lǐng)域,因?yàn)橐?guī)則簡(jiǎn)單,目標(biāo)明確,才不需要人類(lèi)的經(jīng)驗(yàn)和數(shù)據(jù)。 但其實(shí)如果發(fā)散一點(diǎn),我們做個(gè)思想實(shí)驗(yàn)。 假設(shè)有一個(gè)深度學(xué)習(xí)的強(qiáng)AI,它被賦予一個(gè)最基本的邏輯,本身組織資源,不雅觀察這個(gè)世界,并總結(jié)世界的規(guī)律。 一種思路是我們教給它經(jīng)典力學(xué),相對(duì)論,各種數(shù)學(xué)和幾何工具,量子力學(xué)等等,把已有知識(shí)教給它,然后讓它具有人類(lèi)頂級(jí)科學(xué)家的知識(shí)儲(chǔ)備,然后繼續(xù)深入不雅觀察和分析世界,并試圖解決大一統(tǒng)理論問(wèn)題。 但另一種思路呢?我們什么都不教給它,讓它本身不雅觀測(cè),本身進(jìn)行實(shí)驗(yàn)和技術(shù)迭代,本身總結(jié),也許一開(kāi)始它會(huì)把世界想象為天圓地方,但可能很快就領(lǐng)悟了經(jīng)典力學(xué)和太陽(yáng)系的行星軌道,然后再往后可能會(huì)出現(xiàn)人類(lèi)完全無(wú)法理解的理論。 第二、算法勝于數(shù)據(jù) 騰訊的絕藝來(lái)源于Alphago Lee的論文(戰(zhàn)勝李世石的版本),而且有頂尖職業(yè)棋手提供輔導(dǎo),目前已經(jīng)自我訓(xùn)練超過(guò)幾十億盤(pán),是的,騰訊的計(jì)算資源是無(wú)以倫比的,但即便如此,尚無(wú)法達(dá)到Alphago Master的水準(zhǔn)。 然而,Alphago zero,僅僅通過(guò)750萬(wàn)盤(pán)訓(xùn)練,就能夠?qū)lphago master產(chǎn)生碾壓。 我們以前都說(shuō),圍棋千古無(wú)同局,變革多的全宇宙的原子都無(wú)法遍歷,然而Alphago zero 僅僅自我訓(xùn)練了750萬(wàn)盤(pán),就碾壓了之前所有的人類(lèi)經(jīng)驗(yàn)和其他AI,以及包孕本身的上一個(gè)版本。 就圍棋的變革組合來(lái)說(shuō),750萬(wàn)盤(pán)的自我訓(xùn)練量連滄海一黍都算不上,算法大道至簡(jiǎn),極為有效,確實(shí)非常感慨。 李彥宏和馬云曾為此爭(zhēng)論,至少在這個(gè)案例上,算法勝于數(shù)據(jù)確實(shí)是定論。 第三、AI是否會(huì)對(duì)人類(lèi)帶來(lái)危機(jī) 有一種不雅觀點(diǎn)認(rèn)為說(shuō),AI并沒(méi)有真正的意識(shí),它們需要人類(lèi)設(shè)計(jì)規(guī)則,人類(lèi)制定目標(biāo),所以,AI仍然在人類(lèi)的控制范圍內(nèi),不消擔(dān)心AI會(huì)給人類(lèi)帶來(lái)危險(xiǎn)。 我想說(shuō)一點(diǎn),其實(shí)風(fēng)險(xiǎn)并不在于AI是否具有自我意識(shí),而是AI是否可以獨(dú)立控制資源,實(shí)現(xiàn)自我迭代。一旦AI可以自行掌控資源,自行迭代,那么我們就要面臨一個(gè)巨大的考驗(yàn),AI是如何理解人類(lèi)定義的目標(biāo),在目標(biāo)邏輯上是否缺乏足夠的約束,而這可能導(dǎo)致致命的風(fēng)險(xiǎn)。 而我認(rèn)為,讓AI具有資源控制和迭代能力,很可能不會(huì)是很遙遠(yuǎn)的事情。 1、AI擁有對(duì)物理設(shè)備控制和操作的能力。
2、基于1,AI擁有對(duì)物理設(shè)備迭代升級(jí)的能力,好比利用12納米的成熟技術(shù)生產(chǎn)可以實(shí)現(xiàn)6納米規(guī)格的集成電路生產(chǎn)線。 做兩個(gè)簡(jiǎn)單思想實(shí)驗(yàn)
1、我們給AI的目標(biāo)是,探尋世界的終極規(guī)則,它們不停搭建超出人類(lèi)認(rèn)知的實(shí)驗(yàn)設(shè)備,并做出我們無(wú)法理解的實(shí)驗(yàn)進(jìn)行數(shù)據(jù)測(cè)算,對(duì)這些實(shí)驗(yàn)的目的和風(fēng)險(xiǎn),人類(lèi)一無(wú)所知,突然有一天,它們成功的創(chuàng)造出了一個(gè)蟲(chóng)洞或其他什么,地球和人類(lèi)遭遇滅頂之災(zāi),但AI機(jī)器人卻已經(jīng)把本身復(fù)制到了其他星球和浩瀚的宇宙中,并繼續(xù)完成它們的使命。 2、我們給AI的目標(biāo)是,讓世界變得更美好,它們不停摸索和分析世界美好的目標(biāo),并不停尋求和研究世界不美好的原因加以修正和處理,最后,AI發(fā)現(xiàn)了很多條關(guān)鍵因素,但其中一條是,世界美好似乎并不需要人類(lèi)。