圍棋、撲克相繼失守,人類游戲以后還能怎么玩?
圍棋、撲克相繼失守,人類游戲以后還能怎么玩?
【AI世代編者按】人工智能的復(fù)雜度正在日益提升,而與人玩游戲則是一項(xiàng)技巧十足的任務(wù)。美國(guó)研究人員艾倫德·辛茨(Arend Hintze)闡述了人工智能和游戲的進(jìn)化理論,以及未來(lái)的發(fā)展方向。
以下為原文內(nèi)容:
1980年代,一位老師讓我寫(xiě)一個(gè)能玩井字棋的電腦程序??上覜](méi)寫(xiě)出來(lái)。但就在幾個(gè)星期前,我跟我的一個(gè)計(jì)算機(jī)專業(yè)的研究生解釋了如何用所謂的“Minimax算法”解決井字棋問(wèn)題,我們大約用了一個(gè)小時(shí)就把程序?qū)懲炅恕?/p>
我的編程能力這些年的確進(jìn)步了,但計(jì)算機(jī)科學(xué)也有了長(zhǎng)足發(fā)展。
幾十年前看似無(wú)法實(shí)現(xiàn)的事情,今天卻有可能變得非常容易。1997年,當(dāng)IBM“深藍(lán)”在6局對(duì)戰(zhàn)中擊敗國(guó)際象棋大師加里·卡斯帕羅夫(Garry Kasparov)時(shí),人們都感到驚訝不已。2015年,谷歌(微博)披露其DeepMind系統(tǒng)已經(jīng)掌握了多款1980年代的視頻游戲,包括自學(xué)《打磚塊》游戲的取勝秘訣。2016年,谷歌的AlphaGo系統(tǒng)還在一場(chǎng)5局對(duì)戰(zhàn)中擊敗了一位頂尖圍棋選手。
關(guān)于計(jì)算機(jī)系統(tǒng)在各類游戲中擊敗人類選手的探索仍在繼續(xù)。5月末,AlphaGo將在“中國(guó)烏鎮(zhèn)圍棋峰會(huì)”上挑戰(zhàn)柯潔。隨著計(jì)算能力的增強(qiáng)和技術(shù)水平的提升,電腦甚至能在那些我們?cè)菊J(rèn)為需要依靠人類的直覺(jué)、智慧和狡詐才能勝出的游戲上戰(zhàn)勝人類——例如撲克。
我最近看見(jiàn)一段排球運(yùn)動(dòng)員跟機(jī)器人控制的橡膠手臂對(duì)練扣殺的視頻,這些手臂竟然能夠攔截專業(yè)運(yùn)動(dòng)員的大力扣殺。由此可見(jiàn),當(dāng)機(jī)器想要取勝時(shí),人類的抵抗將毫無(wú)用處。
這是好事:我們希望有完美的人工智能系統(tǒng)替我們開(kāi)車,還希望有不知疲倦的系統(tǒng)從X光片上尋找癌癥的跡象。但具體到玩游戲這件事情,我們還是不想輸給機(jī)器。幸運(yùn)的是,人工智能可以讓游戲更加有趣,甚至有可能給我們帶來(lái)無(wú)盡的快樂(lè)。
玩不膩的游戲
如今的游戲設(shè)計(jì)師看到一個(gè)問(wèn)題:開(kāi)發(fā)無(wú)敵的人工智能系統(tǒng)根本沒(méi)有意義。如果毫無(wú)勝算,那就沒(méi)人愿意玩。
但人們希望玩游戲時(shí)能獲得沉浸、復(fù)雜且令人驚喜的體驗(yàn)。即便是當(dāng)今最好的游戲,玩過(guò)一段時(shí)間之后也會(huì)覺(jué)得無(wú)聊。理想的游戲模式是主動(dòng)適應(yīng)玩家,并通過(guò)與之互動(dòng)來(lái)保持游戲的趣味性,甚至讓這種狀態(tài)永遠(yuǎn)持續(xù)下去。
所以,當(dāng)我們?cè)O(shè)計(jì)人工智能系統(tǒng)時(shí),不能光看到深藍(lán)和AlphaGo的勝利,還應(yīng)該看到《魔獸世界》這種大型多人在線游戲的巨大成功。這些游戲的圖形設(shè)計(jì)精美,但它們最大的吸引力還在于互動(dòng)。
多數(shù)人對(duì)象棋和圍棋這種極其復(fù)雜的邏輯游戲興趣不大,而是希望與人聯(lián)系,營(yíng)造社區(qū)。這些MMO游戲面臨的真正挑戰(zhàn)并不是它們能否被人類智能或人工智能擊敗,而是如何讓玩家每次玩游戲時(shí)都能有新鮮感。
改變模式
目前,游戲環(huán)境允許人們與其他玩家展開(kāi)許多互動(dòng)。地牢突擊隊(duì)的角色很容易確定:戰(zhàn)士負(fù)責(zé)戰(zhàn)斗,醫(yī)生負(fù)責(zé)救治傷員,巫師負(fù)責(zé)遠(yuǎn)程施法?;蛘呦胂搿秱魉烷T(mén)2》,這款多人游戲的重點(diǎn)是通過(guò)合作來(lái)解開(kāi)一系列機(jī)關(guān)和謎題。
跟朋友一起玩這些游戲可以幫助你們形成共同記憶。但這些環(huán)境或底層情節(jié)的任何變化都必須由人類設(shè)計(jì)師和開(kāi)發(fā)者來(lái)部署。
在現(xiàn)實(shí)世界中,各種變化都是自然發(fā)生的,不受監(jiān)督,不是人為設(shè)計(jì)的,也不會(huì)受到人為干預(yù)。玩家需要學(xué)習(xí),而生物需要適應(yīng)。有的生物體甚至?xí)餐M(jìn)化,對(duì)彼此的發(fā)展作出反應(yīng)。(武器技術(shù)的軍備競(jìng)賽會(huì)出現(xiàn)類似的現(xiàn)象。)
當(dāng)今的電腦游戲沒(méi)有這么復(fù)雜。正因如此,我不認(rèn)為開(kāi)發(fā)能玩現(xiàn)代游戲的人工智能技術(shù)可以對(duì)人工智能研究形成有益的促進(jìn)。
智能進(jìn)化
值得一玩的游戲必須因?yàn)榫哂羞m應(yīng)性而不可預(yù)測(cè),還要因?yàn)橥嬗螒虻倪^(guò)程而產(chǎn)生新奇感。未來(lái)的游戲需要進(jìn)化。它們的角色不能僅僅做出反應(yīng),還要具備探索和合作能力,甚至要發(fā)現(xiàn)各種缺點(diǎn)。
達(dá)爾文進(jìn)化論和學(xué)習(xí)是地球上一切新奇事物的形成動(dòng)力,這同樣可以成為促進(jìn)虛擬環(huán)境變化的動(dòng)力。
進(jìn)化已經(jīng)掌握了創(chuàng)造自然智能的方法。我們是不是也應(yīng)該放棄把自己的思維方式植入到人工智能之中的嘗試,轉(zhuǎn)而直接推動(dòng)人工智能實(shí)現(xiàn)進(jìn)化?包括我的實(shí)驗(yàn)室和我同事克里斯多夫·阿達(dá)米(Christoph Adami)的實(shí)驗(yàn)室在內(nèi),有幾家實(shí)驗(yàn)室正在從事所謂的“神經(jīng)進(jìn)化”(nero-evolution)研究。
我們?cè)陔娔X中模擬復(fù)雜的環(huán)境,例如路網(wǎng)或生物生態(tài)系統(tǒng)。我們創(chuàng)造虛擬生物,并讓它們模擬數(shù)十萬(wàn)代的進(jìn)化過(guò)程。進(jìn)化本身隨后發(fā)展出最好的動(dòng)力,或者成為最適應(yīng)環(huán)境的生物——也就是那些生存至今的生物。
如今的AlphaGo已經(jīng)開(kāi)始了這一進(jìn)程,它通過(guò)不斷與自己對(duì)弈,以及分析頂尖棋手的比賽記錄來(lái)自我學(xué)習(xí)。但它并不能像我們這樣邊下棋邊學(xué)習(xí),也不能進(jìn)行無(wú)人監(jiān)督的實(shí)驗(yàn)。它無(wú)法根據(jù)對(duì)手的不同來(lái)調(diào)整戰(zhàn)略:對(duì)電腦來(lái)說(shuō),最好的棋就是最好的棋,無(wú)論對(duì)手的風(fēng)格如何都不會(huì)改變。
通過(guò)自己的經(jīng)驗(yàn)來(lái)學(xué)習(xí)是人工智能未來(lái)的發(fā)展方向。它們可以大幅增加游戲的趣味性,讓機(jī)器人不僅能在現(xiàn)實(shí)世界中發(fā)揮作用,還能在忙碌中不斷適應(yīng)。(編譯/長(zhǎng)歌)
繼續(xù)閱讀與本文標(biāo)簽相同的文章