人工智慧普適研究中心 PAIR Labs
人工智慧在輔助人類學習對局遊戲之應用
計畫主持人:顏士淨教授
摘要
本計畫將發展輔助人類學習對局遊戲之服務產業所需要的人工智慧技術,而Google從擊敗南韓棋王的AlphaGo Lee,到最新的AlphaGo Zero之一系列的AlphaGo所使用的各種AI技術,包括深度學習(DL)、強化式學習(RL)、深度強化式學習(DRL),不但引起了一般民眾的興趣,更開啟了AI在輔助人類學習對局遊戲之應用的大門。台灣在圍棋教育上的發展,一向是領先國際的,如果再加上我們發展的技術與工具,對於這個產業的經濟發展將有極大幫助。對於社會發展來看,在AI興起之後,人類將更需要具備邏輯思考判斷的能力,而提倡對局遊戲,剛好可以作為訓練邏輯觀念的工具,對於社會發展有正向作用。
關鍵詞
對局遊戲產業,圍棋,電腦對局,人工智慧,深度學習,強化式學習,深度強化式學習,卷積神經網路,剩餘網路,生成對抗網路,日本棋院,圍棋教學
技術創新
- 本計畫使用DRL訓練個性化階梯和視覺學習模型,能夠提高AI圍棋服務的質量,在線上AI輔助棋盤遊戲學習平台上,提供教學,學習和對弈服務。
- 從高達10億的人類對局數據中,分析出人類下棋的行為模式,包括棋力等級與各種棋風,可創造出100種以上的各種有趣的對局程式。
- 本計畫利用DL壓縮中國暗棋的殘局數據庫,可以提高中國暗棋搜尋的效率,該論文已發表在IEEE Transactions on Games。
- 在對局遊戲中使用亂數種子優化系統,包括Drafts、Othello和Block Go,該系統能夠增加對局遊戲程序的強度。
- 利用各種深度學習方法與AlphaZero等演算法,研究發展新的棋類,包括純棋和版塊圍棋等。
- 與FACEBOOK臉書AI部門合作,開發使用ELF2深度強化式學習技術,開發研究各種亞洲遊戲。
效益
- 電腦對局是AI的果蠅,在協助人類學習的領域,本計畫相信電腦對局遊戲同樣可以扮演果蠅的角色。本計畫也會探索各種類型遊戲,預計將激發更多新的DL/RL/DRL技術,這也將有助於提升台灣學術發展方面的研發能量與國際知名度,並且也可培育台灣在此方面的研究人才。
- 建立線上AI輔助棋盤遊戲學習平台,包括圍棋的教學、學習和遊戲系統,與適用於AI圍棋個性和遊戲風格之深度學習研究,開發一百多個具有鮮明個性的機器人。成為世界上最大的AI圍棋服務網站,每年提供5億次人工智慧服務。圍棋和AI教育的普及應用有助於長照系統,幫助預防或減緩認知障礙,增進社會福利。
- 本計畫與日本棋院合作,職業選手王銘琬也是我們團隊成員。我們在幽玄之間(Yugen no Ma)圍棋網站上部署大量的AI 圍棋機器人。目前,這些機器人在日本非常受歡迎,累計服務次數超過2億。
- 本計畫子項目1開發圍棋教學系統,子項目2開發了圍棋學習環境,系統和環境可以幫助人們輕鬆有效地學習圍棋技術。子項目2同時為圍棋初學者設計純棋和版塊圍棋開發系統和環境,並且在日本與台灣推廣,頗受好評,台灣與日本媒體已經有大量相關報導。
- 本計畫子項目3開發連接型對局遊戲教學系統,連接遊戲包括Gomoku,Connect6和Othello。子項目4則開發非確定性遊戲教學系統,非確定性遊戲包括中國暗棋,麻將和55骰子將棋。對推廣相關遊戲也有所幫助。