引言
游戲開發(fā)者大會(huì)(英語:Game Developers Conference,縮寫:GDC)是規(guī)模最大的游戲開發(fā)者年度專業(yè)性質(zhì)會(huì)議與展覽,每年在舊金山召開一次,已舉辦35屆。今年的GDC于2022年3月21日-25日在舊金山圓滿落幕。
GDC重頭環(huán)節(jié)是非贊助類主題演講,每屆主辦方平均邀請(qǐng)不足300場,分核心(Core)與峰會(huì)(Summit)兩大類別。演講嘉賓經(jīng)過主辦方及其全球顧問委員會(huì)精心挑選并邀請(qǐng),以高質(zhì)量和創(chuàng)新性而備受行業(yè)認(rèn)可,演講內(nèi)容代表著游戲行業(yè)當(dāng)前的最高水準(zhǔn)與發(fā)展趨勢。
經(jīng)過激烈的篩選,網(wǎng)易互娛AI Lab共有四項(xiàng)研究成果入選,向來自世界各地的開發(fā)者們分享了在人工智能領(lǐng)域,游戲研發(fā)運(yùn)營、資源生產(chǎn)等新技術(shù)。這四項(xiàng)成果分別入選了GDC 2022 Core、GDC 2022 ML Summit 和 GDC 2022 Tool Summit,彰顯了網(wǎng)易互娛AI Lab在人工智能多個(gè)領(lǐng)域已經(jīng)具備國際頂尖的技術(shù)創(chuàng)新能力,也印證了其近年來在游戲領(lǐng)域的技術(shù)探索和突破已經(jīng)獲得了業(yè)界權(quán)威的認(rèn)可。
提案介紹
以下是網(wǎng)易互娛AI Lab入選的4篇提案:
1. Reinforcement Learning for Efficient Cars and Tracks Design in Racing Games(《在賽車游戲中利用強(qiáng)化學(xué)習(xí)提高賽車和賽道設(shè)計(jì)效率》)
該方案入選 GDC 2022 Core
賽車游戲中,不同賽車的駕駛差異性和賽道的漂移感是影響游戲體驗(yàn)的關(guān)鍵因素。以往在此類游戲開發(fā)階段,以上兩點(diǎn)需要耗費(fèi)巨量的人工測試:
1.賽車的差異性需要極限水平下才能測試,高水平玩家才能更好地辨別出賽車和賽道的極致差異;
2.賽車和賽道種類的提高,極大增加了測試工作量,這給游戲的設(shè)計(jì)帶來了巨大挑戰(zhàn)。
此成果利用異步強(qiáng)化學(xué)習(xí)采樣算法,構(gòu)建出能快速批量測出不同賽車的駕駛差異和驗(yàn)證彎道漂移感的系統(tǒng)。利用非常少量的計(jì)算資源,可以實(shí)現(xiàn):
1.1小時(shí)內(nèi)能跑出50種不同車輛在同一賽道中超越頂級(jí)玩家的頂級(jí)水平,以驗(yàn)證賽車的差異性。圖一顯示了不同賽車在不同賽道的極致時(shí)間,圖二顯示了不同賽車在統(tǒng)一賽道的行駛軌跡,可以看到不同的車輛的駕駛差異,例如入彎特性差異等;
2.在擬人類操作約束下,給出不同彎道是否需要手剎飄逸和飄逸區(qū)間,以驗(yàn)證賽道設(shè)計(jì)的漂移感是否符合預(yù)期,極大降低了游戲開發(fā)成本。圖三中紅色線之間代表策劃人為劃出的先驗(yàn)手剎區(qū)間,黃色點(diǎn)表示AI在該彎道的連續(xù)手剎操作。
2. An Easy-to-Use Cutscenes Preview Tool with Low Resources(《一個(gè)易用且低資源依賴的過場動(dòng)畫預(yù)覽工具》)
該方案入選 GDC 2022 Tool summit
標(biāo)準(zhǔn)的劇情動(dòng)畫設(shè)計(jì)通常先由游戲設(shè)計(jì)師構(gòu)建故事情節(jié),然后資源制作組基于故事情節(jié)來制作動(dòng)畫。但是這個(gè)動(dòng)畫設(shè)計(jì)過程往往伴隨著多次溝通和修改,因?yàn)橹谱鞯膭?dòng)畫不一定能與游戲設(shè)計(jì)師的想法所對(duì)應(yīng),這個(gè)過程會(huì)浪費(fèi)大量的時(shí)間和人力。
為了提高角色動(dòng)畫制作過程中的溝通和開發(fā)效率,我們制作了一個(gè)低資源依賴的易用過場動(dòng)畫預(yù)覽工具。這個(gè)工具包含5個(gè)插件,可以根據(jù)游戲劇本一鍵生成配音和動(dòng)畫原型。游戲設(shè)計(jì)師們可以輕松地利用這些插件來構(gòu)造原型,方便后續(xù)溝通和修改。不僅有效減少了資源的浪費(fèi),還簡化了劇情動(dòng)畫開發(fā)過程中的溝通和調(diào)整。
劇情動(dòng)畫生成方案包含5個(gè)插件:小說續(xù)寫、小說轉(zhuǎn)劇本、劇本情緒分析、情感可控語音合成、嘴型表情動(dòng)畫合成。每一個(gè)插件既可以相輔相成,又可以單獨(dú)拎出來成為一個(gè)小部件,即插即用。
方案的整體流程是:
1.先輸入一段小說,或者一個(gè)片段的開頭,小說續(xù)寫模塊可以天馬行空地續(xù)寫到無窮長。
2.然后基于輸入或者生成的小說形式的文本,通過小說轉(zhuǎn)劇本模塊,轉(zhuǎn)換成“角色:對(duì)白”這樣的節(jié)點(diǎn)圖。
3.得到節(jié)點(diǎn)圖后,通過劇本情緒識(shí)別模塊,對(duì)每句對(duì)白提取出對(duì)應(yīng)的情緒。
4.將角色、對(duì)白以及情緒輸入到語音合成模塊中,輸出帶有情緒的配音合成文件。
5.嘴型表情動(dòng)畫模型將配音和對(duì)白進(jìn)行自動(dòng)對(duì)齊,然后合成出對(duì)應(yīng)的嘴型動(dòng)畫,同時(shí)也使用情緒結(jié)果來產(chǎn)生對(duì)應(yīng)的表情動(dòng)畫。
目前方案中的4個(gè)插件已全部接入Montage和Messiah的劇情編輯器中。每個(gè)插件也可以單獨(dú)拆分,服務(wù)于相應(yīng)的功能。
3. Aegis Engine: Building Multi-modal Moderation System in NetEase Games(《Aegis引擎:多模態(tài)審核系統(tǒng)構(gòu)建及其在網(wǎng)易游戲中的應(yīng)用》)
該方案入選 GDC 2022 ML Summit
用戶生成內(nèi)容(UGC)和社交互動(dòng)極大地提高了玩家的參與度和游戲的娛樂性。為了使游戲遠(yuǎn)離違規(guī)內(nèi)容,比如色情、暴力、有害信息等,構(gòu)建一個(gè)內(nèi)容審核系統(tǒng)至關(guān)重要。然而,人工審核需要耗費(fèi)大量時(shí)間、人力和資金。本報(bào)告將介紹網(wǎng)易互娛AI Lab自研的Aegis引擎,一個(gè)運(yùn)用深度學(xué)習(xí)技術(shù)搭建的多模態(tài)內(nèi)容審核系統(tǒng),可以審核文本、圖像以及音頻等多模態(tài)的數(shù)據(jù)。
Aegis引擎包含了三個(gè)子系統(tǒng),圖像子系統(tǒng)挖掘細(xì)粒度識(shí)別和實(shí)時(shí)OCR算法,音頻子系統(tǒng)基于關(guān)鍵詞增強(qiáng)和噪聲魯棒的語音識(shí)別技術(shù)搭建,文本子系統(tǒng)包含基于文本嵌入的違規(guī)內(nèi)容挖掘方法等。
Aegis系統(tǒng)每天可以處理千萬級(jí)別的圖片和數(shù)十萬個(gè)小時(shí)的語音數(shù)據(jù),幾乎覆蓋了網(wǎng)易互娛的所有游戲。
4. AI Animator : A Real Time Motion Completion System(《AI動(dòng)畫師:實(shí)時(shí)動(dòng)作補(bǔ)全系統(tǒng)》)
該方案入選 GDC 2022 ML summit
快速、輕量、高質(zhì)量的動(dòng)畫合成是游戲業(yè)界一直所追求的?,F(xiàn)行方案主要是利用線性插值完成簡單動(dòng)作插幀,本次演講中,我們提出了一個(gè)統(tǒng)一的實(shí)時(shí)動(dòng)作補(bǔ)全深度學(xué)習(xí)框架。該框架可以覆蓋常見的動(dòng)畫制作場景,如手動(dòng)K幀,動(dòng)畫Blending銜接,動(dòng)作動(dòng)畫的“超分辨”等。
實(shí)驗(yàn)表明,該算法目前在育碧公開的大規(guī)模高質(zhì)量數(shù)據(jù)集LaFAN1(包括步行、跑步、跳舞等復(fù)雜動(dòng)作)上,達(dá)到了最佳的速度和效果(比之前的的sota高17%)。除此之外,我們的方法可以實(shí)現(xiàn)CPU實(shí)時(shí)(30幀0.025s),抵抗30db的動(dòng)作數(shù)據(jù)噪聲污染,具體來說:
1.AI輔助手動(dòng)K幀(In-betweening):算法在過去的幀和提供的新關(guān)鍵幀之間逐幀生成,為美術(shù)減少工作量,同時(shí)可以為沒有美術(shù)人員的項(xiàng)目實(shí)現(xiàn)任意模型的動(dòng)作動(dòng)畫制作。
2.填充(In-filling)。作為中間的延伸,填充將角色置于時(shí)間線的特定位置并補(bǔ)充其余的幀。填充的一個(gè)子任務(wù)是動(dòng)作的超分辨,其中輸入幀被視為具有相等間隔的關(guān)鍵幀,算法可以補(bǔ)全中間動(dòng)畫。
3.銜接混合(Blending):Blending側(cè)重于自動(dòng)生成一對(duì)預(yù)定義動(dòng)作片段之間的過渡。例如,我們的算法可以實(shí)時(shí)生成較高復(fù)雜度的舞蹈片段中間過渡,以幫助使用者集中注意力在動(dòng)畫內(nèi)容本身。
藍(lán)色部分為輸入關(guān)鍵幀,中間其他色為算法生成結(jié)果。
為了增強(qiáng)動(dòng)畫多樣性,動(dòng)畫展示的是同一輸入條件下,我們控制生成的多種不同結(jié)果。
網(wǎng)易互娛AI Lab
網(wǎng)易互娛AI Lab成立于2017年,隸屬于網(wǎng)易互動(dòng)娛樂事業(yè)群,在廣州、杭州、上海均有分部,是游戲行業(yè)領(lǐng)先的人工智能實(shí)驗(yàn)室。實(shí)驗(yàn)室致力于計(jì)算機(jī)視覺、語音和自然語言處理,以及強(qiáng)化學(xué)習(xí)等技術(shù)在游戲場景下的的研究,應(yīng)用和落地,旨在通過AI技術(shù)助力互娛旗下熱門游戲及產(chǎn)品的技術(shù)升級(jí),目前技術(shù)已應(yīng)用于網(wǎng)易互娛旗下多款熱門游戲,如《夢幻西游》《哈利波特:魔法覺醒》《陰陽師》《天下3》等等。
關(guān)鍵詞: 網(wǎng)易互娛