“虛擬數(shù)字人”是指用數(shù)字技術(shù)在非物理世界中構(gòu)建的具有人類特征的虛擬產(chǎn)物,其集成了計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉以及多模態(tài)模型、語(yǔ)音識(shí)別、知識(shí)圖譜等技術(shù),堪稱近年來(lái)最受關(guān)注的“人”了。
虛擬數(shù)字人何以成“人”?一方面是通過(guò)集成一系列高精尖技術(shù),從而使虛擬數(shù)字人的外貌、聲音甚至是實(shí)時(shí)交互能力高度擬真;另一方面則是虛擬數(shù)字人的應(yīng)用可以為人們的生活帶來(lái)實(shí)實(shí)在在的便利,并與人類實(shí)現(xiàn)共生共榮。前者始終以科技創(chuàng)新作為關(guān)鍵驅(qū)動(dòng)力。沒(méi)有創(chuàng)新,虛擬數(shù)字人的高度擬真也就無(wú)從談起。后者則進(jìn)一步闡明科技要始終遵循以人為本的發(fā)展理念,要讓虛擬數(shù)字人更好地滿足社會(huì)生產(chǎn)生活需求,要讓科技彰顯人性溫度。
技術(shù)創(chuàng)新是關(guān)鍵驅(qū)動(dòng)力
顧名思義,虛擬數(shù)字人的核心在于對(duì)“人”的高度擬真、模仿。無(wú)論是外貌、聲音還是交互行為都無(wú)限接近真人,讓虛擬數(shù)字人與人類的交流溝通更加真實(shí),增加交互沉浸感。因此,能否提供足夠自然和擬真的交互技術(shù),是虛擬數(shù)字人能否在未來(lái)場(chǎng)景應(yīng)用中逐步取代一些不必要的真人勞動(dòng)力,助力社會(huì)邁向數(shù)智化的關(guān)鍵。
技術(shù)創(chuàng)新始終是虛擬數(shù)字人能夠更加擬真、智能以及整個(gè)產(chǎn)業(yè)做大做強(qiáng)的關(guān)鍵驅(qū)動(dòng)力??傮w而言,虛擬數(shù)字人技術(shù)正在快速發(fā)展,產(chǎn)業(yè)發(fā)展脈絡(luò)變得清晰?!短摂M數(shù)字人深度產(chǎn)業(yè)報(bào)告》認(rèn)為,從技術(shù)層面看,虛擬數(shù)字人已經(jīng)劃分為真人驅(qū)動(dòng)型和計(jì)算驅(qū)動(dòng)型兩個(gè)大類。
以真人驅(qū)動(dòng)模式為例,在完成原畫(huà)建模和關(guān)鍵點(diǎn)綁定后,技術(shù)人員只需利用動(dòng)作捕捉設(shè)備或攝像頭采集真人表情與動(dòng)作等要素,便可直接驅(qū)動(dòng)虛擬數(shù)字人。由于其背后是直接利用了真人的各種表情動(dòng)作,因而虛擬數(shù)字人的動(dòng)作靈活度以及互動(dòng)效果都較為出色。這種技術(shù)模式的好處在于,一方面能夠在部分涉及影視創(chuàng)作的行業(yè)中顯著降低生產(chǎn)成本,另一方面則能在虛擬偶像、直播主播行業(yè)進(jìn)行批量生產(chǎn),讓虛擬數(shù)字人在大型直播、現(xiàn)場(chǎng)路演等互動(dòng)性較強(qiáng)的活動(dòng)中加強(qiáng)落地應(yīng)用。
有關(guān)虛擬數(shù)字人技術(shù)討論的高潮莫過(guò)于“真假黃仁勛”事件。在2021年4月英偉達(dá)舉辦的發(fā)布會(huì)上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛以虛擬數(shù)字人形象出現(xiàn)在虛擬甲板(Holodeck)上面并進(jìn)行了簡(jiǎn)短發(fā)言,這在全球范圍內(nèi)引起了熱議。英偉達(dá)這段時(shí)長(zhǎng)約14秒的“秀肌肉”環(huán)節(jié)讓很多觀眾第一次領(lǐng)略到虛擬數(shù)字人的飛速發(fā)展——它們已經(jīng)能夠以假亂真了。
據(jù)介紹,英偉達(dá)的虛擬世界模擬引擎Omniverse依托頂尖的計(jì)算機(jī)圖形學(xué)、人工智能等技術(shù),其不僅允許用戶在平臺(tái)上進(jìn)行建模、布局、陰影、動(dòng)畫(huà)、照明、特效或渲染工作,還可以創(chuàng)建交互式人工智能替身。
無(wú)獨(dú)有偶,我國(guó)百度、科大訊飛等人工智能領(lǐng)先企業(yè)也在積極探索虛擬數(shù)字人技術(shù),他們利用擁有自主知識(shí)產(chǎn)權(quán)的圖像、人工智能引擎或是先進(jìn)的人臉3D重建、唇形驅(qū)動(dòng)技術(shù),配合自身?yè)碛械母黝悢?shù)字資產(chǎn),在虛擬數(shù)字人領(lǐng)域開(kāi)疆拓土。
隨著虛擬數(shù)字人技術(shù)不斷迭代創(chuàng)新,未來(lái)的數(shù)智化社會(huì)也許會(huì)是這般風(fēng)貌:全世界不同膚色、講著不同語(yǔ)言的人們憑借虛擬數(shù)字人將自身映射到元宇宙中,虛擬世界的“人們”幫助真人深度參與生產(chǎn)活動(dòng)。各行業(yè)的運(yùn)行也將變得更高效——工業(yè)、金融、教育、文化、醫(yī)療等垂直行業(yè)元宇宙紛紛落地,并反哺物理世界中的技術(shù)與產(chǎn)品,使其再度迭代升級(jí)。
科技向善彰顯人性溫度
如果說(shuō)技術(shù)賦予了虛擬數(shù)字人動(dòng)聽(tīng)的聲音、真實(shí)的膚色,那么如何更好地用虛擬數(shù)字人技術(shù)造福社會(huì)則決定虛擬數(shù)字人能否擁有自己的體溫??萍枷蛏剖侨祟惷\(yùn)共同體的內(nèi)在要求。虛擬數(shù)字人作為新一代信息通信技術(shù)的集大成者,其不僅要“取之于人,用之于人”,更要用得好、用得對(duì)。
根據(jù)研究機(jī)構(gòu)統(tǒng)計(jì),預(yù)計(jì)到2030年,我國(guó)虛擬數(shù)字人整體市場(chǎng)規(guī)模達(dá)到2700億元。面對(duì)規(guī)模龐大的市場(chǎng)藍(lán)海,如何利用好虛擬數(shù)字人為公眾服務(wù)是產(chǎn)學(xué)研必須思考的問(wèn)題。
目前,多數(shù)虛擬數(shù)字人企業(yè)的發(fā)力點(diǎn)主要圍繞通過(guò)搭建虛擬數(shù)字人內(nèi)容生成平臺(tái),深挖特定場(chǎng)景(政務(wù)、金融、傳媒、大型活動(dòng)賽事等)的人工智能客服、虛擬主播、虛擬助手、新聞播報(bào)等業(yè)務(wù),華為、科大訊飛、百度、騰訊、搜狗等企業(yè)都在該領(lǐng)域有所布局。
在2021年一場(chǎng)華為開(kāi)發(fā)者大會(huì)的會(huì)場(chǎng)直播大屏上,身著紅色衣服的虛擬數(shù)字人實(shí)時(shí)匹配演講嘉賓的說(shuō)話內(nèi)容,通過(guò)手語(yǔ)直播大會(huì)內(nèi)容。據(jù)介紹,該虛擬數(shù)字人基于即時(shí)聽(tīng)到的語(yǔ)言,通過(guò)華為手語(yǔ)服務(wù),實(shí)時(shí)生成連貫、自然的手語(yǔ)。另外,華為還宣布此項(xiàng)目將通過(guò)華為手語(yǔ)服務(wù)(SignPal Kit)開(kāi)放出來(lái),讓虛擬數(shù)字人惠及全世界的聽(tīng)障群體,讓溝通無(wú)障礙。
世界衛(wèi)生組織(WHO)最新數(shù)據(jù)顯示,全球患有聽(tīng)力障礙的群體大約有4.66億人,幾乎超過(guò)全世界人口的5%。手語(yǔ)作為聽(tīng)障群體溝通的重要工具,是他們?nèi)谌肷鐣?huì)和完成工作、學(xué)習(xí)的橋梁與紐帶。特別是由于交流的不便和信息的缺失,聽(tīng)障群體在公共場(chǎng)所,例如政府、銀行、醫(yī)院等機(jī)構(gòu)辦理業(yè)務(wù)時(shí)面臨諸多困難。在我國(guó),聽(tīng)障群體人數(shù)約為2700萬(wàn),即每100人中約有2人患有聽(tīng)力障礙。但是目前我國(guó)手語(yǔ)行業(yè)發(fā)展較為緩慢,手語(yǔ)教育培訓(xùn)力量薄弱,具備專業(yè)手語(yǔ)翻譯資格認(rèn)證的人員更是少之又少,與龐大的聽(tīng)障群體比例極為失衡。虛擬數(shù)字人的應(yīng)用將為他們帶來(lái)切實(shí)福利。
以人工智能技術(shù)見(jiàn)長(zhǎng)的科大訊飛正在為患有視力障礙的人們的溝通交流作貢獻(xiàn)。隨著北京冬奧會(huì)和冬殘奧會(huì)日益臨近,從2019年底啟動(dòng)的北京市無(wú)障礙環(huán)境建設(shè)專項(xiàng)行動(dòng)也進(jìn)入收官階段。科大訊飛高級(jí)副總裁杜蘭透露,和往屆奧運(yùn)會(huì)相比,2022年北京冬奧會(huì)及冬殘奧會(huì)將成為歷史上首屆溝通無(wú)障礙的奧運(yùn)會(huì)。為了滿足視障群體需求,科大訊飛推出了虛擬交互志愿者,其利用多語(yǔ)種識(shí)別、自然語(yǔ)言理解、機(jī)器翻譯、虛擬形象等核心技術(shù),替代真人提供全天候播報(bào)服務(wù),讓視障人士能夠“聽(tīng)得見(jiàn)”文字。
隨著各類底層技術(shù)越發(fā)成熟以及更多為公眾服務(wù)的虛擬數(shù)字人應(yīng)用落地,虛擬數(shù)字人將不僅是一個(gè)由0和1組成的工具,更會(huì)是一個(gè)擁有體溫的“人”,更廣泛地傳播數(shù)智化帶來(lái)的社會(huì)紅利,惠及每個(gè)角落。(趙樂(lè)瑄)