21世紀經濟報道記者張梓桐上海報道
編者按
元宇宙(Metaverse),這個來源于科幻小說的概念,已成為真實世界中的流行語。圍繞這一新興概念,一場產、學、研的實踐正在展開。數字化轉型中,元宇宙能否擔當大任?這些新概念在中國語境下如何落地?南財合規科技研究院數字娛樂課題組策劃了《瞭望元宇宙》系列報道,以期為行業和社會公眾提供理解元宇宙的敲門磚。
數字人作為元宇宙的“原住民”,成為了近年來業界與學界討論的重點,目前業界普遍認為,數字人的大規模應用依賴于高寫實度的效果、好的生產效率和可控的成本。但與此同時,終端的運行疊加算力上的需求對實時云渲染能力形成了挑戰。系列報道第六篇,我們探討元宇宙賴以運行的底層技術,以及其背后的實際產業應用。
近年來,隨著人工智能、虛擬現實等新技術的快速發展,虛擬數字人開始進入普通人的生活。而在新奇的外觀形象、靈巧的互動效果之外,行業也正在挖掘出數字人更多的潛力。
“未來數字人的發展,正呈現出靜態向動態、2D向3D、卡通向寫實、單向向多向互動的趨勢?!蔽殿I時代創始人兼CEO郭建君在接受21世紀經濟報道專訪時表示,數字人領域目前已經度過萌芽期,進入了快速成長階段,不久的將來會迎來爆發期。這也意味著行業開始進入商業化變現探索的關鍵階段,標準化也將逐漸建立。
但在豐富的想象空間之外,一些落地的問題仍然困擾著從業者與用戶。在未來,數字人是否可以實現高度實時性,高度可靈活性和高度適應落地場景,并與人類進行有效的交互,仍有待時間去驗證。
面臨品質成本雙難題
中國人工智能產業發展聯盟發布的《虛擬數字人發展白皮書》顯示,“虛擬數字人”一詞最早源于1989 年美國國立醫學圖書館發起的“可視人計劃”(Visible Human Project, YHP)。2001年, 國內以“中國數字化虛擬人體的科技問題”為主題的香山科學會議滴174次學術討論會提出了“數字化虛擬人體”的概念。
但在當時,這些“虛擬數字人”主要是指人體結構的可視化,以三維形式顯示人體解剖結構的大小、形狀、位置及器官間的相互空間關系。與當下所探討的元宇宙中的“原住民”數字人有較大的含義出入。
近五年得益于深度學習算法的突破,數字人的制作過程得到有效簡化,虛擬數字人開始步入正軌。
同時,這也吸引到政策層面的關注。
2022年8月,北京市經濟和信息化局發布了國內首個數字人產業專項支持政策——《北京市促進數字人產業創新發展行動計劃(2022—2025年)》(以下簡稱《計劃》)?!队媱潯诽岢?,抓住以數字人為代表的互聯網3.0創新應用產業機遇,充分發揮國際科技創新中心建設優勢,打造數字人產業創新高地。
《計劃》提出了發展目標,“到2025年,北京將培育1—2家營收超50億元的頭部數字人企業、10家營收超10億元的重點數字人企業,建成10家校企共建實驗室和企業技術創新中心,打造5家以上共性技術平臺,培育20個數字人應用標桿項目,建成2家以上特色數字人園區和基地等目標?!?/p>
但行業現狀似乎與《計劃》提出的目標仍有一定距離,21世紀經濟報道記者多方了解到,目前來看,一些企業在打造數字人的過程中仍會遇到渲染品質較低、制作成本高昂,IP打造周期長等難題。
京東集團副總裁、京東智能產品與服務部總裁何曉冬在接受21世紀經濟報道采訪時表示,數字人是數字原生、人機交互等技術落地過程中最被寄予希望的形態之一,但在實際應用的過程中,有些數字人的動作十分僵化,只能起到展示的效果,無法提供實際辦理業務的交互。
何曉東以銀行場景的數字人舉例稱,如果數字人要把整套銀行業務辦理好,需要克服幾個非常落地的問題?!笆紫仁切枰苊庠胍?,因為銀行柜臺是比較噪雜的場所。其次是銀行數字人需要和后臺的業務支持系統有效地對接,必須能夠解決很多銀行的具體業務問題?!焙螘詵|舉例稱,轉賬、取錢、改密碼等業務行為都意味著數字人在知識推理、語音推理等方面都要達到很高標準,因此這些方面的同步也是很大的挑戰。
三種商業模式
郭建君在采訪中也表達了類似看法,他表示,數字人成熟的背后一方面是技術整合能力,另一方面是IP運營能力。“數字人是一個產業鏈很長的行業,既需要底層引擎技術的發展,也需要對上層工具和生產管線的優化,才能同時滿足數字人形象好、生產效率高和成本可控的三重效果?!?/strong>
而IP運營能力體現在對數字形象打造的思路和經驗之上。郭建君表示,當前行業較為普遍的情況是,技術制作更有信心,運營思維比較欠缺。在這方面,蔚領時代正在探索的一條道路是——選擇更專業的生態伙伴合作進行商業化。
近日,蔚領時代與文娛企業海西傳媒集團組建了獨立運營的公司蔚海燦娛,推出了龔俊的數字人“霽風”,郭建君表示,后續將圍繞可互動數字IP的矩陣搭建、共創虛擬空間的構建等方面進行多重合作。
值得一提的是,利用契合特定場景的IP加快表演型數字人創新也是《計劃》的規劃的主要任務之一,其提出要“促進技術人才與藝術人才聯合創新,加快數字人IP孵化,培育創作者經濟。同時打造精品數字人品牌,支持數字人參與廣告營銷、品牌代言,加強數字人運營管理,樹立傳播正能量的數字人形象?!?nbsp;
事實上,IP運營,客戶服務和流量變現正是當前數字人主要的三種商業模式。
騰訊云近日發布的《數字人產業發展趨勢報告(2023)》指出,內容/IP型數字人主要依靠數字人的商業IP運營實現商業變現,功能服務型是交付給客戶實現變現,而虛擬分身則需要結合虛擬空間的設定和規則進行流量變現。
“數字人的制作成本和周期伴隨定制化程度的下降而遞減。三種數字人的制作方式和周期也存在差異,內容/IP型數字人更多是項目制,以定制為主;功能服務型是產品和定制化相結合,在通用產品上,進行定制化開發;而虛擬分身更多是產品制,用戶利用平臺工具產品進行數字人形象的制作并在相應虛擬場景內進行活動,一般而言,內容/IP型數字人的成本和周期最高,虛擬分身型數字人最低?!?/p>
大規模應用依賴可控成本
“數字人的大規模應用,有三個條件必不可少:高寫實度的效果、較高的生產效率和可控的成本。”在郭建君看來,雖然對比傳統離線渲染的影視級別的寫實度效果仍然需要提升,但當前行業應用的實時渲染的技術,在生產效率、可控成本和數字人可互動性上均具備了優勢。
科技部信息通信專家、上海流程智造科技創新研究院院長賀仁龍告訴21世紀經濟報道記者,構造虛擬世界的技術正在逐漸成熟,應用的場景也日益豐富,效果也十分逼真。但在感知交互方面,數字人仍然面臨著一系列問題?!?/p>
“在創建元宇宙的過程中,會構造一個世界的秩序和邏輯,但這個世界是否有重力,重力又是多少,目前來看都是技術需要探索的方向。同時,虛擬世界的邏輯需要規律和算法生成,在這其中,如何有效地使數字人在視覺、聽覺之外,與用戶進行觸覺感知交互,也是行業面臨的難題。”
“未來超寫實的世界將以可視化為主要特征。而這需要海量的圖形運算。”郭建君認為,VR/AR終端將成為元宇宙的入口,但終端的運行依賴算力高速的運行,這其中,實時云渲染能力解決的就是把超寫實的世界帶到終端體驗上的問題。
“只有云端實時渲染在達到較高標準的情況下,才能真正帶來足夠寫實、互動、有沉浸感的圖像畫質。這也就是蔚領時代認為的GaaS(Graphics as a Service)時代到來的邏輯依據?!?/p>
郭建君認為,未來支撐實時云渲染的底層技術主要是云原生的技術,比如多GPU協同渲染,以及C+S架構來實現的單個進程輸出幾十路視頻流供幾十個玩家游玩的技術?!斑@些創新的云原生的技術是未來元宇宙的支撐,同時圍繞著類似云游戲的串流能力和云端虛擬化的能力,也是未來元宇宙所需要的?!?/p>
“一個可喜的現象是我們看到頭部渲染引擎的技術發展迅速,現在已經開始進行影視級效果的應用了?!惫ňf道。
在云原生技術之外,3D重建技術的發展也為數字人的大規模落地帶來了更多的可能性。
上述《報告》指出,2D數字人和3D數字人生成/建模方式不同,2D數字人本質是生成圖像,因此主要方式是利用深度學習技術根據視頻生成與真人相同的圖像,技術相對成熟。
“3D數字人需要建立3D模型,主要是利用軟件傳統的手工建模、靜態掃描建模(相機陣列掃描建模)、動態光場或者AI建模(3D重建技術)生成3D模型。目前手工建模和靜態掃描建模技術較為成熟且應用廣泛,利用3D重建技術或動態光場重建可極大節約建模時間,提升建模效率,是未來重要布局方向。”報告指出。
而在科大訊飛總裁吳曉如看來,機器想更自然地與人類進行交互,需要通過聽覺、視覺、語義以及各種傳感器的組合去獲取更多的有用信息,AI感知方式必然要從單模態發展到多模態,逐步擬人化。
2021年10月,科大訊飛正式發布AI虛擬人交互平臺,它具有多模感知、多維表達、情感貫穿、自主定義四大交互特點。可以在客戶的不同業務場景下進行AI虛擬人賦能,提供一站式的AI虛擬人應用服務。
“科大訊飛推出的數字人目前已經開始把視覺、手勢、視線和語音結合起來,實現數字虛擬人交互的多維表達。”吳曉如在接受21世紀經濟報道等媒體采訪時說道。
出品:南財合規科技研究院數字娛樂課題組
策劃:曹金良
統籌:諸未靜
研究員:諸未靜、蔡姝越、孫煜、吳立洋、張梓桐
本期作者:張梓桐
設計:陳珊