7月28日,華為云數(shù)字文娛AI創(chuàng)新峰會2023在上海ChinaJoy期間重磅召開。本次峰會以“越AI 越FUN”為主題,齊聚AI技術大咖、行業(yè)專家、企業(yè)先鋒,共探Al新時代下數(shù)字文娛產(chǎn)業(yè)的新未來。大會上,華為云全球 Marketing 與銷售服務總裁石冀琳表示,華為云將在后續(xù)推出盤古數(shù)字人大模型,可幫助用戶 12 小時完成數(shù)字人生成。同時,她還宣稱在人工智能的加持下," 每個人都有望實現(xiàn)‘數(shù)字人’自由 "。
在影視動漫領域,華為云將渲染任務搬到云上,通過烏蘭察布云數(shù)據(jù)中心的百萬核算力資源實現(xiàn)了“萬核渲一圖”。華為云的MetaEngine云原生智能渲染引擎,將人工智能與計算機圖形技術相結合,實現(xiàn)了AI渲染加速,讓內(nèi)容制作走上快車道。在數(shù)字內(nèi)容領域,華為云盤古數(shù)字人大模型,通過對PB級的音視頻數(shù)據(jù)進行訓練,讓數(shù)字人的生產(chǎn)效率得到極大提升,讓每個人實現(xiàn)“數(shù)字人自由”。華為云還攜手客戶伙伴將AI賦能到游戲領域,例如幫助游戲美術設計師確定游戲風格,輔助世界觀框架、劇情及玩法的創(chuàng)意設計,優(yōu)化玩家的和NPC交互方式和體驗。
盤古數(shù)字人大模型包含數(shù)字人形象、動作、表情、口型、聲音等要素,官方號稱 " 每個用戶可以結合個人數(shù)據(jù)對數(shù)字人進行訓練 ",構建自己的數(shù)字人個性化大模型。數(shù)字人生成后,用戶通過文字、語音、視頻等方式生產(chǎn)驅動向量信息,從而驅動數(shù)字人生成高清視頻。
據(jù)稱,用戶可通過輸入文字(文本、Prompt 文本),在 10 秒左右生成數(shù)字人模型;通過上傳照片,在 30 秒左右生成不同類型的數(shù)字人模型。
此外,用戶還可以通過拍攝一段 5 分鐘的視頻,在一個小時內(nèi)通過訓練來生成數(shù)字人。官方表示,通過此手段生成的數(shù)字人,可保留用戶的個性化形象、表情、動作、聲音和口型信息。生成數(shù)字人后,可以通過對話完成對數(shù)字人的二次編輯和背景融合,比如發(fā)型、配飾、服裝等。