隨著數(shù)字化浪潮的不斷推進(jìn),我國數(shù)字經(jīng)濟(jì)的發(fā)展布局越發(fā)明晰。今年的政府工作報告提出,要深入推進(jìn)數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展。深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開展“人工智能+”行動,打造具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。
這是政府工作報告首次提出開展“人工智能+”行動,標(biāo)志著人工智能技術(shù)在各行業(yè)的廣泛應(yīng)用將開啟新篇章。作為人工智能技術(shù)的重要應(yīng)用,數(shù)字人產(chǎn)業(yè)也備受矚目?!皵?shù)字人”如何誕生?數(shù)字人產(chǎn)業(yè)發(fā)展現(xiàn)狀如何?哪些應(yīng)用領(lǐng)域?qū)⒊蔀闊狳c?未來可能面臨哪些挑戰(zhàn)和機(jī)遇?帶著這些問題,中國經(jīng)濟(jì)時報記者采訪了多家相關(guān)企業(yè)及多位行業(yè)專家。
數(shù)字人是指通過計算機(jī)技術(shù)、人工智能技術(shù)等手段,創(chuàng)建出的具有人類特征、能夠模擬人類行為的虛擬形象。從功能應(yīng)用來看,其主要包括內(nèi)容/IP型數(shù)字人、功能服務(wù)型數(shù)字人和虛擬分身數(shù)字人三大類。它們可以在虛擬世界中存在,并與現(xiàn)實世界進(jìn)行交互,被廣泛應(yīng)用于娛樂、教育、醫(yī)療、游戲、營銷等多個領(lǐng)域。
技術(shù)進(jìn)步是數(shù)字人產(chǎn)業(yè)發(fā)展的第一推動力。近年來,隨著計算機(jī)圖形學(xué)、深度學(xué)習(xí)、虛擬現(xiàn)實等技術(shù)的不斷突破和進(jìn)步,數(shù)字人在表情、動作、語音等方面的模擬能力日益增強(qiáng),逼真度不斷提高。尤其是極具顛覆性的文生視頻模型Sor a的推出,其能夠根據(jù)文本指令生成多種風(fēng)格、不同畫幅、最長為一分鐘的高清視頻。在業(yè)內(nèi)看來,Sora的出現(xiàn)將成為AI認(rèn)知世界并與之進(jìn)行交互的里程碑,也讓通用人工智能(AGI)到來的時間提前,將給整個產(chǎn)業(yè)帶來巨大進(jìn)步。而對于數(shù)字人產(chǎn)業(yè)來說,Sora深入的理解能力、強(qiáng)大的生成能力以及生動的互動能力,也給數(shù)字人在未來構(gòu)建更加逼真的虛擬世界提供了新的視角和方法。