“借助AI—auto(人工智能助手),一個人就能打造一支融媒體‘軍隊’?!?月11日,2023中國新媒體大會主題活動之一,2023中國新媒體技術(shù)展在長沙舉行,眾多“黑科技”集中亮相,令人大呼過癮:“大開眼界,對未來充滿期待!”
媒體融合發(fā)展走過十年,以AIGC(人工智能生產(chǎn)內(nèi)容)為代表的人工智能技術(shù)加速迭代演進(jìn),媒體融合進(jìn)入媒體智能化快速發(fā)展新時代。但凡內(nèi)容生產(chǎn)有需求,聰明的AI都不在話下:寫作、畫畫、音樂,就連時下最火的直播帶貨,也有了它們的身影。
在華為、科大訊飛等展區(qū),記者看到,在虛擬的演播室中,它們打造的AI數(shù)字人高度復(fù)刻真人聲音和形象,在進(jìn)行融媒體內(nèi)容播報時,發(fā)音清晰且充滿情感,肢體動作、表情、口型等表現(xiàn)自然。
華為云現(xiàn)場負(fù)責(zé)人肖淑玲告訴記者,為了讓企業(yè)在AI時代構(gòu)筑更強的內(nèi)容力,基于華為云盤古基礎(chǔ)大模型能力、渲染引擎和實時音視頻能力,每個用戶可以結(jié)合個人數(shù)據(jù)進(jìn)行訓(xùn)練,構(gòu)建自己的數(shù)字人個性化大模型。數(shù)字人模型生成后,用戶通過文字、語音、視頻等方式生產(chǎn)驅(qū)動向量信息,從而驅(qū)動數(shù)字人生成高清視頻。
科大訊飛消費者虛擬人平臺業(yè)務(wù)部產(chǎn)品運營經(jīng)理龍雪琴介紹,在這個“演播室”里,用戶可以快速定制虛擬人的形象和聲音,通過簡單地輸入文本或錄音,一鍵完成音、視頻作品的輸出。
本屆技術(shù)展上,騰訊展出了自研AI通用作曲框架XMusic,用戶利用圖片、文字、視頻乃至哼唱,都可使XMusic生成對應(yīng)的樂曲。記者看到,有媒體同行掃碼輸入“搞笑”二字,XMusic很快就生成了一段節(jié)奏俏皮、旋律歡快的音樂。“視頻剪輯配樂等諸多場景可用,比較實用?!?/p>
“7*24小時不間斷開播,還能回答粉絲提問……”謙語智能帶來的AI數(shù)字人直播解決方案,也讓人眼前一亮。活躍在各平臺上的40多萬個人物形象,在不斷引導(dǎo)關(guān)注、搶購甚至秒殺……若非現(xiàn)場工作人員講解,記者很難分辨畫面里的主播是真人還是AI數(shù)字人。
據(jù)悉,本屆技術(shù)展以“智慧促深融”為主題,重點聚焦人工智能新技術(shù)新應(yīng)用、智慧媒體服務(wù)社會治理新場景等,呈現(xiàn)新技術(shù)賦能融合發(fā)展新生態(tài),將持續(xù)至7月13日。(記者 李成輝 曾冠霖)