證券日報微信

證券日報微博

智譜升級AI視頻模型為“新清影” 再豐富多模態(tài)模型矩陣

2024-11-08 17:19  來源:證券日報網(wǎng) 

    本報訊 (記者謝嵐 見習記者梁傲男)11月8日,智譜宣布,其AI視頻生成模型“清影”已全面升級為“新清影”。此次升級帶來了多項顯著改進,包括支持10秒時長、4K、60幀的超高清畫質(zhì),任意尺寸的視頻生成,即將內(nèi)置音效功能,同時進一步優(yōu)化了人體動作和物理世界的模擬精度。

    據(jù)悉,“新清影”基于CogVideoX模型的最新技術(shù)進展,以及智譜新推出的音效模型CogSound,實現(xiàn)了模型能力的全面提升。這包括圖生視頻質(zhì)量、美學表現(xiàn)、運動合理性及復雜提示詞語義理解的顯著增強,以及更精細的人物面部表演、動作連貫性和物理特性模擬。“新清影”還支持多通道生成能力,可一次性生成4個視頻,滿足多樣化需求。

    早在3個月前,作為國內(nèi)首個面向公眾開放的視頻生成產(chǎn)品,“清影”已在智譜清言App上線,用戶只需輸入一段指令或圖片,即可在30秒內(nèi)生成AI視頻。這一創(chuàng)新為影視創(chuàng)作帶來了更多可能性,如廣告制作、短視頻、表情包梗圖等。

    在“清影”發(fā)布后,GLM技術(shù)團隊先后開源了CogVideoX 2B和5B版本兩個模型,推動了視頻生成技術(shù)的普及和應(yīng)用。其中,CogVideoX-5B模型自開源以來受到了廣泛關(guān)注,并衍生出了大量的二次開發(fā)項目。

    值得一提的是,隨著本月音效模型CogSound的加入,“新清影”將新增與畫面匹配的音效功能,使視頻更加自然逼真。音效模型將于本月上線智譜清言App,與新清影一起生成有聲AI影片。智譜方面表示:“我們的理想狀態(tài)是,用戶只需提供一個好的創(chuàng)意,剩下的工作都由AI輔助完成,輕松將想法或圖片轉(zhuǎn)化為一段自帶背景音樂的影片。”

    可見,智譜在聲音模態(tài)領(lǐng)域也實現(xiàn)了人聲、音效、音樂的多鏈路布局。兩周前發(fā)布的GLM-4-Voice情感語音模型,以及即將上線的音效模型CogSound,共同完善了智譜基于圖像、視頻和聲音的多模態(tài)模型矩陣。這意味著智譜在多模態(tài)和工具兩個維度上都朝著AGI的目標邁出了一小步。

    智譜成立于2019年6月份,起源于清華大學計算機系知識工程實驗室,專注于開發(fā)新一代認知智能大模型。一直以來,智譜以對標OpenAI全模型產(chǎn)品線為線索,陸續(xù)研發(fā)了包括文本、代碼、圖像、Agent等方面的自研模型和產(chǎn)品矩陣。

    智譜相關(guān)負責人對《證券日報》記者表示,生成視頻將為影視工作者、短視頻創(chuàng)作者提升產(chǎn)量、產(chǎn)能,在其生產(chǎn)流程中發(fā)揮重要作用。不到一年時間,生成視頻技術(shù)在視頻時長、生成速度、分辨率、一致性等方面已經(jīng)顯示出長足進步。“新清影”往前又邁進了一步,未來,智譜將攜手合作伙伴,基于更豐富的視覺內(nèi)容,產(chǎn)出更好的AI生成視頻工具。

    從視頻直接生成音效的模型,意味著“默片Sora”將進入“有聲電影時代”。在業(yè)內(nèi)人士看來,隨著音效模型CogSound的加入,智譜多模態(tài)大模型家族在聲音模態(tài)方面實現(xiàn)了人聲、音效的多鏈路布局,使得智譜基于圖像、視頻和聲音的多模態(tài)模型矩陣更為豐富。

(編輯 李波)

-證券日報網(wǎng)
  • 24小時排行 一周排行
  • 深度策劃

洞察半年報新動能

產(chǎn)因城強,城因產(chǎn)興。工業(yè)化與城市化是經(jīng)濟社會……[詳情]

版權(quán)所有證券日報網(wǎng)

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903

京公網(wǎng)安備 11010202007567號京ICP備17054264號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注