證券日報微信

證券日報微博

智譜發(fā)布首個能生成漢字的開源文生圖模型CogView4

2025-03-04 16:13  來源:證券日報網(wǎng) 

    本報訊 (記者謝嵐見習記者梁傲男)3月4日,北京智譜華章科技有限公司(以下簡稱“智譜”)發(fā)布2025開源年的首個模型——CogView4,這是首個支持生成漢字的開源文生圖模型,也是首個遵循Apache2.0協(xié)議的圖像生成模型。

    記者了解到,CogView4在DPG-Bench基準測試中綜合評分排名第一,在開源文生圖模型中達到SOTA(最先進的)水平。DPG-Bench(DensePromptGraphBenchmark)是一個用于評估文本到圖像生成模型的基準測試,主要關(guān)注模型在復雜語義對齊和指令跟隨能力方面的表現(xiàn)。

    在業(yè)內(nèi)人士看來,CogView4具有兩大技術(shù)領(lǐng)先性。

    首先,CogView4支持中英雙語提示詞輸入,擅長理解和遵循中文提示詞,是首個能夠在畫面中生成漢字的開源文生圖模型,能更好地滿足廣告、短視頻等領(lǐng)域的創(chuàng)意需求。在技術(shù)實現(xiàn)上,CogView4將文本編碼器從純英文的T5encoder換為具備雙語能力的GLM-4encoder,并通過中英雙語圖文進行訓練,使CogView4模型具備雙語提示詞輸入能力。

    其次,CogView4支持輸入任意長度提示詞,能夠生成范圍內(nèi)任意分辨率圖像,不僅使用戶創(chuàng)作更加自由,也提升了訓練效率。CogView4模型實現(xiàn)了任意長度的文本描述和任意分辨率圖像的混合訓練范式。

    智譜相關(guān)人士表示:“作為國內(nèi)最早的開源大模型公司,智譜始終致力于推動AI普惠。2025年是智譜開源年,我們還將陸續(xù)開源基礎模型、推理模型、多模態(tài)模型、Agent模型等。在這片孕育智慧的熱土上,我們愿作深扎的根脈,以開源為信仰,以技術(shù)為養(yǎng)分,托舉AGI之樹的參天成長。”

(編輯 郭之宸)

-證券日報網(wǎng)
  • 24小時排行 一周排行

版權(quán)所有《證券日報》社有限責任公司

互聯(lián)網(wǎng)新聞信息服務許可證 10120240020增值電信業(yè)務經(jīng)營許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號京ICP備19002521號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注