999热,97a**,aaaa级黄色片,亚洲最大毛片,91黄在线免费观看,日韩亚洲精品视频,91亚洲精品国产成人

上線文生視頻功能,騰訊大模型再追趕

2024-12-04 16:50:53 869閱讀

上線文生視頻功能,騰訊大模型再追趕

11月底就被劇透的騰訊混元大模型文生視頻功能,在123日正式上線。目前該模型已上線騰訊元寶App,用戶可在AI應(yīng)用中的“AI視頻板塊申請試用,企業(yè)客戶通過騰訊云提供服務(wù)接入,目前API(應(yīng)用程序編程接口)同步開放內(nèi)測申請。自OpenAI發(fā)布Sora,國內(nèi)外的視頻生成式大模型輪番搶鏡,在國內(nèi)快手和字節(jié)跳動正面交鋒,阿里云、MiniMax、美圖等也有備而來,和同行相比,騰訊混元不算快節(jié)奏。

在提示框輸入一段描述,就可以生成一段視頻,從使用流程看,騰訊混元大模型的文生視頻功能和類似產(chǎn)品無異。在這部分,混元給用戶提供了轉(zhuǎn)場視頻、多動作視頻、超寫實視頻三種靈感提示。

北京商報記者體驗發(fā)現(xiàn),用戶可以選擇寫實、動畫、電影、黑白、賽博朋克五種視頻風(fēng)格及五種比例。高級指令部分的選擇更多,包括景別、光線、鏡頭運動等,其中景別包括特寫、近景等五種,鏡頭運動包括固定鏡頭、手持攝影、拉近鏡頭等14種。

根據(jù)騰訊提供的評測報告,騰訊混元視頻生成模型與國內(nèi)兩個同類模型的持續(xù)時間都是5秒,在文本對齊方面的得分分別是61.8%、62.6%、60.1%,運動質(zhì)量方面分別是66.5%61.7%、62.9%,視覺質(zhì)量方面分別是95.7%95.6%、97.7%。和GENN-3 alphaWeb)相比,騰訊混元視頻生成模型的持續(xù)時間少一秒,文本對齊高14.1個百分點,運動質(zhì)量高11.8個百分點,視覺質(zhì)量持平。

騰訊混元多模態(tài)生成技術(shù)負責(zé)人凱撒介紹,混元基于跟Sora類似的DiT架構(gòu),在架構(gòu)設(shè)計上進行了升級。混元視頻生成模型適配新一代文本編碼器提升語義遵循,其語義跟隨能力可以更好地應(yīng)對多個主體描繪,實現(xiàn)更細致的指令和畫面呈現(xiàn);采用統(tǒng)一的全注意力機制,使每幀視頻的銜接更流暢,實現(xiàn)主體一致的多視角鏡頭切換;通過圖像視頻混合VAE3D變分編碼器),讓模型在細節(jié)表現(xiàn)有明顯提升,特別是小人臉、高速鏡頭等場景。

當(dāng)天,騰訊宣布開源該視頻生成大模型,該模型已在Hugging Face平臺及Github上發(fā)布,包含模型權(quán)重、推理代碼、模型算法等完整模型,企業(yè)與個人開發(fā)者可免費使用和開發(fā)生態(tài)插件。目前,騰訊混元已開源旗下文生文、文生圖和3D生成大模型。

對于為何選在此時上線文生視頻功能,凱撒的回答是:一個月前我們訓(xùn)練完了,現(xiàn)在上線水到渠成。業(yè)內(nèi)人士更關(guān)心的是,該功能和同行相差的幾個月時間差對騰訊的壓力,視頻生成的成熟度還沒有到外界想象得那么高,現(xiàn)階段還是要自己做技術(shù)打磨,凱撒說。

在和北京商報記者交流時,比達分析師李錦清表示,文生視頻的實現(xiàn)難度更高,但商業(yè)空間更大,短期內(nèi)競爭門檻不會馬上建立,行業(yè)和企業(yè)有共性或特性的問題要解決,比如數(shù)據(jù)就是個檻

根據(jù)GIR(GlobalInfoResearch)調(diào)研,2023年全球文生視頻大模型收入大約720萬美元,預(yù)計2030年達到22.19億美元,20242030年期間,年復(fù)合增長率CAGR有望達到56.6%。

北京商報記者 魏蔚

.portal{background: #f8f8f8; padding: 10px; border-radius: 5px;line-height: 24px;}
文章版權(quán)聲明:除非注明,否則均為mk體育-在線官網(wǎng)直播平臺原創(chuàng)文章,轉(zhuǎn)載或復(fù)制請以超鏈接形式并注明出處。

目錄[+]