999热,97a**,aaaa级黄色片,亚洲最大毛片,91黄在线免费观看,日韩亚洲精品视频,91亚洲精品国产成人

清華博士后用AI做短劇,不做C端“玩具”,瞄準(zhǔn)工業(yè)級落地

2024-11-26 18:00:03 333閱讀

圖片

作者丨劉楊楠

編輯丨海腰

圖源丨文心一格

“大模型是一種能力升級,而不是新場景?!?/p>

這是北京聚力維度科技有限公司(以下簡稱“聚力維度”)創(chuàng)始人&CEO趙天奇對大模型浪潮的底層判斷。

在他看來,今天的大模型浪潮不一定要追求開天辟地的殺手級應(yīng)用。

“大模型是能力升級,應(yīng)用場景是現(xiàn)成的。用新技術(shù)實現(xiàn)傳統(tǒng)場景的創(chuàng)新容易,但是應(yīng)用場景創(chuàng)新很難,用AI把原來的應(yīng)用變得更強也是一件好事?!彼硎尽?/p>

聚力維度成立于2016年,前身為北京十二維度科技公司。目前,聚力維度已成長為涵蓋科技公司、傳媒公司及香港分公司等多元化板塊,業(yè)務(wù)覆蓋全國。

趙天奇是一位帶有濃厚科學(xué)家氣息的創(chuàng)業(yè)者,博士就讀于北京郵電大學(xué),師從徐大雄院士;博士后就讀于清華大學(xué),師從戴瓊海院士。創(chuàng)業(yè)10余年,他帶領(lǐng)團隊多次填補3D領(lǐng)域的技術(shù)空白。

圖片

聚力維度創(chuàng)始人&CEO趙天奇,圖片來源:聚力維度

2016年,趙天奇帶團隊用AI 100%實現(xiàn)全自動化的2D轉(zhuǎn)3D內(nèi)容;2021年,聚力維度用一個攝像頭實現(xiàn)全身骨骼和面部表情的高精度捕捉,并實時驅(qū)動3D數(shù)字人跳舞;2024年,聚力維度聯(lián)合華為云發(fā)布國產(chǎn)多模態(tài)3D視頻大模型——賽媧大模型,模型支持文字、聲音、視頻等多模態(tài)輸入,生成3D AI演員,并實現(xiàn)真人級別AI表演。

趙天奇是一位技術(shù)主義者。“我認為世界上很多問題都能用科技解決,可能有人認為文化創(chuàng)作好像不行,但我還是想盡可能用技術(shù)解決人類可能遇到的各種問題。”趙天奇說。

影視制作,正是趙天奇多年來死磕的“技術(shù)死角”。

敲開影視制作的大門

小時候,趙天奇也曾夢想長大后成為科學(xué)家,用科學(xué)改變世界。

很長一段時間里,趙天奇受還原論思想的影響,認為科學(xué)研究要無限向下,物質(zhì)組成的下一層決定了上一層的運動規(guī)律,而物理是關(guān)于一切物質(zhì)的道理,是解決一切問題的關(guān)鍵。

高考后,趙天奇如愿報考物理專業(yè)。但趙天奇很快發(fā)現(xiàn),脫離現(xiàn)實世界的理論研究也很難改變世界。“當(dāng)你研究大腦的時候,最多研究到神經(jīng)元就夠了,再往下研究構(gòu)成神經(jīng)元的原子分子是沒有意義的?!壁w天奇說。

在此后的學(xué)術(shù)生涯中,趙天奇逐漸從理論物理研究轉(zhuǎn)向了和現(xiàn)實世界連接更緊密的人工智能。

2011年,趙天奇到北京郵電大學(xué)讀博,研究3D顯示與內(nèi)容技術(shù),師從信息光學(xué)界專家徐大雄院士。就在趙天奇讀博的第二年,谷歌將16000臺電腦連在一起,在上千萬張Youtube照片中認出了一只貓,名為“深度學(xué)習(xí)”的AI技術(shù)浪潮開始走進大眾視野。于是,趙天奇從一直很感興趣的影視制作出發(fā),開始研究如何用AI實現(xiàn)3D內(nèi)容制作。

當(dāng)時,大量3D內(nèi)容由2D內(nèi)容轉(zhuǎn)換而來,整個過程需要耗費大量人力,趙天奇便用計算機視覺技術(shù)研發(fā)了自動補背景功能,將2D轉(zhuǎn)3D的制作成本降低約30%。

圖片

2012年,趙天奇成立十二維度,希望用AI在影視制作領(lǐng)域100%實現(xiàn)全自動的2D轉(zhuǎn)3D,讓技術(shù)真正和產(chǎn)業(yè)需求接軌。整個公司里,他是公司唯一的技術(shù)人員,其他人負責(zé)尋找落地方向。

巧合的是,《阿凡達》上映后,3D電影市場迅速打開。一次機緣巧合下,趙天奇在一次行業(yè)展會上接觸到了《鄭和1405:魔海尋蹤》制作方。

《鄭和1405:魔海尋蹤》制作過程中發(fā)生了小插曲,急需有人來救火,便找到了此前在活動上認識的十二維度。當(dāng)時,趙天奇連夜坐著臥鋪趕到電影片方,路上還在修改第二天要展示的算法。第二天,趙天奇給制作方現(xiàn)場制作了幾個鏡頭,成功贏得競標(biāo),收獲了一筆200萬的合作。

這是十二維度接到的第一筆大單,也是十二維度進軍影視后期制作的敲門磚。此后,趙天奇擴充了團隊,陸續(xù)參與了《新警察故事》《尋龍訣》《饑餓游戲》等院線電影的2D轉(zhuǎn)3D環(huán)節(jié)。

但趙天奇并未滿足于此?!拔疫€是希望用AI 100%實現(xiàn)全自動的2D轉(zhuǎn)3D技術(shù),這是我從技術(shù)切入這件事的最初目的?!壁w天奇說。

2016年,十二維度終于完成了AI全自動完成2D轉(zhuǎn)3D的階段性目標(biāo)。

“好像什么都可以做,但你到底要做什么?”

就在趙天奇思考公司下一步該往哪走的時候,大洋彼岸又送來一份參考答案。

2016年,谷歌DeepMind基于深度學(xué)習(xí)算法開發(fā)的圍棋機器人AlphaGo戰(zhàn)勝圍棋天才李世石,AI這個有些晦澀的技術(shù)概念第一次闖入大眾視野,商業(yè)世界也迅速擁擠起來。

彼時,國內(nèi)各界對人工智能的熱情同樣被點燃:“成為中國DeepMind”的故事在資本圈屢試不爽;AI四小龍迅速成長為商業(yè)新星;工業(yè)檢測、安防等“AI+”創(chuàng)業(yè)方向成為宇宙中心,甚至原先不在AI圈的人也想從中分一杯羹。

亂花漸欲迷人眼。見此盛況,趙天奇腦海中始終盤繞著一個問題:“好像什么都可以做,但到底要做什么?”

最終,趙天奇還是決定繼續(xù)探索AI與影視的結(jié)合?!叭绻麤]有AI,影視制作是一個小行業(yè)和非技術(shù)行業(yè);但有了AI,影視就是一個大行業(yè),更是一個技術(shù)行業(yè)?!壁w天奇表示。

當(dāng)時,蘇寧收購聚力傳媒,并向趙天奇拋出橄欖枝,雙方共同成立聚力維度,希望徹底實現(xiàn)全流程的人工智能影視制作,讓每個創(chuàng)作者都能制作自己的作品。十二維度成為聚力維度全資子公司。

圖片

2016年也是趙天奇到清華大學(xué)攻讀博士后,做AI影視研究的第二年,他的導(dǎo)師是中國工程院院士戴瓊海。趙天奇還記得,第一次見面時,戴院士就告訴他:“北郵和清華都是工科院校,工科院校就是要做落地?!?/p>

“我看論文第一眼會看它有沒有用,很多人都是為了發(fā)論文而發(fā)論文,可能有些文章很有用,但作者都不知道?!壁w天奇說。

聚力維度成立的頭五年,趙天奇帶領(lǐng)團隊進行了一項“前無古人”的技術(shù)攻堅。

當(dāng)時,從“人人都能做影視”的終極愿景出發(fā), 趙天奇和團隊幾乎用了一整年的時間選定技術(shù)方向。在多次推翻和重建中,趙天奇的思路逐漸清晰。

回歸影視制作的第一性原理,要實現(xiàn)全流程AI影視制作,首先就要排除實拍,在數(shù)字世界里解決影視制作問題。

2017年,趙天奇幾乎用一整年時間調(diào)研了全國各地的動畫公司。他發(fā)現(xiàn),動畫片的制作成本中,80%來自K動畫(Keyframe,設(shè)置關(guān)鍵幀),20%來自建模,由此確定了數(shù)字人的大方向。

數(shù)字人有2D、3D之分,考慮到影視作品的本質(zhì)是拍世界,不能只是簡單拼接畫面鏡頭,世界是三維的,因此從第一天起就要走3D路線。

圖片

賽博演猿登陸聯(lián)想應(yīng)用商城

3D數(shù)字人制作也有“生成”與“捕捉”兩條路線之分。2016年的AI還不能直接生成3D內(nèi)容,GAN能夠生成2D圖像,但生成效果“一眼假”,根本無法支持影視級制作,由此最終確定了“3D捕捉數(shù)字人”路線。

但當(dāng)時主流的3D捕捉技術(shù)大多依賴于大量體感設(shè)備,真人佩戴做出動作,再錄入數(shù)據(jù)。整套流程下來,光是硬件設(shè)備的采購成本至少就要百萬級,很多個人創(chuàng)作者顯然沒有這些資源儲備。

因此,要想真正實現(xiàn)“人人都能做影視”,最理想的情況是,直接用一個普通攝像頭完成面部表情、手勢、肢體動作的捕捉與驅(qū)動?!按饲昂苌儆腥讼氲竭@一點,因為這需要從真實的影視制作流程出發(fā),倒推出這個技術(shù)方向。”趙天奇說。

最終,趙天奇決定走這條從沒人走過的路。

沒人走過意味著所有的坑都要親自踩,從數(shù)據(jù)到表征,到整個算法框架都要從零開始,只能從頭自己做。趙天奇在公司建立了一個名為“科幻成真”的實驗室,負責(zé)全部研發(fā)工作。

道路是曲折的,但結(jié)局是光明的。2021年,聚力維度終于實現(xiàn)用單目攝像頭完成高級別數(shù)字人的表情、手勢、動作捕捉。趙天奇表示,要做成這件事,不僅需要技術(shù)創(chuàng)新,更需要對影視制作的深刻理解。此前參與院線電影制作的經(jīng)歷,無形中也成為了聚力維度成功的踏腳石。

趙天奇透露,這五年間,也曾有投資人或潛在客戶拋出橄欖枝,表示愿意投入足夠的資金,讓聚力維度做一些更快看到回報的事情。

“當(dāng)時我比現(xiàn)在還“軸”,幾乎天天都在拒絕?!壁w天奇坦言,“我認為‘AI+’一切都有機會,但我只想找一個我認為市場大且我感興趣的方向來做。”

做工具,不做玩具

ChatGPT發(fā)布后,趙天奇意識到,或許可以重拾之前被放棄的3D生成路線了。

趙天奇帶著團隊第一時間測試了ChatGPT的能力,明顯感到GPT-3.5的效果已經(jīng)遠超GPT-2。2023年年中,聚力維度便開始探索3D視頻生成模型。

直到今年2月,Sora一經(jīng)發(fā)布便成為行業(yè)標(biāo)桿,點燃了全球創(chuàng)業(yè)者對多模態(tài)模型的興趣,也讓60s的長視頻生成成為各家企業(yè)的競爭方向。

不過,在和影視行業(yè)內(nèi)部交流過后,趙天奇發(fā)現(xiàn),對于影視制作本身來說,卷時長和卷參數(shù)都沒有意義,真正的痛點在于能否有一個模型,實現(xiàn)多個鏡頭間的穩(wěn)定可控。

“實際的影視制作中長鏡頭非常少,一個鏡頭可能幾秒鐘就夠了,大家更需要兩個鏡頭之間的穩(wěn)定可控。”趙天奇說。例如兩個人物角色正在對話,鏡頭隨著對話在兩人之間切換,如果鏡頭切換后兩個鏡頭中的世界變得前后不一致,觀眾就會“出戲”,無法形成一個邏輯完整的影視作品。

這種符合世界運行規(guī)律的、穩(wěn)定可控的內(nèi)容生成,恰恰是Sora所代表的2D路線最大的難點。“從技術(shù)角度來說,2D生成模型和3D生成模型是兩條完全不同的技術(shù)路線。2D生成的難點在于單個及多個畫面間的穩(wěn)定可控,而3D生成路線的難點在于3D數(shù)據(jù)的獲取?!壁w天奇表示。

而聚力維度此前攻克2D轉(zhuǎn)3D以及單目攝像頭3D捕捉技術(shù)讓他們積累了大量3D數(shù)據(jù),這便邁出了3D生成模型最艱難的第一步。

2024年5月,聚力維度聯(lián)合華為云發(fā)布國產(chǎn)多模態(tài)3D視頻大模型——賽媧大模型。該模型支持文字、聲音、視頻等多模態(tài)輸入,可以生成3D AI演員實現(xiàn)真人級別的AI表演;支持任意時長;同時生成視頻中的3D對象在不同鏡頭與運動中完全一致,可精細化編輯,能準(zhǔn)確可控地講出影視故事,真正實現(xiàn)全流程AI影視制作,可用于商業(yè)級的影視、短劇、廣電節(jié)目制作等。

“我們的思路是先造人、造世界,再讓這個世界的人進行表演,那他的表演邏輯自然是有一致性的,沒有能力發(fā)生變化了?!壁w天奇說。

有了技術(shù),接下來的問題是,如何切入產(chǎn)業(yè)?

目前市面上的AI產(chǎn)品大致有兩類落地思路:一類是從“玩具”到“工具”,將產(chǎn)品開放給C端客戶,搜集到足夠多的用戶需求和數(shù)據(jù)后,從中篩選出更聚焦的產(chǎn)業(yè)機會,進一步落地產(chǎn)品;一類則是直接瞄準(zhǔn)工業(yè)級機會,打造“工具”型產(chǎn)品,提供全新的生產(chǎn)力。

圖片

央視網(wǎng)虛擬主播小C對話《中國奇譚》

趙天奇選擇了后者,讓AI成為影視制作行業(yè)真正的生產(chǎn)力工具。

影視行業(yè)覆蓋極廣,院線電影、電視劇、綜藝節(jié)目、廣告科教、網(wǎng)劇、網(wǎng)絡(luò)大電影、短劇等均可涵蓋在內(nèi),具體選擇什么方向切入呢?

聚力維度選擇了近兩年勢頭最猛的短劇。

“短劇是對成本最敏感,上下游分工最清晰,且上升勢頭最快的場景?!壁w天奇說。公開數(shù)據(jù)顯示,2023年中國微短劇市場規(guī)模約374億元,同比上升約268%,預(yù)計今年將超過500億元,到2027年市場規(guī)模有望達到1000億元。

據(jù)趙天奇透露,聚力維度未來將和高校合作,對編導(dǎo)傳媒方向的學(xué)生展開聯(lián)合培訓(xùn)?!澳壳暗腁I還無法代替導(dǎo)演,AI工具的核心價值是更高效地實現(xiàn)創(chuàng)作者的創(chuàng)意。而學(xué)生群體數(shù)量大、創(chuàng)作需求旺盛,更容易接受新事物,從就業(yè)角度來看,掌握AI技能也為他們提供了更多就業(yè)可能?!?/p>

不過,在趙天奇看來,今天的市場上,還沒有真正的“AI短劇”,“AI短劇”也尚未形成一個真正的產(chǎn)業(yè)。未來,他希望能夠?qū)崿F(xiàn)工業(yè)級真AI影視制作?!肮I(yè)級”要求最終作品不穿幫,讓觀眾看不出內(nèi)容是AI生成的,且愿意為之付費;而“真AI”要求整個影視生產(chǎn)制作流程中絕大多數(shù)成本都由AI完成。

未來,在落地產(chǎn)業(yè)的過程中,隨著產(chǎn)品不斷成熟,積累一定用戶規(guī)模,整個行業(yè)也逐漸形成共識后,聚力維度會考慮將產(chǎn)品面向C端開放?!霸谛袠I(yè)還沒有形成一定規(guī)模和共識,尤其在目前的資本環(huán)境下,直接面向to C是一個不太符合商業(yè)規(guī)律的選擇?!彼忉尩馈?/p>

影視行業(yè)最大的痛苦,來源于“不能”

關(guān)于AI對內(nèi)容行業(yè)的影響,輿論有不少批判的聲音。國內(nèi)外均有媒體直言,“互聯(lián)網(wǎng)正在被AI生產(chǎn)的垃圾內(nèi)容侵占”。

“某種程度上,這是一種傳統(tǒng)思維的陷阱。”趙天奇表示。

畢竟,即使沒有AI,在人類創(chuàng)作者主導(dǎo)的UGC內(nèi)容生產(chǎn)模式下,互聯(lián)網(wǎng)上依然存在大量低質(zhì)內(nèi)容。在趙天奇看來,“用AI提高內(nèi)容生產(chǎn)效率”和“對AI進行內(nèi)容管控”是兩個并行存在的問題,聚力維度的目標(biāo)是實現(xiàn)前者。

“人類最大的痛苦來源于‘不能’?!壁w天奇說,這才是影視行業(yè)多年的痛苦來源。

趙天奇和影視行業(yè)內(nèi)部溝通時發(fā)現(xiàn),影視行業(yè)的最大痛點在于,生產(chǎn)力約束導(dǎo)致整個行業(yè)效率很低,是一個不健康的勞動密集型產(chǎn)業(yè)。同時,內(nèi)容創(chuàng)作和受眾的消費喜好也有很大不確定性,制作方便需要更高的投入來彌合可能的風(fēng)險。

以電影制作為例,一部電影在商業(yè)上是否成功的標(biāo)準(zhǔn)是“票房”,為了實現(xiàn)高票房,制作方需要組建豪華團隊,包括知名導(dǎo)演編劇,當(dāng)紅流量演員,最好的拍攝、后期以及宣發(fā)團隊,以此來盡可能吸引更多人貢獻票房。在此基礎(chǔ)上,電影制作周期長達數(shù)月到數(shù)年不等,投入成本達到百萬級、千萬級,甚至上億級。

正如趙天奇所言:“電影是奢侈品,本質(zhì)上是一個投入越高、風(fēng)險越低的事情?!奔词箤⒆詈玫馁Y源都堆在一部電影上,電影上映后,依然會出現(xiàn)票房爆冷的情況,前期投入的大量時間、資源最終都打了水漂。

這就導(dǎo)致制作電影的權(quán)利被少數(shù)人壟斷,很多編導(dǎo)、演藝方向的學(xué)生畢業(yè)即失業(yè),有才華的創(chuàng)作者苦于缺少優(yōu)質(zhì)資源而無法實現(xiàn)自己的創(chuàng)意?!昂芏嗳松蠈W(xué)的時候都想當(dāng)導(dǎo)演,但實際情況是,假設(shè)一家動畫公司有300人,可能只有兩個導(dǎo)演,因為必須有其他298個人去手K動畫,才能讓兩個導(dǎo)演把自己的故事做出來。”

而在AI的出現(xiàn),則有可能解放更多人的創(chuàng)作力,當(dāng)每個創(chuàng)作者都能夠?qū)⒆约旱膭?chuàng)意轉(zhuǎn)化為一部影視作品,整個內(nèi)容市場的蛋糕越來越大,好內(nèi)容的產(chǎn)量自然會隨之增加。

“解放生產(chǎn)力永遠都是正確的?,F(xiàn)在我只怕AI還不夠強,還沒有達到解放生產(chǎn)力的能力?!壁w天奇表示,“我認為最理想的生產(chǎn)力發(fā)展方向,是讓一件高價值的事情,以低成本的方式去做;讓一個人創(chuàng)造的價值,服務(wù)于世界上其他幾十億人。

反過來看,幾十億人創(chuàng)造的價值也都能服務(wù)于你?!?/p>

接下來,趙天奇將繼續(xù)帶領(lǐng)團隊探索AI影視下一代技術(shù)的突破口。未來,聚力維度希望借助全流程3D AI影視制作平臺賽博演猿cybactor,讓每一個有導(dǎo)演夢的人單獨完成全流程影視制作,并將降低成本到1%。

“畢竟我們一直在挑戰(zhàn)未知,總是要看向未來的?!壁w天奇說。

本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請聯(lián)系editor@cyzone.cn。

文章版權(quán)聲明:除非注明,否則均為mk體育-在線官網(wǎng)直播平臺原創(chuàng)文章,轉(zhuǎn)載或復(fù)制請以超鏈接形式并注明出處。

目錄[+]