元創說

大模型模式,正在新一波AIGC的浪潮里被再度驗證。

從AI畫畫的出圈chatgpt生成視頻,到現如今的火爆,面向大眾的爆款產品接口背后,無不是大模型技術的突破創新。

而當這種“大力出奇跡”的技術路徑價值愈發凸顯,行業內外也不禁好奇:

AI繪畫、版搜索之后,下一個大模型的爆發點會出現在何處?

今天分享的文章,帶大家一起走進「AI生成視頻」的黑科技~

視頻領域的技術革命已近在眼前:

從技術的角度來說,在大語言模型迭代進化的同時,谷歌、Meta等大廠在視頻自動生成領域已有更深層的探索。

而從商業的視角來看,AIGC在文本、音頻、視頻、游戲等等行業中,成長空間巨大。AI生成視頻將在5年后迎來較為廣泛的規模應用。

見了網友之后全是照片_chatgpt生成視頻_鄭爽整容后張翰驚呆視頻

圖源:量子位智庫

AIGC下一站:視頻生成

不妨先展開看看相關領域的技術進展。

谷歌:和

就在刷屏之際,谷歌AI生成的一段視頻突然爆火,一時分走不少討論度。

背后的AI模型名為。只需提供一段提示詞,這個文本轉視頻(Text-to-)模型分分鐘就能生成長達兩分鐘的視頻。

不僅時長遠超早期的文生視頻模型chatgpt生成視頻,生成的視頻還頗具故事性。

比如給它這樣一段場景描述:

一只逼真的泰迪熊正在潛水;隨后它慢慢浮出水面;走上沙灘;這是鏡頭拉遠,泰迪熊行走在海灘邊篝火旁。

就能得到一個這樣的視頻片段:

鄭爽整容后張翰驚呆視頻_chatgpt生成視頻_見了網友之后全是照片

除此之外,谷歌還推出過基于擴散模型的 。其特點是分辨率高,同時可以理解不同的藝術風格和3D結構。

見了網友之后全是照片_chatgpt生成視頻_鄭爽整容后張翰驚呆視頻

Meta:Make-A-

在“拿嘴做視頻”這方面,Meta也有所布局。

Meta的文生視頻模型名為Make-A-,同樣是文本圖像生成模型的升級版,主要由三部分組成:

不僅給出一句“馬兒喝水”,Make-A-就能生成出一段“紀錄片”畫面來:

見了網友之后全是照片_chatgpt生成視頻_鄭爽整容后張翰驚呆視頻

這個AI模型還具備將靜態圖像轉成視頻、根據前后兩張圖片生成一段視頻,以及基于一段原視頻生成新視頻的能力。

鄭爽整容后張翰驚呆視頻_chatgpt生成視頻_見了網友之后全是照片

百度:

國內,百度也把文心大模型的能力,運用到了智能視頻合成平臺中。

能夠實現圖文自動轉視頻,即把文字腳本、視頻內容搜索、素材處理、音視頻對齊,以及剪輯這5個步驟自動化。

其中涉及的語義分析、素材相關度打分等環節,就都是基于文心大模型訓練實現的。

chatgpt生成視頻_見了網友之后全是照片_鄭爽整容后張翰驚呆視頻

從技術的發展可以看出,在語言大模型、圖像大模型之后,多模態大模型已經成為了新的趨勢。視頻就是其中具有代表性的一個應用領域。

而從商業化的角度來看,文化娛樂、教育、傳媒等諸多領域,本身就對基于AI的可視化內容有強烈需求。

根據中信建投對各類內容未來可AI制作比例的測算,在視頻成為信息主要表達載體的當下,無論是在游戲、短視頻、直播,還是影視等領域,AI視頻內容生成都將成為AIGC的主要關注方向。

見了網友之后全是照片_鄭爽整容后張翰驚呆視頻_chatgpt生成視頻

并且在2022年,DALL·E、、 等多個高質量文生圖大模型的“轟炸”之下,一個新的市場規律已經得到驗證:

當生成質量提高到專業水平時,原本AI生成內容的商業化瓶頸,如變現困難等,將得到突破。

之火,正在加速AIGC走向成熟

不得不說的是,盡管的火爆,讓大模型時代的AIGC獲得了空前關注,但AIGC產業,還只能說是一個“新生兒”。

根據發布的2022年新興技術成熟度曲線,生成式AI目前還處于“技術萌芽期”,預計距離生產成熟期還有5-10年的時間。

鄭爽整容后張翰驚呆視頻_chatgpt生成視頻_見了網友之后全是照片

但隨著大模型這樣的技術底座作用愈發凸顯,越來越得到重視,不可否認的是,這個新生兒成長態勢正呈現出一種加速狀態。

并且,經過文生圖、的驗證,AIGC在其他垂直領域中的可拓展空間已經可以預見。

量子位智庫預測,2030年,AIGC市場規模有望超過萬億人民幣。

鄭爽整容后張翰驚呆視頻_chatgpt生成視頻_見了網友之后全是照片

在這個過程中,如何搶占先機chatgpt生成視頻,將成為中國產業界亟需關注的命題。

這一回,我們能否走在世界之先?

免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。