大語言模型丨研究報告

導語:

這一現象級突圍產品的橫空出世,拉開了大語言模型產業和生成式AI(AIGC)產業蓬勃發展的序幕。海外市場,、微軟、谷歌、Meta等巨頭動作頻頻。中國市場也百花齊放:百度、阿里、華為、騰訊、360、商湯、京東、科大訊飛、字節跳動等巨頭廠商結合自身業務及戰略布局,陸續宣布研發或已發布大語言模型產品;垂直賽道及大模型解決方案廠商則錨定一個或多個行業領域,意圖打造“數據飛輪”護城河;應用層廠商則積極試水整合大模型能力,提升產品功能;眾多科技大佬也宣布進軍大模型領域進行創業。市場熱度高漲,中國人工智能產業迎來了難得的發展契機。

在熱潮背后,產業的可持續發展chatgpt算法需求,各類參與者的機會和價值點值得深思。艾瑞據此發布本篇報告,將著重分析,“的成功之路”、“中國類產業發展趨勢”、“應用場景與生態建設”、“浪潮下的‘危’與‘機’”四個問題。聚焦國內市場,辨析中國自研通用基礎大語言模型的重要意義、分析中國大語言模型產業參與角色分化路徑及原因、梳理呈現中國大語言模型產業受益鏈圖譜、辨析大語言模型對數字產業生態的重要價值。

當然,在大語言模型的優秀表現中也隱藏著社會各界對可信、數據與隱私安全、濫用風險、倫理等問題的疑慮。但毋庸置疑的是,大模型產業的蓬勃發展將助力AI工業化進程、變革海量應用交互方式、創造數字產業新的增長空間。從國家、企業到個體都需立足長遠,迎接AIGC與通用人工智能(AGI)時代的到來。

?討論1: 的成功之路

核心觀點:在說好“人話”上的優異表現,遠遠超出了大眾對于一款聊天機器人的預期,也標志著通用基礎大模型的落地突破。的成功則是一場初心+資源(數據、資金、算力、人才等)加持的長期主義勝利。

——生成式AI里程碑

生成式AI的重大突破,通用基礎大模型的勝利

相比之前的生成式對話產品, ( Pre- )在大范圍連續對話能力、生成內容質量、語言理解能力和邏輯推理能力上都得到大幅提升,是生成式AI(AIGC)極為關鍵的發展節點。“Chat”指向它的功能,“”代表它屬于生成式算法。生成式算法在過去數年中受制于RNN的內生缺陷始終發展緩慢,直到2017年 “”架構出現并解決了傳統RNN模型的問題,生成式AI才開始在預訓練的架構之上煥發生機,NLP、CV甚至多模態領域通用基礎大模型飛速演進。在模型參數量幾何級數增長以及多種訓練方式的探索之中,橫空出世,也標志著通用基礎大模型將突破NLP領域以小模型為主導的傳統發展范式。

chatgpt算法需求_浪潮發展現狀_浪潮的產品到底是什么

探秘的能力從何而來?

RHLF指令精調+能力涌現,讓大模型說好“人話”

chatgpt算法需求_浪潮發展現狀_浪潮的產品到底是什么

成功背后:秉承初心+巨量資源

不僅是多種關鍵要素的聚合,更突顯方向與路徑的重要性

的成功是一場初心+資源加持下的長期主義的勝利,GPT模型正是在密集燒錢策略后出現的,而這一明確指向商業化的產品則顯然受到從非營利向半營利轉型的發展路徑影響。

浪潮發展現狀_chatgpt算法需求_浪潮的產品到底是什么

chatgpt算法需求_浪潮的產品到底是什么_浪潮發展現狀

技術能否趕超?

存在趕超機會,但中外差距短期難以追平

與功能對標的大語言模型( , LLMs),目前國外主要有推出的、以及Meta的等;國內為百度首發的“文心一言”、360發布的大語言模型、阿里發布的“通義千問”、商湯發布的“商量”等。雖從對話和文本生成的直觀體驗看略勝一籌,但對于等國外大廠而言,克隆并不存在太高壁壘,當前暫時落后主要是出于公司戰略與技術理念差異,選擇了不同技術路線,隨著各家探索成果和新技術方法的實踐不斷推進,仍存在對GPT系列模型趕超的可能。對百度等國內大廠而言,則在數據、算力、工程化能力等關鍵要素上存在短板,短期內難以對國外領先大模型實現趕超,為跟隨者角色,長期更需要國內AI全產業鏈整體進化。

浪潮的產品到底是什么_浪潮發展現狀_chatgpt算法需求

大語言模型廠商商業化路徑

服務于各公司戰略業務拓展,形成差異化商業路線

商業模式上,已經明確指向API、訂閱制和戰略合作(嵌入微軟Bing、等軟件)三種營收方式,且已在用戶數據積累、產品布局和生態建設層面充分領先;雖有意追趕,但由于聊天機器人這樣的產品形態對于其主營的搜索引擎業務的助益有限,因此在與搜索引擎結合方面較為審慎chatgpt算法需求,更希望借助大模型能力開展“模型即服務”范式,開拓其當前市占率較低的云服務業務的市場空間。作為國內大模型的標桿企業,百度的選擇與更為類似,“文心千帆”產品劍指B端市場,意圖帶動云服務營收。

chatgpt算法需求_浪潮發展現狀_浪潮的產品到底是什么

?討論2:中國類產業發展趨勢

核心觀點:中國大語言模型(LLMs)產業或將分化出通用基礎大模型、垂直基礎大模型、應用開發和工具層廠商四大類。在全球政治經濟局勢下,自主可控是保障網絡安全、信息安全的前提,自研基石模型具有高度戰略意義。可以大膽假設,未來若形成大模型能力領先,誰就更有可能擁有從應用層到算力層的營收話語權。

中國自研通用基礎LLMs的重要意義

大廠的絕對戰略優先級,但也是一場重投入的持久戰

2023年3月中,宣布整合GPT4,實現多模態交互、大幅提升復雜長文本理解與生成能力、可控性增強,引起全球科技界震動。在國內科技及投資各領域的高度關注下,百度舉辦了“文心一言”產品發布會,雖說從產品功能、成熟度、支持用戶并發等維度距還有不足,但也是中國在這新一輪“科技軍備競賽”中的勇于嘗試與發聲,目前百度也已啟動API接口開放測試,瞄準B端市場。緊隨其后,360、阿里、華為、商湯、京東、科大訊飛、字節跳動等巨頭企業也動作頻頻。從自研通用預訓練大語言模型的必要性角度分析:在全球政治經濟局勢下,自主可控是保障網絡安全、信息安全的前提,自研基石模型具有高度戰略意義;從自研的可行性角度分析:基于前文討論的通用基礎LLMs研發所需的算力、數據、算法、人才、資金儲備等,中國僅有少數頭部互聯網企業具備研發“入場券”。宣布入局的頭部企業基于自身業務生態選擇的戰略路線也不盡相同。但可以大膽假設,未來若形成大模型能力領先,誰擁有通用基礎大模型與生態和流量入口,誰就更有可能擁有從應用層到算力層的營收話語權。

浪潮發展現狀_浪潮的產品到底是什么_chatgpt算法需求

中國LLMs產業廠商類型與定位邏輯

垂直基礎大模型廠商與應用開發廠商需在窗口期加快建立“數據飛輪”壁壘

此輪基于的大模型浪潮興起伊始,結合我國AI產業鏈與競爭格局現狀,一種判斷是:基于大模型的通用和泛化性提高,未來手握通用基礎大模型的巨頭企業會逐漸侵蝕垂直領域廠商業務。這種壓力長期來看的確存在,但大模型與產品結合,尤其在非檢索或開放域交互等場景中,需要依賴垂直領域數據和行業know-how、應用場景和用戶數據反哺、一站式端到端工程化能力等。在此窗口期,垂直領域與應用層廠商應積極將大模型能力整合入自己的技術棧,服務于產品功能優化,建立“數據飛輪”壁壘。在下游豐富的基于大語言模型、AIGC應用開發需求的影響下,還將分化出一類工具型或平臺型廠商,主要提供基于各類大模型的開發平臺服務,幫助客戶實現便捷的AIGC應用開發與落地。

chatgpt算法需求_浪潮的產品到底是什么_浪潮發展現狀

中國大語言模型產業價值鏈

產業加速發展中,產業價值鏈格局初顯

chatgpt算法需求_浪潮發展現狀_浪潮的產品到底是什么

?討論3:應用場景及生態建設

核心觀點:大語言模型產品通過變革人機交互方式、豐富下游應用產品種類、塑造“模型即服務”的新興商業模式、構建超級應用的新興生態平臺入口等,改變數字產業生態。以為例,其在搜索引擎與各類工具軟件中率先掀起應用熱潮, 則觸發生態建設開關,為國內參與者提供落地參考。此外chatgpt算法需求,基于政府及大中型企業對私有化部署的強需求,自研大模型對我國以數據為要素的價值生產具有重要意義。

大語言模型落地應用對數字產業影響

變革交互方式、豐富產品種類、塑造新興商業模式、構建生態平臺

1)變革人機交互方式:既有軟件將接入對話能力,交互界面發生變革,自然語言成為用戶發布操作指令的新模態。這一影響將從搜索引擎等知識信息平臺拓展到一切人機交互型應用。友好度和功能性的顯著提升將激活軟件服務的增量用戶市場;2)豐富產品種類:將誕生新一批AI-的應用,如創意設計、AI營銷、AI運營等領域;3)塑造新興商業模式:AI主導的“模型即服務”商業邏輯將重構應用開發流程,傳統企業可享受低成本構建應用模型的便利;4)構建新興生態平臺:超級應用的出現,本質上搭建了用戶需求與各類信息服務之間的基于自然語言交互的平臺生態,塑造了移動互聯網后新的流量入口。

chatgpt算法需求_浪潮的產品到底是什么_浪潮發展現狀

引領AI應用熱潮與應用革命

應用革命序幕拉開,應用滲透不斷加劇

被稱為AI的“時刻”,以為代表的生成式AI讓每個人命令計算機解決問題成為了可能。可對生產工具、對話引擎、個人助理等各類應用,起到協助人、服務人甚至超越人的角色。憑借此革命性突破,在搜索引擎與各類工具軟件中率先掀起應用熱潮,引起了廣大用戶對相關技術的關注與學習。海量下游應用也因此捕捉到新的技術與產業機會,希望通過各類大模型與工程化能力,將類產品能力輸送到原有的應用中,關于應用革命的序幕就此拉開。

浪潮的產品到底是什么_浪潮發展現狀_chatgpt算法需求

應用示例:通用搜索引擎

互動溯源的新搜索方式,各搜索引擎企業對標微軟布局加碼

集成了版搜索引擎的New Bing改變了檢索引擎的內容呈現邏輯,用戶在短時間內可獲取更可靠、更完整、更具備創意的答案,且因接入實時網絡數據同時滿足對數據實時性要求。憑借全新的搜索體驗,New Bing收獲了較大的用戶流量。與此同時,谷歌與百度雖均發布了與對標產品,但并未直接嵌入搜索引擎中,不過谷歌正在測試幾款集成了類對話式功能的新搜索產品;360作為國內搜索引擎追趕玩家,發布大模型產品并整合入搜索產品中,意圖搶占用戶流量。

應用示例:辦公生產工具

基礎辦公軟件革新,定價與買單情況尚未落實

2023年3月17日,微軟正式發布 ,將GPT-4與能力融入了 365全棧生產力工具,并推出匯集了 365數據的 Chat功能,較大提升了數字化辦公的智能化水平,可有效解放重復性的基礎辦公勞動力。現階段,產品計劃采用增值收費模式,但價格尚未確定;且產品應用中仍存在偶發錯誤問題,用戶是否會持續為該類產品買單存疑。目前能與微軟 對標的成型產品為谷歌的,國內的金山辦公正在圍繞AIGC與LLMs領域進行類似產品功能的研發。

應用示例:對話式AI

接入“高知、高情商大腦”,避免對話的知識與情感障礙

在出現以前,文本機器人、語音機器人、多模態數字人等對話式AI產品普遍存在知識結構不完善、只能做簡單問題回答、語義與情感理解不到位等問題,較大程度上拉低了用戶的交互體驗感。將對話式AI與大語言模型產品結合,相當于給對話系統安裝了一個更富有人類知識、智慧、情感的大腦,可改善以往對話式AI的產品痛點,完善產品功能,添加產品新賣點。

應用示例:企業服務與垂直領域應用

B端海量應用需求待滿足,G端尚處于嘗試及觀望期

在B端企業服務應用中,類產品可嵌入原有企業服務進行升級,包括知識檢索、數據分析、輔助編程、數字員工、交互硬件、數字人等企業級應用都將被重構。G端市場則相對特殊,雖存在大量潛在高價值應用場景和未滿足需求,但基于自主可控、私有化部署與可信AI需求,以及“數據煙囪”導致的高質量數據資源匱乏,使現階段G端應用還處于觀望期。但國家大數據局的成立,將加快我國政務大數據管理與體系建設。而未來自主可控的大模型對我國以數據為要素的價值生產具有重要意義。

chatgpt算法需求_浪潮的產品到底是什么_浪潮發展現狀

浪潮的產品到底是什么_浪潮發展現狀_chatgpt算法需求

觸發生態建設開關

浪潮的產品到底是什么_chatgpt算法需求_浪潮發展現狀

?討論4:浪潮下的“危”與“機”

核心觀點:各類大語言模型及AIGC相關產品可能誘發的風險不容忽視,但少數人的“叫停”并不能減緩商業巨頭和產業生態的推進步伐。同時,作為新興科技生產力,成為科技封鎖和保護主義對象的趨勢也初現端倪。我國參與者需立足長遠戰略,布局大模型技術研發、商業落地、生態建設與產業治理。基于我國企業在模型層和應用層的百花齊放,“建立生態平臺+做厚應用服務”有望打造中美大模型產業博弈的彎道超車機會。

AIGC的“達摩克里斯之劍”疑問

技術自身限制+用戶使用不當雖會產生風險隱患,但不可因噎廢食

2022年底至2023年3月,全球科技界都在為此輪生成式AI熱潮狂歡,提振AI產業發展信心的消息層出不窮:美國科技企業或布局追趕或投身下游應用開發與生態集合;中國企業也積極布局類、類產品開發,國內巨頭紛紛公開大模型研發進展與計劃。但在一片欣欣向榮中,漸漸也有反對的聲音出現:“取代人類”、“AI Risk下的叛逃”、“LLMs助推欺詐和恐怖主義”、“打開AGI潘多拉魔盒”等討論甚囂塵上。3月29日,作為曾經最重磅的支持者及聯合創始人,世界首富馬斯克與多位科研界大牛發表聯名聲明,基于倫理與設計安全標準考慮,呼吁“所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統至少6個月”將反對聲推向高潮。大模型開發與應用企業也已認識到治理的重要性,例如通過(減少人類反饋信息)、去除危險內容生成、監管框架等手段解決模型偏見、濫用等風險問題。也于4月6日發布《Our AI 》,應對安全和倫理質疑。作為突圍性產品,的革新價值已被充分印證。而AIGC技術也并非是“懸頂之劍”,圍繞其風險與倫理問題的討論與解決方案探索,將助推產業可持續發展。

圍繞新興科技生產力的國家博弈

GPT模型成為科技封鎖和保護主義對象的趨勢初現端倪

國家層面對于目前世界上最優秀(從用戶生態到商業落地層面評估)的AIGC公司——和其核心產品的態度也比較慎重。比如,意大利宣布封禁并限制處理意大利用戶信息;我國A股多家企業也發布公告披露“公司未與開展合作,的產品和服務未給公司帶來業務收入”。同時,平臺也封禁大量賬戶,其中包括部分使用中文進行對話的用戶。作為新興科技生產力, 成為科技封鎖和保護主義對象的趨勢初現端倪。從我國所處的追趕者角色看,類產品及其下游應用產業對于國家數字經濟發展的戰略意義不容忽視。半導體產業“卡脖子”的前車之鑒發人深省,的成功再次暴露了中美兩國不僅在AI算力層面差距巨大,在AI算法和底層框架等層面也存在代際差距。我國AIGC產業發展需立足長遠戰略,布局大模型技術研發、商業落地、生態建設與產業治理。

浪潮的產品到底是什么_chatgpt算法需求_浪潮發展現狀

邁向AGI時代的暢想

通用人工智能(AGI)又稱強人工智能,指具備等同或超過人類智能行為水平的人工智能。的面世打開了通向AGI之路。微軟發布報告稱GPT-4已明顯超越,在很多任務上已經達到人類水平甚至超越人類表現。AGI時代正在加速到來,“人工智能將淘汰人”的論調加劇了個體焦慮與危機感。但其實生產力工具與人關系的底層邏輯并不是簡單地替代,而是通過改變對個體的能力評價體系,產生人的價值分層。未來,傳統的“掌握通識知識、流程性工作能力等”要求會逐步成為隱藏的底層要求,更顯性、高層次的要求則是“創造性價值以及高效利用工具解決問題”的能力。面對巨變,人類除了摒除焦慮、擁抱變革外,也的確應該心存敬畏。

浪潮的產品到底是什么_浪潮發展現狀_chatgpt算法需求

免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。