ChatGPT 算法 36氪研究院 | 2023年AIGC之ChatGPT行業研究報告
1、發展環境技術端:新技術驅動AIGC生成的內容質量提升,實用性不斷增強
等AIGC模型的爆發式突破得益于生成算法、預訓練模型、多模態技術等關鍵技術的落地。
生成算法模型。目前常用的算法模型包括生成式對抗網絡(GAN)和 等。GAN是一種傳統式深度學習模型,包含抓取數據、生成新數據的生成模型和判斷數據是否真實的判別模型,主要用于圖片和視頻應用場景,但存在訓練不穩定、樣本重復和模型需根據需求壓縮等問題。而深度學習模型 (擴散模型)則在2022年實現技術突破,其圖像生成邏輯較其他模型更接近人的思維模式,生成內容更具有開放性、創造性、效率性,且圖像質量更高。
預訓練模型。預訓練大模型的發展是近年來AIGC的使用門檻、成本降低、生成內容和質量提升的主要原因之一。即采用生成式預訓練語言模型,使用大量參數和數據訓練,并引入RLHF新技術( with ,基于人類反饋的強化學習),提高內容產生質量和效率,幫助該系統達到與人類價值觀、常識和需求相一致的效果。
多模態技術。多模態技術讓AIGC可應用的廣度不斷擴展,可跨文字、圖像、音頻、視頻等多種類型數據進行關聯,提高內容生產能力。
需求端:內容需求呈指數上升ChatGPT 算法,AIGC將成為未來內容生成主力
隨著數字經濟乃至元宇宙的快速發展,人們的內容需求不斷多樣化、個性化,從PGC到UGC,但現有內容生成方式受限于人們的創造力和知識儲備量,已難以滿足井噴式數字內容需求。等AIGC內容生成方式通過學習人類的思考方式,查閱、挖掘大量素材,以低邊際成本、少人力限制等高效率的方式生成大量滿足人們差異化需求的內容。
2、發展現狀應用場景:涵蓋多個自然語言交互領域,應用前景廣泛
文本生成。以為例,可與用戶進行文字對話交互,也可生成各類文字,實用性較高,應用場景較為廣泛。(1)聊天機器人。語言理解能力較強,可以針對用戶問題,結合自身儲存的行業知識,構建自動回復體系,為用戶提供快速回答ChatGPT 算法,基本可滿足個性化提問需求,可被應用于專業客服、游戲NPC、虛擬人等領域。(2)搜索引擎。與傳統搜索引擎“搜索框”不同,將其轉化為“對話式”搜索。用戶提出問題后,直接向用戶提供完整語句答復,免去用戶反復查找并點擊跳轉鏈接的麻煩,將對現有搜索行業競爭格局造成影響,業內主要搜索軟件廠商百度、、微軟等均開始布局類產品。近日,微軟推出集成了的新版 Bing搜索引擎和Edg瀏覽器,新版Bing以聊天形式直接回復用戶搜索結果,并支持多輪對話。(3)智能創作。具備文本等內容創作能力,可用于小說、新聞、專業學術寫作、小說和新聞等摘要生成、采訪助手等。(4)編程機器人。擁有編程相關知識,并有能力根據用戶需求編寫代碼或查找bug,可作為輔助工具大幅提升用戶編程效率和質量。
隨著在以上領域的深度應用,盡管部分輿論認為客服、記者、編劇、程序員、金融分析師等職位將受到一定程度的沖擊,但僅能根據已有的數據庫進行內容創作,難以超越人類自身的創造性和智慧,未來將更多以輔助性工具的形式存在,幫助人們高效完成部分重復性強、規則性高的任務。
音頻生成。音頻生成除適用于有聲讀物制作、文字語音播報、語音客服和內容配音等音頻的基礎編輯制作外,也開始涉足醫療、輔助設計等行業,如可幫助無法說話的病人通過虛擬人開口。
圖像生成。圖像生成可分為生成圖像、圖像屬性編輯、部分編輯和圖像端到端生成。隨著元宇宙的逐步落地,虛擬人物、場景的建設需求激增,AIGC將幫助進行圖像建模,大幅提升制作效率并降低成本。除商業價值外,AIGC也可在文物修復等領域創造社會價值ChatGPT 算法,如百度曾借助AIGC修復《富春山居圖》。
隨著AIGC應用場景的拓展,疊加國內外科技巨頭紛紛推出相關產品,如谷歌將推出“競品”Bard,百度也將推出類產品——文心一言,并將于三月份完成內測并對公眾開放,拓展了AIGC的商業化想象空間。 and 預測,2030年,AIGC行業相關市場規模將達到1,100億美元。
此外,AIGC的快速發展將催生巨大的高性能網絡、芯片、訓練數據存儲和數據傳輸市場。AIGC的持續商業化落地離不開算力與數據支撐。在算力側,微軟數據顯示,GPT-3.5在微軟 AI超算基礎設施上消耗的總算力需7—8個30億投資規模的數據中心支持運行;2月7日-9日,官網多次出現因為滿負荷而無法進入的問題,訓練AI所需算力呈指數級增長,AI芯片、高性能網絡等基礎設施作為算力底座,升級需求愈發明確。在數據側,等AIGC模型依靠大規模數據進行訓練,并將產生海量數據,由此產生快速增長的數據傳輸需求。
投融資情況:行業投融資熱度持續提升,融資輪次多處于早期
CB 數據顯示,近幾年,全球AIGC行業整體投融資事件數和金額呈快速上升趨勢,2019年融資金額激增是由于微軟投資 10億美元,這說明行業處于二八分化狀態,業內頂尖企業獲得大部分融資。此外,就融資輪次來說,超一半初創企業的融資進度在A輪或天使輪,行業仍處于發展初期。
發展局限:受限于技術能力上限,AIGC現仍存在一定缺陷并面臨著發展瓶頸
一方面,目前實用性較強的也面臨著因技術能力有限,給出答案準確性仍需提高,且重復性和對語料庫的依賴度較高等問題。答案準確性不高、無意義的主要原因包括:(1)在強化學習過程中,沒找到可使用的數據;(2)訓練模型謹慎度提升,可能拒絕本可正確回答的問題;(3)監督訓練中行為克隆對模型產生誤導,導致信息失真。同時,訓練數據的偏差和過度修正會導致過度使用某些短語,使答案過度冗長。此外,僅依賴大規模離線語料進行訓練,無法像人類一樣基于現有信息進行判斷推測,導致算力、訓練成本偏高,實時性不夠及智能程度不足。
另一方面,AIGC無法避免學習到存有偏見或不道德的答案,也無法明確用戶使用目的,人工智能安全和倫理性問題依然存在。例如,學生使用完成考試是否為作弊、生成內容的著作權歸屬及用于訓練算法模型的數據是否侵犯他人版權等問題尚未有統一定論。
3、發展展望關鍵技術提升,催生更多應用場景與行業新業態
當前,部分行業頂尖的AIGC公司已進行商業化落地,但應用場景、行業相對較窄,內容生產效率仍有待提高,主要原因是整體技術仍處在快速成長中。隨著關鍵技術與基礎理論不斷突破,大算力、大數據、大模型將成為未來重點發展方向,帶動自然語言處理、翻譯模型、生成算法和數據集等細分要素持續提升,推動產出的內容細節、類型更豐富、質量更高。以為例,其新一代模型GPT-4預計將于今年發布。GPT-4的訓練數據量、數、模型參數量將有所提升,從而提高模型規模,降低訓練成本和使用門檻的同時,有望完全通過圖靈測試(如通過則認為具有人類智能),達到人類智慧水平,這意味著將被更多地應用在心理咨詢、情感陪伴等需人類感情的場景和金融、醫學等專業行業中。
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。