chatgpt智能機器人 從 ChatGPT爆火看人工智能大勢
開放注冊兩個月用戶數破億,火爆的背后是人工智能算法、算力和數據的再一次融合升級。現象級的帶動人工智能第三次浪潮的再次飛躍和各國、各企業的AI競賽。在人工智能領域,全球目前尚未形成絕對主導的技術依賴和產業生態,我國的新型舉國體制如能發揮更大的作用,將給AI的發展提供極為有力的支持。中國人工智能從0到1的技術突破需要沉下心來長期深耕、從1到100的商業化則需要完整的產業生態和市場化企業低成本的商業破局。
透視
爆火的
成為用戶破億速度最快的消費級應用。2022年11月30日上線,5天后用戶數超百萬,2023年1月月活用戶過億。從某種程度上看,與聊天就像與真人聊天,“他”上知天文、下曉地理,對答如流,明顯區別于其他人工智能客服機器人,流暢的對話之外,還能寫論文、寫歌曲、寫劇本、寫小說,編代碼、修復代碼 bug、翻譯、繪畫等。
引來全社會的普遍關注。科技部近期發文強調將把人工智能作為戰略性新興產業和新增長引擎,繼續給予大力支持;國內外各大科技公司迅速跟進chatgpt智能機器人,也都對外公布相關布局;甚至有人開始擔憂對人工的替代,討論引發的十大職業危機;也有用戶抨擊對于很多問題的回答,往往是一本正經地胡說八道。
何為
是由人工智能實驗室所開發的軟件應用,是一款能夠模仿人類進行智能對話的聊天機器人。Chat與GPT( Pre- ,生成預訓練轉換器)的結合表示是以GPT為基礎的聊天機器人。官網稱是基于GPT-3.5架構的大型語言模型(LLM)。并非由單一技術產生,是多種深度學習技術(、自監督學習、微調、人類反饋強化學習RLHF、AI對齊等)疊加在一起形成質變的產物。
成立于2015年,專注于通用人工智能的研發。2018年,提出GPT模型的概念chatgpt智能機器人,團隊開發GPT-1,隨后該模型演變為GPT-2, 2020年又推出GPT-3,相比前兩代性能更加強大,使用45TB的文本數據進行訓練,參數超1750億個。GPT-3.5是GPT-3微調優化后的版本,更加強大。
的核心壁壘
大模型。GPT大模型是的基礎,經過多個版本迭代,GPT-3版本參數量達1750億,參數數量高于GPT-3。AI大模型( ,基礎模型)指通過在大規模寬泛(標記和未標記)的數據上進行訓練后,通過將知識存儲到大量的參數中并對下游任務進行微調,能適應一系列下游任務的模型。目前100億參數以上的模型稱為大模型。
大數據。訓練數據集規模巨大,訓練數據集包含六類數據,分別是維基百科、書籍、期刊、鏈接、 Craw以及專門的數據集。GPT-3的預訓練數據有45TB。訓練數據集規模未公開,推測也是百T級別。
大算力。GPT-3的算力需求為/s-day(假設每秒計算1千萬億次,需要3640天),微軟投入5億美元建設了超算中心專為GPT-3訓練。業內人士認為1萬塊 A100 GPU是AI大模型的算力門檻。
大投入。大模型、大數據和大算力帶來極高的訓練成本、運營成本等投入。GPT-3訓練使用了上萬塊 V100 GPU和28.5萬個CPU,一次訓練的成本為近千萬美元,訓練時長達14.8天,的訓練成本或比GPT-3更高。的運營成本高,每次調用 聊天的成本為幾美分,遠高于傳統搜索。
人工智能的發展趨勢
算力成為制約AI發展的最關鍵因素對算力的極致追求使大模型以及未來的人工智能成為寡頭之間的競爭,算力低位的國家以及企業會逐漸失去對人工智能技術的話語權,而算力領先將造就頭部國家以及企業發展人工智能的基礎壁壘。2020年,微軟為建設的專門用來訓練GPT-3大模型的超級計算集群算力為/s-day,算力建設成本為7500萬美元,云端訓練的單次訓練成本近千萬美元。發布的AI模型算力報告中指出,2012年起,基于GPU集群的超大規模深度學習模型高速發展,AI訓練的算力呈指數級增長,每3.4個月翻一番。從2012年到2020年,AI算力增長超600萬倍,預計從2023年到2028年,AI所需算力再增加100萬倍。
&中泰證券1985-全球算力需求
算力的寡頭化可能帶來通用人工智能的寡頭化
算力成為繼電力之后新時代的核心生產力,也是數字經濟的核心生產力,全球主要國家都在投入巨資,加快算力布局,算力成為大國戰略競爭的新焦點。算力時代,誰掌握先進的算力誰就掌握發展的主動權。IDC報告顯示,算力規模與經濟發展水平呈現顯著的正相關關系,算力規模越大chatgpt智能機器人,經濟發展水平越高。算力將成為決定GDP發展的最核心因素,GDP領跑國家強大的算力將領先追趕者和起步者,呈現全球算力寡頭化趨勢。高端AI芯片是算力的組成關鍵。美國政府2021年8月將英偉達、AMD兩家企業的GPU產品列入貿易限制范圍,國內現有A100儲備均是存貨。
算力的寡頭化將帶來以為代表的通用人工智能( ,AGI)的寡頭化。IDC全球算力指數報告指出,美國和中國算力排名前二,處于領跑者陣營,其余國家為追趕者、起步者陣營。近年全球各國間的算力競爭在加劇,大多數國家算力均有提升。各國家所屬陣營較上一年未變化,一定程度上反映出全球各國算力競爭格局已初步形成。起步者陣營和追趕者陣營國家算力差距在縮小,而領跑者陣營與追趕者陣營、起步者陣營的差距在拉大。
年-2022年全球計算力指數與GDP回歸分析
深度學習仍是人工智能發展的主流方向
2006年,在《》上發表論文,提出了深度學習算法,用多層的卷積神經網絡實現比機器學習的特征提取更強的特征學習能力,AI進入新發展階段。深度學習典型算法包括卷積神經網絡(CNN)、遞歸神經網絡(RNN)、前饋神經網絡(FNN)、生成對抗網絡(GAN)等。2017年谷歌提出 算法,此后廣泛應用于自然語言處理,并逐步在計算機視覺等領域應用,最近發布的也是以為基礎構建的。深度學習仍是人工智能未來發展的主流方向。
多模態融合的大模型是未來人工智能的發展方向
人工智能正在從文本、圖片、語音、視頻等單模態智能,向著多種模態融合的通用人工智能方向發展。多模態統一建模,目的是增強模型的跨模態語義對齊能力,打通各個模態,使得模型逐步標準化。隨著算力、數據和AI技術的發展,多模態融合的大模型將向更深的認知智能方向發展,加速通用人工智能的發展。基于多模態融合的大模型有望成為人工智能的基礎設施。
我國人工智能的發展建議
人工智能發展要發揮新型舉國體制優勢
發展人工智能產業必須發揮新型舉國體制優勢,用好政府、國家隊和市場三方面力量,將有效市場和有為政府有機結合,將自主創新與開放創新協同互動。政府頂層規劃推動人工智能長期性、系統性、創新性發展,引導長期投資;國家隊在人工智能基礎科學領域取得突破,并建設一批關鍵人工智能基礎設施;市場端重視發揮市場力量和產業生態的重要作用,建立以頭部人工智能企業為主體的技術創新攻關機制,重視各行業人工智能的產業化規模落地。
充分強化數據、算力和算法的鐵三角
算力是基礎、數據是養料、算法模型是中樞,三者配合式的閉環循環使人工智能穩定、快速發展。目前,我國數據分散、算法不足、算力薄弱等問題不容忽視。算力是未來人工智能發展的基礎,亟待不斷強化人工智能算力網絡基礎設施建設,以滿足AI大模型及算法等對算力的需求。鼓勵相關數據和模型的資源共享已經成為美、英、日、韓等國家在AI管理上的重要共識,我國在加強數據保護的基礎上,要充分利用大數據資源,鼓勵數據開放共享。
煉大模型并聚焦低成本商業化
“煉大模型”階段,我國起步稍晚于國外,在這個領域也研究多年,但是如果國外寡頭效應愈顯(大數據積累、大算力支持和大模型迭代),與國外的差距可能會被拉大。大模型已成行業與場景創新突破的共識,持續不斷降低通用或行業大模型的建設、訓練和使用成本成為商業化的關鍵。今年3月,推出API使開發人員集成成本降低為1/10。有別于從0到1不計成本的技術突破,商業化需要我國企業提供性價比更高、成本更低的解決方案以及落地能力更強的行業大模型。
重視人才培養、AI倫理、安全和法規建設
重視AI人才培養、補齊人才短板,是我國AI發展的當務之急和長期需求。根據相關部門測算,我國人工智能人才缺口超過500萬,國內的供求比例為1:10,供需比例嚴重失衡。剛興起,倫理和安全問題較少被關注,未來多領域加速應用,將導致相應的倫理和安全問題逐漸凸顯,需提早布局,將AI倫理治理融入AI全生命周期,增強數據安全和隱私保護能力。政府要根據AI在各應用領域的落地進程及時完善相應行業法律法規,讓新業態有法可依、有規可循。
搭建產業生態并密切跟蹤全球發展趨勢
無論是PC時代的體系(微軟+),還是移動時代的AA體系(ARM+),美國都打造了完整的產業生態來把控產業的主導權和實現行業的壟斷。人工智能領域目前尚未形成絕對主導的技術依賴和產業生態,我國應加快產學研用聯合攻關,搭建自主“AI芯片+框架軟件+大模型+產業應用”的人工智能生態體系。同時,也要持續密切跟蹤AI領域全球前沿技術發展趨勢,掌握發達國家在研發、支持、監管等方面的最新動態,并結合我國國情學習借鑒。
作者單位:中國信息通信研究院產業與規劃研究所
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。