chatgpt智能機器人 從 ChatGPT爆火看人工智能大勢
開放注冊兩個月用戶數(shù)破億,火爆的背后是人工智能算法、算力和數(shù)據(jù)的再一次融合升級?,F(xiàn)象級的帶動人工智能第三次浪潮的再次飛躍和各國、各企業(yè)的AI競賽。在人工智能領(lǐng)域,全球目前尚未形成絕對主導(dǎo)的技術(shù)依賴和產(chǎn)業(yè)生態(tài),我國的新型舉國體制如能發(fā)揮更大的作用,將給AI的發(fā)展提供極為有力的支持。中國人工智能從0到1的技術(shù)突破需要沉下心來長期深耕、從1到100的商業(yè)化則需要完整的產(chǎn)業(yè)生態(tài)和市場化企業(yè)低成本的商業(yè)破局。
透視
爆火的
成為用戶破億速度最快的消費級應(yīng)用。2022年11月30日上線,5天后用戶數(shù)超百萬,2023年1月月活用戶過億。從某種程度上看,與聊天就像與真人聊天,“他”上知天文、下曉地理,對答如流,明顯區(qū)別于其他人工智能客服機器人,流暢的對話之外,還能寫論文、寫歌曲、寫劇本、寫小說,編代碼、修復(fù)代碼 bug、翻譯、繪畫等。
引來全社會的普遍關(guān)注??萍疾拷诎l(fā)文強調(diào)將把人工智能作為戰(zhàn)略性新興產(chǎn)業(yè)和新增長引擎,繼續(xù)給予大力支持;國內(nèi)外各大科技公司迅速跟進chatgpt智能機器人,也都對外公布相關(guān)布局;甚至有人開始擔(dān)憂對人工的替代,討論引發(fā)的十大職業(yè)危機;也有用戶抨擊對于很多問題的回答,往往是一本正經(jīng)地胡說八道。
何為
是由人工智能實驗室所開發(fā)的軟件應(yīng)用,是一款能夠模仿人類進行智能對話的聊天機器人。Chat與GPT( Pre- ,生成預(yù)訓(xùn)練轉(zhuǎn)換器)的結(jié)合表示是以GPT為基礎(chǔ)的聊天機器人。官網(wǎng)稱是基于GPT-3.5架構(gòu)的大型語言模型(LLM)。并非由單一技術(shù)產(chǎn)生,是多種深度學(xué)習(xí)技術(shù)(、自監(jiān)督學(xué)習(xí)、微調(diào)、人類反饋強化學(xué)習(xí)RLHF、AI對齊等)疊加在一起形成質(zhì)變的產(chǎn)物。
成立于2015年,專注于通用人工智能的研發(fā)。2018年,提出GPT模型的概念chatgpt智能機器人,團隊開發(fā)GPT-1,隨后該模型演變?yōu)镚PT-2, 2020年又推出GPT-3,相比前兩代性能更加強大,使用45TB的文本數(shù)據(jù)進行訓(xùn)練,參數(shù)超1750億個。GPT-3.5是GPT-3微調(diào)優(yōu)化后的版本,更加強大。
的核心壁壘
大模型。GPT大模型是的基礎(chǔ),經(jīng)過多個版本迭代,GPT-3版本參數(shù)量達1750億,參數(shù)數(shù)量高于GPT-3。AI大模型( ,基礎(chǔ)模型)指通過在大規(guī)模寬泛(標(biāo)記和未標(biāo)記)的數(shù)據(jù)上進行訓(xùn)練后,通過將知識存儲到大量的參數(shù)中并對下游任務(wù)進行微調(diào),能適應(yīng)一系列下游任務(wù)的模型。目前100億參數(shù)以上的模型稱為大模型。
大數(shù)據(jù)。訓(xùn)練數(shù)據(jù)集規(guī)模巨大,訓(xùn)練數(shù)據(jù)集包含六類數(shù)據(jù),分別是維基百科、書籍、期刊、鏈接、 Craw以及專門的數(shù)據(jù)集。GPT-3的預(yù)訓(xùn)練數(shù)據(jù)有45TB。訓(xùn)練數(shù)據(jù)集規(guī)模未公開,推測也是百T級別。
大算力。GPT-3的算力需求為/s-day(假設(shè)每秒計算1千萬億次,需要3640天),微軟投入5億美元建設(shè)了超算中心專為GPT-3訓(xùn)練。業(yè)內(nèi)人士認為1萬塊 A100 GPU是AI大模型的算力門檻。
大投入。大模型、大數(shù)據(jù)和大算力帶來極高的訓(xùn)練成本、運營成本等投入。GPT-3訓(xùn)練使用了上萬塊 V100 GPU和28.5萬個CPU,一次訓(xùn)練的成本為近千萬美元,訓(xùn)練時長達14.8天,的訓(xùn)練成本或比GPT-3更高。的運營成本高,每次調(diào)用 聊天的成本為幾美分,遠高于傳統(tǒng)搜索。
人工智能的發(fā)展趨勢
算力成為制約AI發(fā)展的最關(guān)鍵因素對算力的極致追求使大模型以及未來的人工智能成為寡頭之間的競爭,算力低位的國家以及企業(yè)會逐漸失去對人工智能技術(shù)的話語權(quán),而算力領(lǐng)先將造就頭部國家以及企業(yè)發(fā)展人工智能的基礎(chǔ)壁壘。2020年,微軟為建設(shè)的專門用來訓(xùn)練GPT-3大模型的超級計算集群算力為/s-day,算力建設(shè)成本為7500萬美元,云端訓(xùn)練的單次訓(xùn)練成本近千萬美元。發(fā)布的AI模型算力報告中指出,2012年起,基于GPU集群的超大規(guī)模深度學(xué)習(xí)模型高速發(fā)展,AI訓(xùn)練的算力呈指數(shù)級增長,每3.4個月翻一番。從2012年到2020年,AI算力增長超600萬倍,預(yù)計從2023年到2028年,AI所需算力再增加100萬倍。
&中泰證券1985-全球算力需求
算力的寡頭化可能帶來通用人工智能的寡頭化
算力成為繼電力之后新時代的核心生產(chǎn)力,也是數(shù)字經(jīng)濟的核心生產(chǎn)力,全球主要國家都在投入巨資,加快算力布局,算力成為大國戰(zhàn)略競爭的新焦點。算力時代,誰掌握先進的算力誰就掌握發(fā)展的主動權(quán)。IDC報告顯示,算力規(guī)模與經(jīng)濟發(fā)展水平呈現(xiàn)顯著的正相關(guān)關(guān)系,算力規(guī)模越大chatgpt智能機器人,經(jīng)濟發(fā)展水平越高。算力將成為決定GDP發(fā)展的最核心因素,GDP領(lǐng)跑國家強大的算力將領(lǐng)先追趕者和起步者,呈現(xiàn)全球算力寡頭化趨勢。高端AI芯片是算力的組成關(guān)鍵。美國政府2021年8月將英偉達、AMD兩家企業(yè)的GPU產(chǎn)品列入貿(mào)易限制范圍,國內(nèi)現(xiàn)有A100儲備均是存貨。
算力的寡頭化將帶來以為代表的通用人工智能( ,AGI)的寡頭化。IDC全球算力指數(shù)報告指出,美國和中國算力排名前二,處于領(lǐng)跑者陣營,其余國家為追趕者、起步者陣營。近年全球各國間的算力競爭在加劇,大多數(shù)國家算力均有提升。各國家所屬陣營較上一年未變化,一定程度上反映出全球各國算力競爭格局已初步形成。起步者陣營和追趕者陣營國家算力差距在縮小,而領(lǐng)跑者陣營與追趕者陣營、起步者陣營的差距在拉大。
年-2022年全球計算力指數(shù)與GDP回歸分析
深度學(xué)習(xí)仍是人工智能發(fā)展的主流方向
2006年,在《》上發(fā)表論文,提出了深度學(xué)習(xí)算法,用多層的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)比機器學(xué)習(xí)的特征提取更強的特征學(xué)習(xí)能力,AI進入新發(fā)展階段。深度學(xué)習(xí)典型算法包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、前饋神經(jīng)網(wǎng)絡(luò)(FNN)、生成對抗網(wǎng)絡(luò)(GAN)等。2017年谷歌提出 算法,此后廣泛應(yīng)用于自然語言處理,并逐步在計算機視覺等領(lǐng)域應(yīng)用,最近發(fā)布的也是以為基礎(chǔ)構(gòu)建的。深度學(xué)習(xí)仍是人工智能未來發(fā)展的主流方向。
多模態(tài)融合的大模型是未來人工智能的發(fā)展方向
人工智能正在從文本、圖片、語音、視頻等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展。多模態(tài)統(tǒng)一建模,目的是增強模型的跨模態(tài)語義對齊能力,打通各個模態(tài),使得模型逐步標(biāo)準(zhǔn)化。隨著算力、數(shù)據(jù)和AI技術(shù)的發(fā)展,多模態(tài)融合的大模型將向更深的認知智能方向發(fā)展,加速通用人工智能的發(fā)展?;诙嗄B(tài)融合的大模型有望成為人工智能的基礎(chǔ)設(shè)施。
我國人工智能的發(fā)展建議
人工智能發(fā)展要發(fā)揮新型舉國體制優(yōu)勢
發(fā)展人工智能產(chǎn)業(yè)必須發(fā)揮新型舉國體制優(yōu)勢,用好政府、國家隊和市場三方面力量,將有效市場和有為政府有機結(jié)合,將自主創(chuàng)新與開放創(chuàng)新協(xié)同互動。政府頂層規(guī)劃推動人工智能長期性、系統(tǒng)性、創(chuàng)新性發(fā)展,引導(dǎo)長期投資;國家隊在人工智能基礎(chǔ)科學(xué)領(lǐng)域取得突破,并建設(shè)一批關(guān)鍵人工智能基礎(chǔ)設(shè)施;市場端重視發(fā)揮市場力量和產(chǎn)業(yè)生態(tài)的重要作用,建立以頭部人工智能企業(yè)為主體的技術(shù)創(chuàng)新攻關(guān)機制,重視各行業(yè)人工智能的產(chǎn)業(yè)化規(guī)模落地。
充分強化數(shù)據(jù)、算力和算法的鐵三角
算力是基礎(chǔ)、數(shù)據(jù)是養(yǎng)料、算法模型是中樞,三者配合式的閉環(huán)循環(huán)使人工智能穩(wěn)定、快速發(fā)展。目前,我國數(shù)據(jù)分散、算法不足、算力薄弱等問題不容忽視。算力是未來人工智能發(fā)展的基礎(chǔ),亟待不斷強化人工智能算力網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè),以滿足AI大模型及算法等對算力的需求。鼓勵相關(guān)數(shù)據(jù)和模型的資源共享已經(jīng)成為美、英、日、韓等國家在AI管理上的重要共識,我國在加強數(shù)據(jù)保護的基礎(chǔ)上,要充分利用大數(shù)據(jù)資源,鼓勵數(shù)據(jù)開放共享。
煉大模型并聚焦低成本商業(yè)化
“煉大模型”階段,我國起步稍晚于國外,在這個領(lǐng)域也研究多年,但是如果國外寡頭效應(yīng)愈顯(大數(shù)據(jù)積累、大算力支持和大模型迭代),與國外的差距可能會被拉大。大模型已成行業(yè)與場景創(chuàng)新突破的共識,持續(xù)不斷降低通用或行業(yè)大模型的建設(shè)、訓(xùn)練和使用成本成為商業(yè)化的關(guān)鍵。今年3月,推出API使開發(fā)人員集成成本降低為1/10。有別于從0到1不計成本的技術(shù)突破,商業(yè)化需要我國企業(yè)提供性價比更高、成本更低的解決方案以及落地能力更強的行業(yè)大模型。
重視人才培養(yǎng)、AI倫理、安全和法規(guī)建設(shè)
重視AI人才培養(yǎng)、補齊人才短板,是我國AI發(fā)展的當(dāng)務(wù)之急和長期需求。根據(jù)相關(guān)部門測算,我國人工智能人才缺口超過500萬,國內(nèi)的供求比例為1:10,供需比例嚴重失衡。剛興起,倫理和安全問題較少被關(guān)注,未來多領(lǐng)域加速應(yīng)用,將導(dǎo)致相應(yīng)的倫理和安全問題逐漸凸顯,需提早布局,將AI倫理治理融入AI全生命周期,增強數(shù)據(jù)安全和隱私保護能力。政府要根據(jù)AI在各應(yīng)用領(lǐng)域的落地進程及時完善相應(yīng)行業(yè)法律法規(guī),讓新業(yè)態(tài)有法可依、有規(guī)可循。
搭建產(chǎn)業(yè)生態(tài)并密切跟蹤全球發(fā)展趨勢
無論是PC時代的體系(微軟+),還是移動時代的AA體系(ARM+),美國都打造了完整的產(chǎn)業(yè)生態(tài)來把控產(chǎn)業(yè)的主導(dǎo)權(quán)和實現(xiàn)行業(yè)的壟斷。人工智能領(lǐng)域目前尚未形成絕對主導(dǎo)的技術(shù)依賴和產(chǎn)業(yè)生態(tài),我國應(yīng)加快產(chǎn)學(xué)研用聯(lián)合攻關(guān),搭建自主“AI芯片+框架軟件+大模型+產(chǎn)業(yè)應(yīng)用”的人工智能生態(tài)體系。同時,也要持續(xù)密切跟蹤AI領(lǐng)域全球前沿技術(shù)發(fā)展趨勢,掌握發(fā)達國家在研發(fā)、支持、監(jiān)管等方面的最新動態(tài),并結(jié)合我國國情學(xué)習(xí)借鑒。
作者單位:中國信息通信研究院產(chǎn)業(yè)與規(guī)劃研究所
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責(zé)。如需轉(zhuǎn)載,請聯(lián)系原作者。如果來源標(biāo)注有誤或侵犯了您的合法權(quán)益或者其他問題不想在本站發(fā)布,來信即刪。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。