chatgpt是人工智能嗎 焦李成院士:從ChatGPT到GPT-4看下一代人工智能的挑戰(zhàn)與機遇
文 / 焦李成
本報告內(nèi)容分三個方面,一是AI為什么會成為大家關(guān)注的焦點;二是它到底帶來的機遇和挑戰(zhàn)是什么;三是我們應該怎樣面對它。
1 AI新焦點
2022年11月公司開發(fā)的智能聊天機器人成為全球熱議話題,讓大眾見識到了人工智能的力量。那么,它到底給大眾帶來了什么?人工智能影響了人類生活的哪些方面?這個熱潮不僅是簡單聊天機器人帶給我們生活的改變,更重要的是新一輪技術(shù)革新和產(chǎn)業(yè)革命是否在新浪潮到來的前夜,這是值得我們思考的問題。
引發(fā)了產(chǎn)業(yè)界“大咖”的熱議和關(guān)注(見圖 1),它不僅是一場技術(shù)的創(chuàng)新與應用,為人工智能注入了新的活力,更重要的是它為人工智能的發(fā)展帶來的機遇和挑戰(zhàn),這是我們需要關(guān)注的。在帶來了人工智能商業(yè)化契機的同時,也將刺激更多的技術(shù)創(chuàng)新。為人機交互注入了新的活力,但要做出真正的“類人”的人工智能應用,其技術(shù)還有待提升。因此,一定會帶來更深、更多、更寬廣的技術(shù)創(chuàng)新浪潮,這才是推動社會向前發(fā)展的動力,所以各領域的科學家都很重視它。
圖1 產(chǎn)業(yè)界“大咖”的熱議
從到GPT-4經(jīng)過了一段很長的歷史,它是科學研究和技術(shù)積累的結(jié)果,從這個意義上來講,2018年GPT到2023年的GPT-4每一步都有技術(shù)的革新和技術(shù)的長進(見圖2),但還處于初級階段,目前只能作為工具輔助人類工作不能代替人類,所以從現(xiàn)在開始還會有技術(shù)的革新,我們更需要去面對。對學術(shù)界來說,更多的是要重新再認識,要更多地思考下一步大模型技術(shù)創(chuàng)新的突破點在哪里。
圖2 GPT到GPT-4的發(fā)展歷程
人工智能技術(shù)下一次突破點在哪里,深度學習的理論和技術(shù)會怎么影響這個進程。
吳飛教授指出,是一個現(xiàn)象級創(chuàng)新產(chǎn)品,它的本質(zhì)仍是以深度學習為代表的人工智能技術(shù)長期發(fā)展、積累的結(jié)果,距真正模擬人類的思維還非常遙遠。所以,GPT-4不完整、不完善是必然的,大家感興趣是客觀的,說明我們?nèi)沃氐肋h,尤其是學術(shù)界要有清醒的頭腦,記住這個技術(shù)還需要我們不斷的努力去完善。
是一場“虛火”,還是顛覆性技術(shù)革命?2023年的“兩會”上科技部王志剛部長說到, 從源頭來看是自然語言理解、自然語言處理兩個技術(shù),引發(fā)大家關(guān)注,在于它是一個大模型,對應大數(shù)據(jù)、強計算、好算法。因此,雖然 帶來的變革如此迅猛,但它僅是大模型技術(shù),而推動技術(shù)產(chǎn)業(yè)的更新不僅只有大模型的技術(shù),所以它并不代表人工智能的全部,也不代表人工智能的將來。
沒有理論的突破就不會有今天的技術(shù),的成功源于自然語言處理領域70 年發(fā)展的長期積累。 ,我更認為它是一個基礎模型。人工智能技術(shù)基礎理論發(fā)展的重要突破,最先是在自然語言處理領域,它能夠讓機器像人一樣非常自然地和人類進行對話,但對聲音、語言、文字、圖像這些人類交流最自然的信息處理起來相當困難,從而促使了人工智能第三次浪潮的興起。
大模型具有大量的參數(shù)和復雜的結(jié)構(gòu),通常在強大的算力支撐下利用海量數(shù)據(jù)集下進行訓練,表現(xiàn)出強大的通用性,在各個領域展現(xiàn)出了強大的生命力。當然我們要清醒的認識到,人有智能、聰明,也絕對不靠大數(shù)據(jù)、大訓練、大模型解決問題。
在人的知識處理中,有一部分是計算,但更多的是知識啟發(fā)的推理,包括決策、邏輯的處理等功能在大模型中還遠遠不夠,更多要體現(xiàn)為 。擁有兩個特性:一個是它的涌現(xiàn),一個是它的同質(zhì)。深度大模型的涌現(xiàn)能力強,能夠?qū)崿F(xiàn)從量變到質(zhì)變。因為涌現(xiàn)是非線性深度網(wǎng)絡,深度網(wǎng)絡是由許多神經(jīng)元相互連接組成的一個大系統(tǒng),涌現(xiàn)是它的基本特征,是大模型的固有特征;同時也是群體智能行為和復雜思維的基本機理和表征,也是人腦感知和認知,或者類腦感知和認知的基本特征。所有這些才構(gòu)成了感知和認知。因此它是本質(zhì)性的,對于大模型來說更是如此,因為它是高度復雜的非線性網(wǎng)絡。而我們多數(shù)人關(guān)注的是它的訓練,很少人關(guān)注它的動力學過程。所以,從因果到涌現(xiàn)再到下一代人工智能,需要我們?nèi)ニ伎歼@些本質(zhì)性的東西。既然是一個,這時你就會思考本質(zhì)性的非線性現(xiàn)象和動力學帶來的問題。
成功從技術(shù)上來講,既然是大模型技術(shù)就離不開兩個核心方面,第一個是模型。最早來源于電力系統(tǒng)中的變壓器,今天的 已沒有變壓器的含義,“大變活人”或者叫做“變形金剛”也不足以形容其本身具有的能力,是突破的關(guān)鍵技術(shù)之一。另外一個是基于類人反饋的強化學習(RLHF)方法,一定要有反饋、溝通才去做。
上述技術(shù)的成功主要有下述四個關(guān)鍵技術(shù)。
關(guān)鍵技術(shù)1 的強大表征能力為GPT的成功起到了關(guān)鍵作用。GPT的本質(zhì),大模型技術(shù)的核心突破是自監(jiān)督的學習chatgpt是人工智能嗎,大語言模型的核心基礎同樣是 ,這是自然語言處理能帶來突變性飛躍非常重要的特征。 強大的表征能力和學習能力,是以前的深度學習、方法、算法,或者深度學習模型所不具有的。
關(guān)鍵技術(shù)2 根據(jù)人類偏好校準生成獎勵模型,并對 GPT 模型的“回答”進行評分。
關(guān)鍵技術(shù)3 強化學習的原理和基本思想。強化學習對開放的環(huán)境、變化的環(huán)境有不斷交互學習的、舉一反三的能力,這是人類能夠不斷成長的最本質(zhì)特征之一。從這個意義上來講,對照我們處理的場景和問題,恰恰是不謀而合的,所以它是大場景,自然強化學習得到了更好的關(guān)注。如果在AI for 模型恰恰描述了有空間、有時間的動力學過程,它也同樣是核心的關(guān)鍵技術(shù)之一。
關(guān)鍵技術(shù)4 提示學習方法。提示學習就是你的經(jīng)驗、知識怎樣能嵌入到訓練過程中,實現(xiàn)最優(yōu)解。從這點來說,提示學習不是簡單名詞意義上的,它更多是知識和經(jīng)驗的運用。
、GPT-4之所以能突破,是因為采用了一系列深度學習的新技術(shù),包括無監(jiān)督學習、有監(jiān)督學習、多任務學習,以及基于人類反饋的強化學習,所有這些發(fā)展是今天的必然結(jié)果。盡管取得了不錯的進展,但它仍然處于發(fā)展初期,依然存在一些技術(shù)特點和局限。比如訓練時間長、資源消耗高、準確性有待提高、容易存在誤導性等10個問題,因此它還需要不斷研究、改進、解決和完善。
2 挑戰(zhàn)與機遇
認為認知智能的發(fā)展分為五個階段,即知覺和感知階段、表示和推理階段、自主學習階段、創(chuàng)造性思維階段、自然交互和社會化階段。自我評分只達到了中間的自主學習階段,這個階段距人類真正學習的模式和模型還有相當大的距離,還需要進一步研究和工作。自然語言處理和技術(shù),只是中國人工智能學會論證人工智能領域眾多研究方向中的一個,只是人工智能技術(shù)理論和基礎技術(shù)主要研究的、所要發(fā)展中的一條,而不是人工智能的全部。從這個意義上來講,我們還需要更多、更全面地發(fā)展人工智能。記住,離不開,當然也不能只靠,所以我們需要更深的去思考。
目前,還沒有通過人工智能圖靈測試(當然,迄今為止還沒有人工智能模型真正通過圖靈測試),針對實際變化場景仍有很多工作要做,我們要努力去研究它、發(fā)展它、應用它。基礎不牢,地動山搖。 的數(shù)理邏輯計算能力薄弱,對基礎數(shù)學和邏輯思維等的處理能力、辨?zhèn)未嬲婺芰Χ加写訌姟4送猓?代碼生成存在局限性。促進了 AIGC 與代碼生成的碰撞融合,可進行代碼生成、代碼錯誤檢測修復、代碼優(yōu)化、代碼理解等任務,但是也依然存在一些局限。
GPT-4促使了通用式人工智能,以前大家認為有數(shù)據(jù)就夠了,而數(shù)據(jù)再多在大數(shù)據(jù)同樣也是小樣本,同樣也是不完整的。從表征來講還只是系統(tǒng)一部分功能和既定的表征,從這個意義上來講我們更需要去做。實際中,數(shù)據(jù)感知獲取時只是一部分,不夠怎么辦,生成;經(jīng)驗知識不夠怎么辦,生成。所以,生成智能、生成知識變成了未來人工智能發(fā)展非常重要的一部分。
如果回到創(chuàng)新源頭,數(shù)據(jù)和知識協(xié)同學習、推理、聯(lián)想、記憶,以及情景感知到認知才是人工智能的本質(zhì)和基礎。其實對詩的理解、對情景的理解、對情緒的理解、對情感的理解應該與我們相差相當大的距離,這就代表了現(xiàn)在人工智能大模型技術(shù)和我們還有相當大的距離。
我們離不開搜索,但我們的生活、我們的創(chuàng)新、我們的思想、我們的情感不能緊緊依靠搜索。人人都能搜索到這種情感,那你的感情、真摯程度可能就要提出一些懷疑和疑問;如果感情都能這樣重復的chatgpt是人工智能嗎,那它的真摯度有多少。另外有倫理的問題、道德的問題,偏見的問題,我們需要面對它,而不是因為這是負面的就排斥它。
波士頓動力從1982年開始到現(xiàn)在經(jīng)過40年還在發(fā)展。2022年,給機器人手里拎兩個袋子都不行,今天它就有自己找工具遞給上面的人這樣的智能出現(xiàn),但它缺乏環(huán)境的感知、認知、推理和決策的能力。40年彈指一揮間,但40年對人工智能來講,大腦和運動裝配仍在路上。
發(fā)展的十大公開問題有先進性、自主學習性、體驗性、普及性、可擴展性、可解釋性、安全性、推理性、創(chuàng)新性和生態(tài)穩(wěn)定性,也包括其他信任、倫理、道德、法律等方面的問題,值得我們研究,也值得我們期待,更說明這個基礎還有待于進一步加強。
GPT-4是一個大型多模態(tài)模型,可以準確地解決難題,雖然在許多現(xiàn)實世界場景中的能力不如人類,但在相關(guān)專業(yè)和學術(shù)基準上展現(xiàn)出類人的水平。比如,相對前面在文本、圖像處理方面是一個新的里程碑。我還要特別強調(diào)的是,GPT-4的成功離不開研究的團隊,團隊的合理分工、協(xié)同、清晰的構(gòu)架,以及堅實的研究方向和明確的目標任務是他們成功的關(guān)鍵,而且是堅持一直把它做成。從這個意義上來講,它對我們的研究和技術(shù)的應用也提出了相應的啟示。GPT-4有它的優(yōu)勢,也有它的問題和局限,就像剛才我講一樣,同樣需要我們?nèi)プ觥?/p>
面對人工智能和大模型技術(shù)的來臨,我們要熱情的擁抱它,我們要有三個變革,一是用平常的心去對待它,更要有敬畏的心對待它,這樣才能把所有問題的負面影響減少到最小。同樣在教育界,我們需要擁抱它,以平常心和創(chuàng)新的能力去做。
目前,自然語言處理還是不完整的、不完善的,因此也是有發(fā)展空間和潛力的,況且整個人工智能領域。自然語言處理仍然面臨很多風險,這時應對的策略首先應該是心態(tài),心態(tài)會決定一切。
大模型的技術(shù)同樣對大模型多模態(tài)學習帶來了新機遇,因為它是視頻技術(shù)發(fā)展的動力,這里同樣需要去做。一個是微軟在做的 也希望擴展到影像,因此有了以擴散模型為代表的視覺模型,從文本到視覺。的VIT模型,也是在做視覺,大家不要僅看參數(shù)有多少,要看它的功能擴展。Meta發(fā)布的SAM 大模型也在關(guān)注視覺任務。而用一個模型打遍天下是不可能的,尤其是在影像和視覺領域、一個模型就能把所有問題都解決是天方夜譚。盤古大模型是華為在努力做的事情,百度也在做文心一言的模型,阿里和商湯在做跨語言、圖像多模態(tài)大模型,都在路上。此外,清華也做出了一個多模態(tài)擴散模型;我們也在做遙感的大模型和醫(yī)學領域的大模型,效果還不錯。
另外, 對教育的沖擊很大,教育版的 怎么做,我們要守正和創(chuàng)新;醫(yī)療領域?qū)ξ覀儊碇v是挑戰(zhàn)的領域,又是充滿魅力的領域,也是需要我們?nèi)プ龅念I域。所以,大模型是通用的計算機,比爾·蓋茨說它可以和通用的計算機相比較。這時候邊界在哪兒、腦子在哪兒,腦子和手怎么并用,手和大腦怎么嵌套,這是解決從語言到影像再到視覺模型的基礎。當然在政、產(chǎn)、學、研、用、商各領域更需要我們?nèi)プ龊芏嗍虑椋瑢ζ髽I(yè)的機遇是不言而喻的。
3 思考與展望
從圖靈測試到人工智能經(jīng)歷了很多事情,例如,老三論是系統(tǒng)論、控制論和信息論,這里講的模型包括耗散論、突變論和協(xié)同論,一直到現(xiàn)在的本體論、三世界和小世界,所有這些都是非線性動力學現(xiàn)象和群體智能現(xiàn)象的一個體現(xiàn),而感知、認知、學習、推理和決策永遠是人工智能的核心。我們要計算、要感知、要認知,從感知到認知還有漫長的道路要去走,所以說離不開人工智能。人工智能圖靈獎的獲得者在思考如何進行推理,腦科學諾貝爾獎的獲得者在考慮“人如何思考”,生物進化類諾貝爾獎的獲得者也在考慮“生物是如何優(yōu)化和進化”的,物理領域諾貝爾獎的獲得者啟發(fā)了我們在思考人工智能深度學習、深度網(wǎng)絡大模型物理本質(zhì)是什么,所以說下一代人工智能是我們的主題。可解釋、魯棒、安全、自適應、創(chuàng)造性、遷移性,我們怎么去應對這樣的挑戰(zhàn)才剛剛開始。
深度學習也不是一天就有的,下一代深度學習講了一個可解釋、可通用還遠遠不夠。這時候我們怎么去做,基金委最近下發(fā)的十大重點培育項目所列題目就表明了下一代該怎么做;機器人領域有工信部17個部門提出的要求;在場景創(chuàng)新領域,六部委提出了10個場景示范,這些都是國家層面的考慮。所以突破在哪里、問題在哪里,技術(shù)我們還需要去發(fā)展,從這個意義上來講,從感知到認知涉及到方方面面,心理、哲學、語言、人類工程包括到神經(jīng),我們更需要協(xié)同發(fā)展。所以,源頭創(chuàng)新一定是圍繞本質(zhì)性問題chatgpt是人工智能嗎,我們還在路上。
(參考文獻略)
選自《中國人工智能學會通訊》
2023年第13卷 第4期
免責聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉(zhuǎn)載,請聯(lián)系原作者。如果來源標注有誤或侵犯了您的合法權(quán)益或者其他問題不想在本站發(fā)布,來信即刪。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標注,均為采集網(wǎng)絡資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。