自然語言模型chatgpt 中國版ChatGPT快來了?
中國版快來了嗎
近日,美國人工智能研究公司推出的聊天機器人火爆全網(wǎng)。它能通過學(xué)習(xí)和理解人類語言進行自然語言對話,跟人類聊天時遇到敏感問題會“打太極”,還能替打工人生成頗具幽默感的辭職信……
可以說,打開了自然語言處理技術(shù)商業(yè)化落地且成為消費端爆款的大門,具有劃時代的意義。中國目前還沒有可媲美的類似應(yīng)用,會在本輪AI競爭中因慢一步而落于人后嗎?不必過慮!
AI發(fā)展的三大要素是數(shù)據(jù)、算法、算力,中國在這三方面都有良好基礎(chǔ)。
AI的進步迭代需大量數(shù)據(jù)進行學(xué)習(xí)訓(xùn)練,也不例外。的訓(xùn)練使用了約45TB數(shù)據(jù),其中包含多達近1萬億個單詞的文本內(nèi)容。從大數(shù)據(jù)資源看,中國擁有全世界最大規(guī)模的網(wǎng)民數(shù)量自然語言模型chatgpt,有豐富的應(yīng)用場景,在數(shù)據(jù)積累方面優(yōu)勢明顯。
在算法方面,的技術(shù)底座是大型語言模型。GPT屬于自然語言處理NLP的范疇,本質(zhì)上仍是以深度學(xué)習(xí)為代表的人工智能技術(shù)長期發(fā)展和積累的結(jié)果,并未出現(xiàn)算法的革命性突破,發(fā)布于2020年的GPT-3是有1750億個參數(shù)的大模型,正是基于它的改進版本創(chuàng)建的。國內(nèi)也有NLP領(lǐng)域的大模型,并有智能客服、作詩機等實際應(yīng)用。雖然目前全球還沒有能跟驚艷表現(xiàn)相抗衡的大模型,但是業(yè)界共識是差距在兩年左右。兩年的差距并非鴻溝,有趕超可能。
AI的訓(xùn)練和使用需要強大的算力,算力的基礎(chǔ)是芯片,有人擔(dān)心中國在這方面會吃虧。實際上,芯片水平并不等同于算力水平,算力還需要廣闊的應(yīng)用場景支撐,需要具備對千萬個芯片進行規(guī)?;{(diào)度運行的能力?!?021—2022全球計算力指數(shù)評估報告》顯示,美國計算力指數(shù)得分為77分,中國為70分,分列世界前兩位,中國算力水平與美國處于同一等級,差距并不大。
對于中國企業(yè)來說,的優(yōu)點值得學(xué)習(xí),它的不足也正是我們參與競爭的機遇。
學(xué)習(xí)它提高AI智商的新路徑。的聰明表現(xiàn)自然語言模型chatgpt,源自讓AI從人類反饋中進行強化學(xué)習(xí)。在訓(xùn)練過程中,人類訓(xùn)練者扮演著用戶和助手的角色,這比過去AI大模型的“深度學(xué)習(xí)+人工標(biāo)注”模式省時省力、效果更好。
在它表現(xiàn)欠佳的中文領(lǐng)域錯位競爭。的英文水平明顯高于中文水平,這是它在訓(xùn)練階段被“喂”了更多英文素材的必然結(jié)果,也可以成為中國版應(yīng)用的競爭切入點。
從它被詬病的倫理挑戰(zhàn)中尋得商機。會一本正經(jīng)地胡說八道,生成錯誤信息的能力遠(yuǎn)超人類。它還會被人類不當(dāng)使用,比如學(xué)生拿它寫作業(yè),黑客拿它寫代碼用于網(wǎng)絡(luò)攻擊,詐騙犯拿它開設(shè)“殺豬盤”。防范治理這些風(fēng)險,一方面需要完善相關(guān)倫理法規(guī),另一方面也應(yīng)考慮到人類處理信息的速度遠(yuǎn)遜于AI的事實,開發(fā)自動判別并警示AI生成有害信息的技術(shù)。屆時,反技術(shù)也將成為新商機。
中國版并不遙遠(yuǎn),已有百度等多家公司宣布將進入此賽道。面對這個新晉AI網(wǎng)紅自然語言模型chatgpt,我們應(yīng)清醒分析其優(yōu)勢和不足,學(xué)優(yōu)補劣。
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負(fù)責(zé)。如需轉(zhuǎn)載,請聯(lián)系原作者。如果來源標(biāo)注有誤或侵犯了您的合法權(quán)益或者其他問題不想在本站發(fā)布,來信即刪。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。