性能超GPT-4!谷歌放出最強(qiáng)悍大模型G
界面新聞記者 | 李京亞
空前崛起之際,谷歌毅然打響了絕地反擊戰(zhàn)。
北京時間12月7日凌晨,谷歌CEO桑達(dá)爾?皮查伊和 CEO戴密斯·哈薩比斯在谷歌官網(wǎng)聯(lián)名發(fā)文,官宣了最新多模態(tài)大模型 1.0(雙子星)版本正式上線。這個上線時間早于外界猜測的明年1月,保密程度很高,僅有少數(shù)媒體提前猜出。
1.0是谷歌籌備了一年之久的GPT4真正競品,也是目前谷歌能拿出手的功能最為強(qiáng)悍、適配最為靈活的大模型,包括三種不同套件,分別是 , Pro和 Nano。其中的能力最強(qiáng),復(fù)雜度最高,能夠處理最為困難的多模態(tài)任務(wù);Pro能力稍弱,是一個可擴(kuò)展至多任務(wù)的模型;Nano則是一款可以在手機(jī)端側(cè)運行的模型。這說明,的觸達(dá)范圍很廣,可以下探至數(shù)據(jù)中心,也可以上行至移動設(shè)備端側(cè)。
谷歌的Bard聊天機(jī)器人,此番也已經(jīng)升級到了,可以說的初始版本已于今日開始在Bard中提供。從5月的I/O大會之后,谷歌就將自己此前最強(qiáng)的人工智能模型PaLm 2融入了的能力之中。
在一段公布的演示視頻中,桑達(dá)爾?皮查伊展示了對視頻、圖像的非同凡響的識別能力。在視頻中,極為自如地在圖像、音頻、視頻各模態(tài)之間的轉(zhuǎn)換,展現(xiàn)了驚人的解鎖應(yīng)用場景與產(chǎn)品形態(tài)的潛力。
圖源:谷歌演示視頻
僅從谷歌釋出的演示視頻結(jié)果看,市面上現(xiàn)有的全部多模態(tài)大模型與的性能表現(xiàn)都有代際差,包括Meta 5月開源的跨6個模態(tài)的AI模型以及GPT-4。
圖源:谷歌
今年4月開始,隨著多模態(tài)技術(shù)不斷升級,以及疊加模型調(diào)用成本等性能的優(yōu)化,GPT4及國內(nèi)外一眾模型持續(xù)迭代,實現(xiàn)了跨模態(tài)性能的不斷增強(qiáng)。一時間,多模態(tài)大模型呈百花齊放之勢。但有國內(nèi)頭部大模型初創(chuàng)開發(fā)工程師對界面新聞記者表示,現(xiàn)今絕大部分多模態(tài)大模型都是在大語言模型LLM之上生長出多模態(tài)的應(yīng)用,而并非從頭開始訓(xùn)練的多模態(tài)的大模型,這是多模態(tài)大模型目前“不能言說的秘密”。
圖源:中信建投證券
谷歌自己也提到,到目前為止,創(chuàng)建多模態(tài)模型的標(biāo)準(zhǔn)方法基本是針對不同模態(tài)訓(xùn)練單獨的組件,然后將它們拼接以粗略模仿其中一些功能。這會導(dǎo)致這些模型有時擅長執(zhí)行某些任務(wù),例如描述圖像,但難以處理更概念性和復(fù)雜的推理。
其通過60頁的相關(guān)技術(shù)報告證明,是一個真正原生的多模態(tài)大模型,因為從最初的預(yù)訓(xùn)練數(shù)據(jù)開始,就在針對不同模態(tài)的模型進(jìn)行訓(xùn)練,因此其功能在每個重大領(lǐng)域都達(dá)到了SOTA( of the art,特指領(lǐng)先水平的大模型)。
圖源:谷歌技術(shù)報告
在權(quán)威MMMU基準(zhǔn)測試中, 獲得了59.4%的SOTA分?jǐn)?shù)。這項基準(zhǔn)測試是經(jīng)典的多模態(tài)測試,由跨不同領(lǐng)域的多模式任務(wù)組成,能夠體現(xiàn)大模型的深度推理能力,而推理過程本身,需要花費的成本要遠(yuǎn)遠(yuǎn)高于模型訓(xùn)練。谷歌技術(shù)報告同時顯示,谷歌是使用和來訓(xùn)練,尤其是訓(xùn)練 時,使用了跨多個數(shù)據(jù)中心的大量。
多模態(tài)能力之外,在專業(yè)知識儲備和高級編碼等領(lǐng)域都處在最前列。比如, 在MMLU(大規(guī)模多任務(wù)語言理解數(shù)據(jù)集)中的得分率高達(dá)90.0%,這款MMLU數(shù)據(jù)集包含數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等57個科目,專門用于測試大模型的知識儲備和解決問題能力。 是第一個在MMLU上超越人類專家的大模型。
值得一提的是,谷歌此番并沒有透露和Pro版本的具體參數(shù)規(guī)模,但根據(jù)量子位的分析,與谷歌此前的主力大模型PaLM-2相比,參數(shù)規(guī)模上要增大許多。此前,PaLM-2被曝參數(shù)規(guī)模為3400億。
谷歌方面表示,將通過谷歌產(chǎn)品推向數(shù)十億用戶。從12月13日開始,開發(fā)者和企業(yè)客戶可以通過 AI 或 AI中的 API訪問 Pro。
今天凌晨,谷歌還同步發(fā)布了最新版本的計算芯片TPU v5p,相較上一代TPU v4性價比提升2.3倍,但這則消息完全被的光芒所掩蓋。
聲明:本站所有文章資源內(nèi)容,如無特殊說明或標(biāo)注,均為采集網(wǎng)絡(luò)資源。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系本站刪除。