ICC訊 被ChatGPT壓制整整一年之后,谷歌展開(kāi)了最強(qiáng)反擊戰(zhàn)。12月7日凌晨,谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)和Deepmind CEO戴密斯·哈薩比斯(Demis Hassabis)在谷歌官網(wǎng)聯(lián)名發(fā)文稱(chēng),其最新大模型Gemini 1.0(雙子星)版本正式上線。在他們看來(lái),Gemini的發(fā)布僅僅是一個(gè)開(kāi)始,更大的技術(shù)迭代、產(chǎn)品應(yīng)用和生態(tài)構(gòu)建宏圖即將展開(kāi)。
從測(cè)試數(shù)據(jù)來(lái)看,Gemini大模型在知識(shí)儲(chǔ)備、專(zhuān)業(yè)能力和多模態(tài)等方面均超越GPT-4,而且部分核心能力首次超越了人類(lèi)專(zhuān)家,這不僅對(duì)OpenAI構(gòu)成了強(qiáng)有力的沖擊和挑戰(zhàn),也標(biāo)志著AI大模型浪潮進(jìn)入一個(gè)新的階段。但即使Gemini“效果驚人”,谷歌似乎并沒(méi)有十足底氣,包括沒(méi)有公布Gemini頂尖大模型的性能數(shù)據(jù),不免被質(zhì)疑吹噓過(guò)度和測(cè)試標(biāo)準(zhǔn)偏頗。
首超人類(lèi)專(zhuān)家,多維領(lǐng)先GPT-4
作為籌備一年之久的GPT-4強(qiáng)力競(jìng)品,Gemini 1.0是目前谷歌能拿出手的功能最為強(qiáng)悍、適配最為靈活的大模型,分別包括Gemini Ultra、Gemini Pro和Gemini Nano三種不同套件。其中Ultra是谷歌最大、最強(qiáng)模型,適用于高度復(fù)雜的任務(wù);Pro能力稍弱,是一個(gè)可擴(kuò)展至多任務(wù)的模型;Nano則是一款適用于端側(cè)設(shè)備運(yùn)行的模型。
不過(guò),谷歌方面并沒(méi)有透露Gemini Ultra和Gemini Pro的具體參數(shù)大小,只是明確稱(chēng)規(guī)模最小的Gemini Nano的參數(shù)分別為18億(Nano-1)和32.5億(Nano-2)。但有傳言稱(chēng),Gemini Ultra的參數(shù)規(guī)模達(dá)到萬(wàn)億級(jí)別,訓(xùn)練動(dòng)用的算力是GPT-4的5倍以上。
Gemini發(fā)布后,外界尤其關(guān)注其對(duì)GPT-4的挑戰(zhàn)。谷歌DeepMind產(chǎn)品副總裁伊萊·柯林斯(Eli Collins)表示,團(tuán)隊(duì)一直在對(duì)Gemini進(jìn)行嚴(yán)格的測(cè)試并評(píng)估其在各種任務(wù)中的性能。從自然圖像、音頻和視頻理解到數(shù)學(xué)推理,在被大型語(yǔ)言模型(LLM)研究和開(kāi)發(fā)中廣泛使用的32項(xiàng)學(xué)術(shù)基準(zhǔn)中,Gemini Ultra的性能有30項(xiàng)都超過(guò)了目前最先進(jìn)的水平。
據(jù)MMLU(大規(guī)模多任務(wù)語(yǔ)言理解數(shù)據(jù)集)的測(cè)試結(jié)果,Gemini Ultra的得分率為90%,這款MMLU數(shù)據(jù)集包含數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等57個(gè)科目,專(zhuān)門(mén)用于測(cè)試大模型的知識(shí)儲(chǔ)備和解決問(wèn)題能力。作為對(duì)比,人類(lèi)專(zhuān)家的得分率為89.8%,GPT4得分率為86.4%。這說(shuō)明Gemini Ultra是第一個(gè)在MMLU測(cè)試中超過(guò)人類(lèi)專(zhuān)家的模型。
在多模態(tài)方面,Gemini Ultra在權(quán)威MMMU基準(zhǔn)測(cè)試中也獲得了59.4%的SOTA分?jǐn)?shù),高于GPT-4V的56.8%。這項(xiàng)基準(zhǔn)測(cè)試是由跨不同領(lǐng)域的多模式任務(wù)組成,需要大模型進(jìn)行深思熟慮的推理過(guò)程,而谷歌Gemini大模型多模態(tài)背后的技術(shù)原理也引發(fā)業(yè)界關(guān)注。對(duì)此,谷歌DeepMind首席科學(xué)家杰夫·迪恩(Jeff Dean)團(tuán)隊(duì)撰寫(xiě)了60頁(yè)技術(shù)報(bào)告來(lái)闡述。
以往,多模態(tài)大模型是將純文本、純視覺(jué)和純音頻模型拼接在一起,例如OpenAI的GPT-4、DALL·E和Whisper等,但這并不是最優(yōu)解。據(jù)戴密斯·哈薩比斯透露,Deepmind團(tuán)隊(duì)將Gemini設(shè)計(jì)為原生多模態(tài),從一開(kāi)始就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練。然后,利用額外的多模態(tài)數(shù)據(jù)對(duì)其進(jìn)行微調(diào),以進(jìn)一步提高其有效性。這有助于Gemini從最初階段就能對(duì)輸入的各種內(nèi)容順暢地進(jìn)行理解和推理,并優(yōu)于現(xiàn)有的多模態(tài)模型。
谷歌方面稱(chēng),Gemini將通過(guò)其系列產(chǎn)品推向數(shù)十億用戶,其中谷歌聊天機(jī)器人Bard由Gemini Pro微調(diào)版本驅(qū)動(dòng),在170多個(gè)國(guó)家和地區(qū)提供英語(yǔ)服務(wù)并持續(xù)擴(kuò)展,這是Bard自推出后的最大升級(jí)。而谷歌的Pixel 8 Pro將成為首款搭載Gemini Nano的智能手機(jī),明年年初將推出Bard Advanced,提供Gemini Ultra模型的最佳性能。此外,值得注意的是,在Gemini亮相同時(shí)谷歌還推出了專(zhuān)為大模型設(shè)計(jì)的新一代TPU——Cloud TPU v5p。
“復(fù)仇者聯(lián)盟”坐鎮(zhèn),競(jìng)爭(zhēng)行業(yè)王座
一定程度上,谷歌發(fā)布Gemini多少讓外界有些意外。在今年5月谷歌的開(kāi)發(fā)者大會(huì)上,谷歌便高調(diào)對(duì)外宣布下一代大語(yǔ)言模型Gemini,按照原計(jì)劃將在12月份對(duì)外正式發(fā)布。但近期傳出谷歌將發(fā)布Gemini推遲至明年1月,谷歌方面給出的理由是“在某些非英語(yǔ)任務(wù)方面的表現(xiàn)不佳”,這曾引發(fā)了外界猜測(cè)谷歌在Gemini研發(fā)方面遇到了困難和挑戰(zhàn)。
過(guò)去一年來(lái),全世界的AI公司掀起“對(duì)標(biāo)”GPT熱潮,其中谷歌被視為當(dāng)仁不讓的最強(qiáng)大對(duì)手,但在與OpenAI的競(jìng)爭(zhēng)中,回應(yīng)卻總步履蹣跚?;蛟S是迫于外界預(yù)期壓力以及加速追趕OpenAI,谷歌最終按原計(jì)劃對(duì)外發(fā)布了Gemini。無(wú)論如何,Gemini的正式登場(chǎng)不僅形成了對(duì)OpenAI的有力反擊,也意味著AI大模型浪潮進(jìn)入到一個(gè)全新階段。
從如今公布的Gemini參數(shù)和使用效果來(lái)看,谷歌的“AI家底”自然不菲。例如在官方技術(shù)報(bào)告中,谷歌提到是使用TPUv5e和TPUv4對(duì)Gemini進(jìn)行大規(guī)模訓(xùn)練,旨在將其打造成可靠、可擴(kuò)展的訓(xùn)練模型和最高效的服務(wù)模型。在TPU上,Gemini的運(yùn)行速度明顯快于其早期規(guī)模較小、能力較弱的模型,如被曝參數(shù)規(guī)模為3400億的PaLM-2。而最新的TPU v5p一旦納入運(yùn)營(yíng),將進(jìn)一步減少谷歌訓(xùn)練Gemini大模型相關(guān)的時(shí)間投入等。
此外,為了強(qiáng)化技術(shù)班底,谷歌曾在今年4月直接把谷歌大腦(Google Brain)和DeepMind合并在一起,其中Google Brain曾經(jīng)締造了Tensorflow與Transformer架構(gòu),DeepMind則曾憑借AlphaGo掀起上一輪AI熱潮、創(chuàng)造了AlphaFold預(yù)測(cè)蛋白質(zhì)折疊。由于此前在行業(yè)競(jìng)爭(zhēng)中失利,這一團(tuán)隊(duì)也被外界調(diào)侃是“AI復(fù)仇者聯(lián)盟”。而正是基于匯合兩個(gè)頂尖實(shí)驗(yàn)室力量的緊密攻關(guān),Gemini才得以在多項(xiàng)指標(biāo)上實(shí)現(xiàn)了對(duì)GPT-4的絕地反擊。
前不久,OpenAI經(jīng)歷了全球矚目的戲劇性“董事會(huì)內(nèi)亂”,其CEO山姆·阿爾特曼(Sam Altman)突遭董事會(huì)罷免,但最終迅速回歸。此后,OpenAI的未來(lái)發(fā)展增添許多新的不確定性,包括推出的GPT高級(jí)版無(wú)限期暫停等,這也給了谷歌等公司更多追趕的時(shí)間和機(jī)會(huì)。
目前來(lái)看,雖然OpenAI占有先機(jī),通過(guò)ChatGPT獲得了大量訓(xùn)練數(shù)據(jù)反饋,但谷歌也依然有著自身的技術(shù)和生態(tài)優(yōu)勢(shì)。據(jù)外媒此前報(bào)道稱(chēng),Gemini至少在一個(gè)重要方面比GPT-4強(qiáng),即除了來(lái)自網(wǎng)絡(luò)的公共信息之外,Gemini還利用了來(lái)自谷歌旗下產(chǎn)品的大量專(zhuān)有數(shù)據(jù)。因此,在理解用戶特定查詢的意圖時(shí)更準(zhǔn)確,而且錯(cuò)誤答案(即幻覺(jué))也似乎更少。
在Gemini正式亮相后,業(yè)界不乏對(duì)其肯定和追捧,其中英偉達(dá)AI科學(xué)家范麟熙(Jim Fan)表示,遲到總比不做好,OpenAI王座終于有了強(qiáng)力競(jìng)爭(zhēng)者。但對(duì)于Gemini“效果驚人”,也有分析稱(chēng),谷歌有些吹噓過(guò)度以及測(cè)試標(biāo)準(zhǔn)有失偏頗等,包括即便是通過(guò)Gemini Ultra對(duì)比,但很多項(xiàng)也都僅是略高于GPT-4和GPT-4V等模型。不過(guò),艾倫人工智能研究所前CEO奧倫·埃齊奧尼(Oren Etzioni)則稱(chēng),“沒(méi)有理由懷疑Gemini在這些基準(zhǔn)上比GPT-4更好,但沒(méi)準(zhǔn)GPT-5會(huì)比Gemini做得更好?!?
新聞來(lái)源:愛(ài)集微
相關(guān)文章