ICC訊 近日,在比利時舉辦的ITF World 2024大會上,AMD董事長兼CEO蘇姿豐獲得了IMEC創(chuàng)新大獎,以此表彰其在行業(yè)創(chuàng)新與領導方面的成就,大家熟悉的戈登·摩爾(提出著名的摩爾定律)和比爾·蓋茨都曾經獲得該大獎。
圖源:tomshardware
而在獲獎后的演講中,蘇姿豐透露了AMD未來三年的計劃,一個充滿野心的計劃:AMD正在努力實現(xiàn)2025年將計算能效提高到2020年的30倍的計劃,而在這個計劃之后,還有在2027年將能效提高到100倍(相對于2020年)的目標。
圖源:AMD
計算能效,簡單來說就是指計算機在執(zhí)行計算任務時,利用能源的有效程度,雖然在各種算力、核心數(shù)等性能參數(shù)面前,計算能效看起來不太起眼,實質上卻是核心性能、功耗管理、制程工藝等技術的體現(xiàn)。
更高的計算能效,能夠讓計算機系統(tǒng)在運行時有著更高的效率,早在2014年,AMD就曾經設定過一個名為“25x20”的計劃,希望用6年時間將AMD的處理器、顯卡等產品的能效提高25倍。
這個計劃的結果,就是我們現(xiàn)在所熟知的Zen架構和RDNA架構,憑借兩個架構的出色表現(xiàn),AMD在2020年不僅完成了既定的目標,還超額做到了31.77倍的能效提升。
AMD為何一直將計算能效提升作為核心目標之一?首先,我們從目前的AI運算需求出發(fā),看看計算能效提升會帶來什么?
狂奔的超級計算中心
眾所周知,AI已經成為當前半導體業(yè)界最核心、最龐大的需求,這個需求正在驅動著半導體戰(zhàn)車的車輪滾滾向前。前段時間,作為AI時代的領航者,半導體公司英偉達的市值就一度達到2.62萬億美元,甚至超過了德國所有上市公司的市值總和。
讓英偉達市值暴漲的唯一原因,就是其在AI計算硬件領域的統(tǒng)治級實力,目前全球最頂尖的專業(yè)計算卡均出自英偉達,除了主流的H100、H200等芯片外,英偉達前段時間又發(fā)布了GB100和GB200,僅單個芯片的算力就相當于以前的一臺超級計算機。
圖源:英偉達
當然,強大的算力背后并不是沒有代價的,H100的TDP高達700W,而最新的GB200的TDP更是高達2700W。而英偉達提供的官方方案中,單個GB200 NVL72服務器就可以搭載最高36個GB200芯片,僅芯片本身的功耗就最高可達97200W,并且不包括配套的其他硬件功耗。
這還僅僅是開始,一個超級計算中心往往由多個服務器單元組合而成,亞馬遜此前就公布了一項計劃,預計采購2萬個GB200用來組建一個全新的服務器集群。而走在AI研究最前沿的微軟和OpenAI,前段時間更是公布了一個雄心勃勃的計劃——星際之門。
據(jù)悉,該計劃共分為五個階段,目的是建造一個人類歷史上最大的超級計算中心,預計整個計劃的投資將達到1150億美元,建成后將需要數(shù)十億瓦的電力支持。這座‘星際之門’建成后,僅以耗電量算就足以在全球各大城市中排名前20,更何況它還只是眾多計算中心的一員而已。
圖源:AI Revolution
實際上,早在去年開始,就有多份報告指出計算中心的耗電量正在猛增,并且一度導致美國部分城市出現(xiàn)電力供應不足的問題。從能源角度來說,一座發(fā)電廠從選址到建成運行,往往需要數(shù)年的時間,如果遇到環(huán)保組織的抗議,還有可能拖延更久。
在能源問題短時間內無法解決的情況下,提高計算能效就是唯一的方法,通過更高效地利用每瓦時電力來維持更大規(guī)模的AI模型訓練。實際上,有人認為OpenAI的ChatGPT-5進展緩慢,很大程度上就是受限于算力規(guī)模無法大幅度提升。
蘇姿豐在演講中也提到,提高計算能效可以更好地解決能源與算力之間的矛盾,并且讓超級計算中心可以被部署到更多的地方。在一些AI企業(yè)的構想中,未來每一座城市都應該擁有自己的超級AI中心,負責處理智能駕駛、城市安全等各方面的AI需求。
想要達成這個目標,同時不顯著增加城市的能源負擔,更高計算能效的顯卡就是唯一的解決方案。而且,計算能效也直接關系到AI計算的成本,只有將AI計算的成本降到更低,大面積普及AI才可能成為現(xiàn)實。
AMD的瘋狂計劃
在英偉達的刺激下,作為在GPU領域唯一能夠與英偉達抗衡的企業(yè),AMD一直在加速推進旗下AI芯片的研發(fā)與上市進度,并先后發(fā)布了MI300、V80等多款專業(yè)運算卡。
據(jù)報道,為了能夠加速AI芯片的進度,蘇姿豐對GPU團隊進行重組,抽調大量人員支持AI芯片的研發(fā),以至于下一代的AMD消費級顯卡發(fā)布計劃受到嚴重影響,比如取消原定的旗艦產品發(fā)布計劃,僅保留中端顯卡的發(fā)布計劃等。
在集中科研力量后,AMD目前的進展速度飛快,最新的MI300X在性能上已經超過英偉達的H100,大多42 petaFLOPs,并且擁有高達192GB的顯存,功耗卻與H100相當,僅為750W。
圖源:AMD
憑借優(yōu)異的計算能效,MI300X成功引起了市場的關注,微軟、OpenAI、亞馬遜等科技巨頭都提交了采購需求,讓AMD在計算領域的芯片出貨量暴增。根據(jù)相關機構預測,2024年AMD的AI芯片出貨量可能達到英偉達出貨量的10%,并在明年增長至30%。
據(jù)蘇姿豐介紹,為了能夠提高芯片的計算能效,AMD研發(fā)了多項新的技術,比如2.5D/3D混合封裝技術。利用這項技術,AMD可以在封裝面積不變的前提下給芯片塞入更多的晶體管和內存,降低芯片與內存交換數(shù)據(jù)的消耗,有效提升每瓦時的計算性能。
圖源:AMD
此外,AMD還將改進芯片架構,推出能效更高的新一代架構,預計最快將于2025年發(fā)布,并實現(xiàn)25x30(2025年計算能效提升30倍)的目標。不過,想要實現(xiàn)27x100(2027年計算能效提升100倍)的目標,還需要在諸多領域做出提升,僅靠制程工藝升級和架構升級恐怕還不太夠。
不得不說,AMD的這個計劃非常瘋狂,一旦成功,那么AMD將有望再次與英偉達并肩而行。
那么英偉達的反應是什么?其實英偉達很早就給出了回應,早前發(fā)布的GB200就是答案,這顆史無前例的算力怪物在計算能效方面的提升同樣矚目。據(jù)英偉達的介紹,GB200的推理性能是H100的30倍,計算能效是H100的25倍(綜合考慮算力、功耗等參數(shù)后的結果)。
顯然,英偉達的腳步也并不慢,在接下來的3年時間里,不管AMD能否完成瘋狂的百倍計劃,AI芯片市場都會迎來一場革新。