ICC訊 Credo Technology Group Holding Ltd(納斯達克股票代碼:CRDO)是一家致力于提供安全、高速連接解決方案的創(chuàng)新型企業(yè),隨著數(shù)據(jù)基礎(chǔ)設(shè)施市場的快速發(fā)展,數(shù)據(jù)傳輸速率和帶寬需求也不斷攀升,Credo的產(chǎn)品以其卓越的表現(xiàn),滿足了上述市場對高帶寬,高能效解決方案的需求。近日, Credo發(fā)布HiWire AEC新品 —— 線纜長度為7米的800G ZeroFlap(ZF)系列。此系列高性能HiWire ZF AEC旨在為人工智能(AI)后端網(wǎng)絡(luò)提供高度可靠的互連解決方案。
Credo的800G HiWire ZF AEC產(chǎn)品設(shè)計基于Credo已成功在第一梯隊超大規(guī)模數(shù)據(jù)中心以百萬級數(shù)量部署的HiWire AEC產(chǎn)品系列。Credo此次發(fā)布的 800G HiWire ZeroFlap AEC為AI后端網(wǎng)絡(luò)而設(shè)計。憑借更遠的傳輸距離及更優(yōu)異的信號完整性,HiWire ZF AEC支持AI集群所依賴的后端RDMA無損網(wǎng)絡(luò)傳輸,并提供零震蕩(Zero Link Flap)的穩(wěn)定鏈路連接。得益于7米的線纜長度以及最先進的機柜液冷技術(shù),HiWire 800G AEC可以在主流的GPU集群中實現(xiàn)完整的主機到交換機的跨柜連接。
HiWire ZF AEC系列包括以下四款新品
Credo的AEC產(chǎn)品負責人Ameet Suri介紹道:“不同于傳統(tǒng)光模塊鏈路震蕩問題頻現(xiàn),Credo的HiWire ZeroFlap AEC可以提供零震蕩的穩(wěn)定鏈路連接,顯著提高了GPU集群的互聯(lián)可靠性。此外,與傳統(tǒng)光學器件相比,Credo的HiWire AEC每條鏈路可節(jié)省高達14瓦的功耗,并為每個GPU單元節(jié)省高達1000美元的成本?!?
來自X Corp.協(xié)助構(gòu)建xAI的網(wǎng)絡(luò)工程師Massine Merzouk表示:“在構(gòu)建世界上最大的擁有10萬多個GPU超級計算機時,集群的可靠性至關(guān)重要,Credo的HiWire AEC為我們構(gòu)建如此龐大的系統(tǒng)提供了所需的穩(wěn)定傳輸平臺?!?
650集團的創(chuàng)始分析師Alan Weckel表示:“光模塊的鏈路震蕩(Link Flap)問題是大型GPU集群中逐漸顯現(xiàn)的技術(shù)挑戰(zhàn) —— 每次鏈路震蕩事件可能導致高達30分鐘的訓練時間損失,成本高達20萬美元。Credo HiWire AEC的硬件可靠性更高,但更重要的是,其已被證實數(shù)十億小時的現(xiàn)場運行并未發(fā)生鏈路震蕩(Link Flap)?!?
Credo將在于2024年10月15日至17日在美國圣何塞舉行的Open Compute Project (OCP 2024)峰會上展示上述HiWire ZF AEC新品。