ICC訊 近年來,人工智能大模型的迅猛發(fā)展催生對綠色智能計算的巨大需求。硅基光電子技術(shù),憑借其高能耗效率、低延遲、大帶寬、高并行度及與CMOS兼容等多重優(yōu)勢,已經(jīng)成為智能計算硬件領域極具發(fā)展?jié)摿Φ慕鉀Q方案。近日,國家信息光電子創(chuàng)新中心肖希博士團隊,聯(lián)合光通信技術(shù)和網(wǎng)絡全國重點實驗室、鵬城實驗室,提出一種基于相干光學頻率梳與硅光集成鏈路的新型類腦計算架構(gòu)。該架構(gòu)具有高集成性與可擴展,采用自主研發(fā)的集成相干收發(fā)芯片ICTROSA(Integrated Coherent Transmit-Receive Optical Sub-Assemblies),并完成概念驗證。實驗結(jié)果顯示,單個計算單元的卷積計算算力超過1TOPS(Tera Operations Per Second),且實現(xiàn)了全連接神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡,其推理精度與電子數(shù)字計算硬件相當。該工作為硅基光電計算邁向超POPS(Peta Operations Per Second)級別算力、以及支撐更加復雜的超算和智算應用奠定了堅實基礎。
硅光類腦計算加速器架構(gòu)
圖1:硅光類腦計算加速器架構(gòu)概念圖. (a) 硅光集成. (b)硅光類腦計算加速陣列. (c) 硅光類腦計算單元.
圖源:Optica
該硅光類腦計算加速器的核心理念來自于卷積定理,即在頻域的卷積操作等同于時域的點乘運算。因此,可利用相干接收結(jié)構(gòu)對信號實施點乘操作,從而完成對輸入信號頻域上的數(shù)值卷積(圖1)。硅基光電子器件因其具備大帶寬和低能耗等特性,能夠有效地在頻域上加載并處理大量的數(shù)據(jù),因此該架構(gòu)可獲得極大的卷積算力。數(shù)據(jù)的加載環(huán)節(jié)在電域上進行,可根據(jù)實際所需的計算數(shù)據(jù)規(guī)模、處理速率及精度要求,靈活配置系統(tǒng)的工作頻率,以實現(xiàn)最優(yōu)性能。此外,值得注意的是,該架構(gòu)的卷積算力隨計算單元數(shù)量的增長而呈現(xiàn)平方級提升,展現(xiàn)出良好的可擴展性。
硅光類腦計算加速器實驗系統(tǒng)和應用
基于自主研發(fā)的集成相干收發(fā)芯片(圖2),搭建了硅光類腦計算加速器的原型驗證系統(tǒng)(圖3)。
圖2:硅光IC-TROSA. (a) 硅光IC-TROSA,內(nèi)部集成有硅光相干收發(fā)芯片,驅(qū)動芯片,跨阻放大芯片. (b) 硅光收發(fā)芯片. (c) 硅光收發(fā)芯片結(jié)構(gòu). (d) Tx EO S21 頻率響應. (e) Rx OE S21 頻率響應.
圖源:Optica
圖3:實驗系統(tǒng)圖
圖源:Optica
如圖2(d),(e)所示,該自研芯片具備超40GHz的工作帶寬,因此,即便在現(xiàn)有實驗條件下,系統(tǒng)因信號串擾導致部分頻帶無法利用,整個系統(tǒng)仍可實現(xiàn)達1.024TOPS的卷積算力(圖4)。研究團隊還在該系統(tǒng)上部署了全連接神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡模型,并在對手寫數(shù)字的識別任務中取得了96.67%的推理精度,這一性能與相同結(jié)構(gòu)網(wǎng)絡在電子數(shù)字計算硬件上的實現(xiàn)效果相當。
圖4:不同長度的隨機向量卷積結(jié)果,n代表被卷積向量長度,橫坐標為歸一后理論輸出結(jié)果,縱坐標為歸一后的實驗測試輸出結(jié)果,可以看到雖然隨著n的增加,輸出結(jié)果逐漸偏離了y=x,但是n=128,實驗測試結(jié)果仍保持較好的準確度,此時卷積算力為1.024TOPS。
圖源:Optica
此外,該工作對系統(tǒng)的能耗效率進行了深入探討。基于最新技術(shù),該架構(gòu)有望實現(xiàn)低于10pJ/MAC能耗效率。同時,作者還討論了器件線性范圍、系統(tǒng)的功率預算,以及噪聲因素對計算精度的影響,并對硅光計算器件的設計和優(yōu)化提出了明確要求。
總結(jié)與展望
綜上所述,硅光類腦計算加速器具備計算速度和能耗效率的雙重優(yōu)勢,該工作也是對后摩爾時代光電子AI深度融合關鍵技術(shù)的一次積極探索。隨著硅基光電子技術(shù)日益成熟,有理由期待其在智算領域發(fā)揮更加重要的作用。
論文信息
Ying Zhu, Ming Luo, Xin Hua, Lu Xu, Ming Lei, Min Liu, Jia Liu, Ye Liu, Qiansheng Wang, Chao Yang, Daigao Chen, Lei Wang, and Xi Xiao, "Silicon photonic neuromorphic accelerator using integrated coherent transmit-receive optical sub-assemblies," Optica 11, 583-594 (2024)
https://doi.org/10.1364/OPTICA.514341
作者:朱盈 國家信息光電子創(chuàng)新中心
新聞來源:國家信息光電子創(chuàng)新中心