本文轉(zhuǎn)載自微信公眾號(hào)“光通信充電寶”,作者馮振華博士,訊石經(jīng)允許略作刪改。
本篇為800G MSA白皮書(shū)解讀的第二篇。開(kāi)始之前,先復(fù)習(xí)一下之前我們講過(guò)的根據(jù)光模塊支持的協(xié)議規(guī)范大致判斷其支持的傳輸距離。SR通常對(duì)應(yīng)幾百米,多模傳輸;DR一般對(duì)應(yīng)500m,并行單模傳輸,F(xiàn)R對(duì)應(yīng)2km, 一般CWDM傳輸。
1. 用于800G SR場(chǎng)景的8x100G方案
a) 800G SR應(yīng)用場(chǎng)景需求分析
對(duì)于100m級(jí)別的數(shù)據(jù)中心內(nèi)傳輸,業(yè)界其實(shí)一直受到VCSEL傳輸技術(shù)每通道速率極限約為100G的的困擾,似乎難以繼續(xù)提升速率。 這也是國(guó)內(nèi)數(shù)據(jù)中心廠商最初采用的技術(shù),采用多模傳輸技術(shù),支持的距離僅為30~50m,因而只能覆蓋有限的SR應(yīng)用場(chǎng)景。800G MSA的目標(biāo)是為SR應(yīng)用開(kāi)發(fā)低成本的8x100G光模塊,至少保證SR中大部分重要的應(yīng)用,支持60~100m傳輸,如圖1所示。進(jìn)一步地說(shuō),就是800G MSA工作組企圖定義一種通過(guò)高度集成的方式使成本線性下降的發(fā)射機(jī)技術(shù),以便能夠在早期的時(shí)候快速推向800G高密度光互連市場(chǎng)。低成本的800G SR8通過(guò)提供低成本的串行100G服務(wù)器連接可以支持當(dāng)前數(shù)據(jù)中心的演進(jìn)趨勢(shì):交換機(jī)端口不斷增長(zhǎng),每個(gè)機(jī)架服務(wù)器數(shù)量不斷減少。如圖1所示,800G MSA工作組將基于100G PAM4技術(shù)為單模光纖互連定義一種低成本的物理媒介相關(guān)子層(PMD)規(guī)范。另外,由于SR應(yīng)用低延時(shí)的需求,800G MSA光模塊中將采用KP4 FEC來(lái)實(shí)現(xiàn)糾錯(cuò),其它的DSP算法還包括簡(jiǎn)單的時(shí)鐘恢復(fù)和均衡。還需要為PSM8模塊定義一種連接器以實(shí)現(xiàn)與8x100G相連。
圖1. 800G SR8/PSM8光模塊結(jié)構(gòu)框圖及800G MSA規(guī)范范圍
看起來(lái)相比于常規(guī)的SR模塊,800G SR8將不再采用基于VCSEL的多模方案,而是采用并行單模傳輸方式,即PSM8,調(diào)制格式為PAM4,包含DSP芯片。
b) 8x100G方案可行性分析
正如上面所分析,單通道100G的速率可能限制了400G-SR8中多模方案繼續(xù)向800G-SR8的演進(jìn)?;贗EEE的理論模型,我們可以推測(cè)當(dāng)波特率達(dá)到50G波段時(shí)多模光纖MMF支持的傳輸距離將不超過(guò)50m,如表1所示。主要限制因素不外乎VCSEL的調(diào)制帶寬和MMF的模間色散。雖然通過(guò)優(yōu)化器件和光纖設(shè)計(jì),借助于強(qiáng)大的DSP算法可以將傳輸距離延伸到100m左右,但代價(jià)是高成本,大延時(shí)和功耗?;诖?,MSA 可插拔800G光模塊工作組推薦采用單模傳輸技術(shù)來(lái)實(shí)現(xiàn)800G-SR8場(chǎng)景互連。
表1. 基于IEEE理論模型推測(cè)MMF帶寬與傳輸距離的關(guān)系
為了確?;趩文9饫wSMF的方案具有更低的成本和功耗,必須為800G-SR8定義合理的PMD標(biāo)準(zhǔn)需求。PMD層定義至少需要滿足以下三個(gè)原則:1)允許基于多種方案的發(fā)射機(jī)技術(shù),如DML,EML及硅光SiPh。2)為達(dá)到目標(biāo)鏈路性能,器件所有的潛能都能被充分利用。3)只要滿足可靠的鏈路性能,盡可能放松PMD層的參數(shù)指標(biāo)。下面將結(jié)合實(shí)驗(yàn)研究結(jié)果針對(duì)這三個(gè)原則進(jìn)行說(shuō)明和分析。首先在功率預(yù)算方面,基于單模的800G-SR8預(yù)計(jì)與400G-SR8很類似,唯一的區(qū)別是需要為新定義的PSM8單模連接器定義插損。這意味著直接采用當(dāng)前400G-SR8互連中成熟的光電器件,DSP芯片就可以滿足800G-SR8的功率預(yù)算要求。因此,除了定義PSM8連接器之外,定義800G-SR8 PMD規(guī)范的最大挑戰(zhàn)就在于找到合適的發(fā)射機(jī)光調(diào)制幅度(OMA),消光比(ER),發(fā)射機(jī)眼圖閉合代價(jià)(TDECQ)以及接收機(jī)靈敏度。為了找到這些合適的指標(biāo),MSA工作組測(cè)試并評(píng)估了一些不同的發(fā)射機(jī)的BER性能,如圖2所示。
圖2. (a采用目前商用400G DSP芯片測(cè)試的EML發(fā)射機(jī)的BER與OMA結(jié)果;(b) 采用目前商用400G DSP芯片測(cè)試SiPh發(fā)射機(jī)的BER與OMA結(jié)果;(c)采用目前商用400G DSP芯片測(cè)試DML發(fā)射機(jī)的BER與OMA結(jié)果
上述實(shí)驗(yàn)結(jié)果是在單波長(zhǎng)100G PAM4信號(hào)上基于商用400G DSP芯片實(shí)時(shí)測(cè)得的BER與OMA關(guān)系曲線。其中EML和SiPh的100G結(jié)果可能已經(jīng)被大家所熟知,因?yàn)榻鼛啄暌恢痹谟懻撍鼈儯贿^(guò)基于DML方案的靈敏度也還算不錯(cuò),只是誤碼平臺(tái)稍微高了一些,但只要低于KP4 FEC的BER閾值就行。由于硅光發(fā)射機(jī)的損耗大一些,所以其出光功率較其它方案小,因此在定義800G SR8最小OMA指標(biāo)的時(shí)候需要盡量考慮適當(dāng)放寬松。注意到上面DML的結(jié)果中雖然利用了比EML和SiPh器件帶寬小的DML器件,但是采用比IEEE定義的400GE參考接收機(jī)強(qiáng)大的商用DSP芯片,還是可以達(dá)到較好的均衡效果,實(shí)現(xiàn)與EML和SiPh類似的OMA靈敏度,滿足800G SR8功率預(yù)算。在800G SR8應(yīng)用中為了充分釋放DSP的潛能,接收機(jī)遵從性測(cè)試如TDECQ需要重新定義以匹配商用DSP芯片實(shí)際的均衡能力,比如抽頭數(shù)多于當(dāng)前所定義的5個(gè)抽頭。另一方面考慮到SR場(chǎng)景下更低的靈敏度要求以及800G光模塊中嚴(yán)格的功耗限制,在將來(lái)的800G光模塊中也會(huì)推薦使用低復(fù)雜度的DSP模式。消光比ER作為直接與功耗相關(guān)的指標(biāo),理論上只要保證鏈路可靠傳輸,ER越低越好?;谝陨系姆治?,MSA工作組認(rèn)為基于SMF的低成本、低功耗的方案可以用于800G-SR應(yīng)用的有前景的解決方案。2. 用于800G FR場(chǎng)景的4x200G方案
a) 800G FR場(chǎng)景需求分析
基于PAM4調(diào)制技術(shù)的單通道200G傳輸是強(qiáng)度調(diào)制直接探測(cè)(IMDD)系統(tǒng)下一個(gè)重要的技術(shù)里程碑,也是實(shí)現(xiàn)4通道800G光互連的基礎(chǔ),甚至還可以基于它進(jìn)一步實(shí)現(xiàn)1.6T高速互連。如圖3所示,工作組將定義全套的PMD和部分的PMA層規(guī)范,包括在112G電輸入信號(hào)上包裹一層新的低功耗、低延時(shí)的FEC方案,以改善調(diào)制解調(diào)器的凈編碼增益。業(yè)內(nèi)聯(lián)盟的目標(biāo)之一是為發(fā)射機(jī)和接收機(jī)次組件開(kāi)發(fā)新一代寬帶電、光模擬器件,包括常用的模數(shù)轉(zhuǎn)換器ADC和數(shù)模轉(zhuǎn)換器DAC。為了滿足可插拔800G光模塊對(duì)功耗的嚴(yán)格要求,下一代200G PAM4 DSP芯片將會(huì)采用更低結(jié)點(diǎn)CMOS工藝來(lái)制造,如7nm/5nm,并且還需要采用低復(fù)雜度、低功耗的數(shù)字信號(hào)處理算法來(lái)對(duì)信道進(jìn)行均衡。
圖3. 800G FR4/PSM4光模塊結(jié)構(gòu)框圖及800G MSA規(guī)范范圍
4x200G 的FR互連方案看起來(lái)有兩種實(shí)現(xiàn)路徑,一種是4對(duì)單模光纖的PSM4方案,另一種采用基于CWDM4的單對(duì)光纖方案,對(duì)外的光口密度上還是有比較大的差異,CWDM4模塊的成本和復(fù)雜度應(yīng)該也是有明顯增加的。
b) 4x200G方案的可行性分析
由于在LAN-WDM中需要采用TEC進(jìn)行溫度控制,而在單通道200G的應(yīng)用中希望避免溫控。800G-FR4的功率預(yù)算將基于CWDM4來(lái)分析。與功率預(yù)算相關(guān)的因素主要包括:鏈路插損,多徑干涉MPI,差分群時(shí)延DGD,發(fā)射機(jī)和色散代價(jià)TDP。根據(jù)IEEE標(biāo)準(zhǔn)中發(fā)布的模型,MPI和DGD導(dǎo)致的代價(jià)計(jì)算如表2所示。由于單通道200G的波特率比100G高,因而色散導(dǎo)致的代價(jià)肯定會(huì)更大。工作組推薦的合理的TDP值為3.9dB。綜上,如果考慮接收機(jī)的老化,耦合損耗,典型發(fā)射機(jī)的出光功率,工作組認(rèn)為200G PAM4接收機(jī)的靈敏度需要在-5dBm左右。
表2. 800G-FR4功率預(yù)算分析
相比于100G, 200G的波特率加倍,導(dǎo)致SNR劣化3dB,可能有必要采用更強(qiáng)的FEC糾錯(cuò)碼來(lái)維持-5dBm的靈敏度,并且避免在Pre FEC BER門(mén)限之上出現(xiàn)誤碼平臺(tái)。因此需要如之前所說(shuō)的,光模塊實(shí)現(xiàn)的時(shí)候需要在KP4 FEC之上額外包裹一層低延時(shí),低復(fù)雜度的FEC。新的FEC糾前誤碼門(mén)限的設(shè)置可以根據(jù)實(shí)際光鏈路性能、功率預(yù)算的需求來(lái)決定。
工作組還通過(guò)仿真和實(shí)驗(yàn)來(lái)進(jìn)一步分析了單通道200G的鏈路性能。鏈路中采用器件的參數(shù),如表3所示。實(shí)驗(yàn)結(jié)果表明當(dāng)新FEC的BER門(mén)限設(shè)置為2e-3時(shí),接收機(jī)的靈敏度可以達(dá)到目標(biāo),如圖4(a)所示。但是實(shí)驗(yàn)中采用了最大似然序列估計(jì)(MLSE)算法來(lái)補(bǔ)償信道中由于窄帶濾波引起的強(qiáng)烈碼間干擾ISI。圖4(a)中的虛線代表的是基于實(shí)驗(yàn)器件參數(shù)仿真的結(jié)果。與實(shí)驗(yàn)結(jié)果一起,仿真研究表明系統(tǒng)性能的限制因素是DA/AD,驅(qū)動(dòng)及電光調(diào)制器等器件的帶寬。假設(shè)未來(lái)幾年高帶寬器件會(huì)推向市場(chǎng),仿真中基于同一系統(tǒng)但將器件帶寬設(shè)置得更大后,發(fā)現(xiàn)在DSP中僅采用前向均衡算法(FFE)就可以在Pre FEC BER=2e-3時(shí)滿足相應(yīng)的靈敏度要求,結(jié)果如圖4(b),這與理論期望是相符的。表3. 實(shí)驗(yàn)和仿真中用到的器件參數(shù)
圖4. (a)現(xiàn)有器件帶寬條件下,單通道200G實(shí)驗(yàn)和仿真結(jié)果,(b)采用改善帶寬的器件后單通道200G的FFE均衡仿真結(jié)果
基于上述分析,仍然建議在800G-FR4場(chǎng)景的遵從性測(cè)試中滿足相應(yīng)的TDECQ指標(biāo)。只是在測(cè)試TDECQ時(shí)采用的參考接收機(jī)的FFE抽頭數(shù)需要增加到一個(gè)合適的值,該值是多少也是值得進(jìn)一步討論研究的。當(dāng)然,如果未來(lái)100Gbd器件的能力(帶寬)不及我們預(yù)期的話,將還是不得不在FR4場(chǎng)景中考慮使用更復(fù)雜的算法如MLSE,那也就意味著需要開(kāi)發(fā)新的合規(guī)方案。
c) 4x200G封裝方案分析
為了保證高速信號(hào)在Nyquist頻率范圍內(nèi)(即56GHz)考慮信號(hào)的完整性,4x200G發(fā)射機(jī)和接收機(jī)的封裝設(shè)計(jì)需要重新考慮。圖5中給出了發(fā)射機(jī)的兩種可能的實(shí)現(xiàn)方式。方法A是傳統(tǒng)的方案,Driver與調(diào)制器放一起。相比,方案B中倒裝設(shè)計(jì)的Driver芯片與DSP芯片共封裝在一起來(lái)優(yōu)化RF傳輸線上信號(hào)完整性。這兩種技術(shù)都是目前可以實(shí)現(xiàn)的。初步仿真研究表明,采用方案B能得到較好的結(jié)果并且?guī)捒杀WC大于56GHz。方案A的S21頻響曲線上的紋波可能是由于Driver輸入上的信號(hào)反射導(dǎo)致的,這可以通過(guò)Dirver的匹配設(shè)計(jì)來(lái)優(yōu)化,從而進(jìn)一步改善方案A的最終性能。
圖6. 發(fā)射機(jī)的兩種封裝方式。S21仿真中考慮了RF傳輸線(紅線),走線及調(diào)制器,使用的EML芯片3dB帶寬假設(shè)是60GHz
而在接收端需要減小寄生電容來(lái)實(shí)現(xiàn)高帶寬的光電探測(cè)器(PD),同時(shí)配合大帶寬的跨阻放大器(TIA)來(lái)保證接收機(jī)的帶寬。采用當(dāng)前的半導(dǎo)體技術(shù)來(lái)實(shí)現(xiàn)這樣的器件是沒(méi)有技術(shù)問(wèn)題的。甚至內(nèi)業(yè)已經(jīng)有公司投入了大量的精力來(lái)研發(fā)相應(yīng)的產(chǎn)品,預(yù)計(jì)1~2年內(nèi)就能達(dá)到量產(chǎn)。另外,PD和TIA之間的連接也很重要,需要優(yōu)化和分析,因?yàn)榧纳?yīng)會(huì)影響性能。
d)單通道200G中的前向糾錯(cuò)編碼(FEC)
總的來(lái)說(shuō),前面已經(jīng)提到需要PreFEC BER 門(mén)限為2e-3的更強(qiáng)的FEC方案來(lái)確保200G PAM4接收機(jī)的靈敏度要求。圖7給出了級(jí)聯(lián)方案和替換方案的對(duì)比結(jié)果。第一種方法中,中間光口不再采用KP4 FEC,而替換成新的更大開(kāi)銷的FEC,這在總開(kāi)銷和凈編碼增益方面是有優(yōu)勢(shì)的。第二種方案中,采用級(jí)聯(lián)FEC方式,將KP4繼續(xù)保留為外層編碼,與新的內(nèi)碼聯(lián)合使用。這種級(jí)聯(lián)碼的好處是時(shí)延和功耗小,因而更適用于800G-FR4的應(yīng)用場(chǎng)景。
圖7. 800G FEC方案:全新替換FEC Vs 級(jí)聯(lián)KP4 FEC
將如圖8所示的代數(shù)碼與KP4串聯(lián),是實(shí)現(xiàn)2E-3 BER門(mén)限FEC較直接的方法,最小化功耗和端到端的時(shí)延。單誤碼糾正能力的Hamming碼和雙誤碼糾正能力的BCH碼都是這種級(jí)聯(lián)方案中代數(shù)碼的合適選擇。這兩種內(nèi)碼的開(kāi)銷約為6%,結(jié)合一個(gè)64個(gè)測(cè)試Pattern的簡(jiǎn)單軟入硬出(SIHO)遞推譯碼算法,Hamming和BCH碼都能實(shí)現(xiàn)優(yōu)于2e-3門(mén)限的糾錯(cuò)性能。在400GBASE-R中定義的符號(hào)分布本質(zhì)上可以作為級(jí)聯(lián)編碼的奇偶交織器,10k bit的延時(shí)也足夠用來(lái)與光纖中引入的噪聲進(jìn)行去相關(guān)。
圖8. KP4和線性碼的級(jí)聯(lián)方案結(jié)構(gòu)圖
3. 800G DR場(chǎng)景的可能方案
如表4所示,實(shí)現(xiàn)800G DR有四種路徑。首先,800G MSA中定義的SR8方案可以直接拓展500m的傳輸范圍。由于并行光纖方案需要更多的光纖,這種應(yīng)用下長(zhǎng)達(dá)500m的光纖成本可能是個(gè)問(wèn)題。其次,基于現(xiàn)有的FR4方案僅需要將收發(fā)器件加倍就可以提供2x400G CWDM方案,這看起來(lái)是在光纖資源消耗和方案成熟度上取得了不錯(cuò)的平衡,但其成本和功耗可能會(huì)限制其實(shí)際應(yīng)用。第三,下一代的單通道200G方案(PSM4或CWDM4)可能可以覆蓋DR的應(yīng)用。這種方式僅需要4對(duì)收發(fā)光模塊,看起來(lái)具有最低的功耗和成本。但由于業(yè)界成熟度、實(shí)際可行性方面還有待進(jìn)一步證實(shí),因而這種方案何時(shí)能商用的時(shí)間尚不明確 。
表4. 800G DR的四種可能方案
總的來(lái)說(shuō),目前討論了用于800G DR的四種可能方案,工作組將繼續(xù)關(guān)注每種技術(shù)路線的發(fā)展情況,在將來(lái)合適的時(shí)候給出推薦的方案。
4. 總結(jié)與展望
800G可插拔MSA將率先定義800G-SR8和FR4兩種場(chǎng)景的光模塊。在SR8場(chǎng)景中,為了將更多的技術(shù)納入考慮范圍,引入基于SMF的單模方案,工作組考慮對(duì)PMD層的一些關(guān)鍵參數(shù)作出適當(dāng)調(diào)整,最終使得OMA和ER的要求得以放松來(lái)減小功耗,并且用于TDECQ測(cè)試的參考接收機(jī)也需要重新定義。工作組還展示了單通道200G光傳輸用于800G FR4應(yīng)用的技術(shù)可行性。實(shí)驗(yàn)和仿真結(jié)果表明需要在光模塊中增加一個(gè)低延時(shí),低功耗的FEC編碼子層來(lái)實(shí)現(xiàn)目標(biāo)功率預(yù)算。有關(guān)這種新FEC的技術(shù)細(xì)節(jié)將會(huì)在800G-FR4標(biāo)準(zhǔn)規(guī)范中展示以便于實(shí)現(xiàn)多廠家互通。同時(shí),器件帶寬提升及模塊的封裝設(shè)計(jì)優(yōu)化也是需要深入研究的兩個(gè)問(wèn)題。
800G可插拔MSA預(yù)計(jì)將于今年Q4發(fā)布第一版規(guī)范,少量已經(jīng)在做原型驗(yàn)證的器件及第一批800G光模型預(yù)期在2021年可以出樣品。400GE產(chǎn)品已經(jīng)在市場(chǎng)上開(kāi)始起量,800G可插拔光模塊將會(huì)利用新的生態(tài)系統(tǒng)來(lái)為下一代25.6T和51.2T交換機(jī)提供更高的互連密度以實(shí)現(xiàn)高性價(jià)比的單通道100G和200G光互連。
展望800G以上速率到1.6T,業(yè)界開(kāi)始看到了可插拔光模塊可能存在的局限性。采用經(jīng)典的PCB,用于C2M互連的SerDes不太可能擴(kuò)展到單通道200G的速率,這時(shí)候需要將模擬電子器件/芯片和光器件更靠近交換芯片。無(wú)論業(yè)界最終會(huì)選擇共封裝光學(xué)(CPO),或是板上光學(xué)(OBO),亦或是升級(jí)版的可插拔,該MSA定義的單通道200G將會(huì)為800G和1.6T互連的必要的基礎(chǔ)單元,重要性和意義不言而喻。
以上技術(shù)內(nèi)容基本上是我對(duì)照白皮書(shū)翻譯過(guò)來(lái)的,為了避免理解的偏差,我盡量采用的是直譯的方法,中間可能穿插了些許評(píng)論。當(dāng)然受限于本人的才識(shí)和能力,錯(cuò)誤和疏漏在所難免,還望大家指正。