8/23/2018,傳統(tǒng)數(shù)據(jù)中心主要基于10G網(wǎng)絡(luò)架構(gòu),為了適應(yīng)AI、深度學(xué)習(xí)、大數(shù)據(jù)計(jì)算等業(yè)務(wù)的規(guī)模部署,下一代數(shù)據(jù)中心架構(gòu)正在向25G/100G網(wǎng)絡(luò)架構(gòu)演進(jìn),在國(guó)內(nèi)已經(jīng)看到BAT等互聯(lián)網(wǎng)巨頭都實(shí)現(xiàn)了規(guī)模部署。
建設(shè)25G/100G數(shù)據(jù)中心需要大量100G光模塊,在網(wǎng)絡(luò)建設(shè)成本中占比較高,100G光模塊標(biāo)準(zhǔn)都有哪些,我們又該如何選擇呢?今天就為大家簡(jiǎn)單梳理下數(shù)據(jù)中心100G光模塊標(biāo)準(zhǔn)以及封裝格式。
100G光模塊標(biāo)準(zhǔn)組織
在開始分享光模塊標(biāo)準(zhǔn)之前,先了解下光模塊的標(biāo)準(zhǔn)化組織。對(duì)于光模塊的定義主要是兩個(gè)關(guān)鍵組織,即IEEE和MSA(Multi Source Agreement,多源協(xié)議),兩者之間互補(bǔ)而又互相借鑒。
想必大家都知道IEEE是電子電氣工程師協(xié)會(huì),而802.3是IEEE下面的一個(gè)工作組,很多10G、40G、100G、400G的光模塊標(biāo)準(zhǔn)都是由IEEE 802.3工作組提出的。
MSA是一種多供應(yīng)商規(guī)范,相比IEEE算是一個(gè)民間的非官方組織形式,針對(duì)不同的光模塊標(biāo)準(zhǔn)會(huì)形成不同的MSA協(xié)議,可以理解是產(chǎn)業(yè)內(nèi)企業(yè)聯(lián)盟行為。MSA除了定義光模塊的結(jié)構(gòu)封裝(包括外形尺寸,電連接器,引腳分配等),也會(huì)定義電接口、光接口,從而形成完整的光模塊標(biāo)準(zhǔn)。
很久以前光模塊產(chǎn)業(yè)鏈很混亂,每個(gè)廠家都有各自的結(jié)構(gòu)封裝,開發(fā)的光模塊有大有小,接口也是五花八門。為了解決這個(gè)問題,MSA多源協(xié)議應(yīng)運(yùn)而生,各廠家都遵循MSA提出的標(biāo)準(zhǔn)統(tǒng)一光模塊的結(jié)構(gòu)封裝和相關(guān)接口,這就像手機(jī)充電口的標(biāo)準(zhǔn)化。針對(duì)100G,MSA定義的標(biāo)準(zhǔn)包括100G PSM4 MSA、100G CWDM4 MSA和100G Lambda MSA。
100G光模塊標(biāo)準(zhǔn)
為了滿足不同距離的100G互聯(lián)場(chǎng)景,IEEE 以及MSA定義的100G標(biāo)準(zhǔn)超過十種,但是主流的是下面六種標(biāo)準(zhǔn)。
其中100GBASE開頭的標(biāo)準(zhǔn)都是IEEE 802.3提出的。
如上圖所示:100GBASE-LR4名稱中,LR表示long reach,即10Km,4表示四通道,即4*25G,組合在一起為可以傳輸10Km的100G光模塊。其中-R的命名規(guī)則如下:
除了IEEE提出的100GBASE系列標(biāo)準(zhǔn),為何MSA還提出了PSM4以及CWDM4標(biāo)準(zhǔn)呢?
100GBASE-SR4和100GBASE-LR4是IEEE定義的最常用的100G接口規(guī)范。但是對(duì)于大型數(shù)據(jù)中心內(nèi)部互聯(lián)場(chǎng)景,100GBASE-SR4 支持的距離太短,不能滿足所有的互聯(lián)需求,而100GBASE-LR4成本太高。因此,MSA為市場(chǎng)帶來了中距離互聯(lián)的解決方案,PSM4和CWDM4是這次革命的產(chǎn)物。
當(dāng)然100GBASE-LR4的能力完全覆蓋了CWDM4,但在2Km傳輸?shù)膱?chǎng)景下, CWDM4方案成本更低,更具競(jìng)爭(zhēng)力。
下圖是100GBASE-LR4以及100G CWDM4的原理圖:
LR4和CWDM4從原理上類似,都是通過光學(xué)器件MUX以及DEMUX將4條并行的25G通道波分復(fù)用到一條100G光纖鏈路上。不過兩者存在幾點(diǎn)區(qū)別:
1.LR4使用的光學(xué)MUX/DEMUX器件更貴
CWDM4定義的是20nm 的CWDM間隔,因?yàn)榧す馄鞯牟ㄩL(zhǎng)溫漂特性大約是0.08nm/°C,0~70°C工作范圍內(nèi)的波長(zhǎng)變化大約是5.6nm,通道本身也要留一些隔離帶。
通道一:1264.5~1277.5nm
通道二:1284.5~1297.5nm
通道三:1304.5~1317.5nm
通道四:1324.5~1337.5nm
而LR4則定義了4.5nm的LAN-WDM間隔。
通道一:1294.53~1296.59nm
通道二:1299.02~1301.09nm
通道三:1303.54~1305.63nm
通道四:1308.09~1310.19nm
通道間隔越大,對(duì)光學(xué)MUX/DEMUX器件的要求就越低,可以節(jié)省成本。
2.LR4使用的激光器更貴,功耗更大
CWDM4使用DML(Direct Modulated Laser,直接調(diào)制激光器),而LR4使用EML(Electro-absorption Modulated Laser,電吸收調(diào)制激光器)。
DML是單顆激光器,而EML是兩個(gè)器件,一顆是DML,另一顆是EAM調(diào)制器,合在一起叫做EML。DML的原理是通過調(diào)制激光器的注入電流來實(shí)現(xiàn)信號(hào)調(diào)制,由于注入電流的大小會(huì)改變激光器有源區(qū)折射率,造成波長(zhǎng)漂移(啁啾)從而產(chǎn)生色散,做高速信號(hào)調(diào)制很困難,傳的也不夠遠(yuǎn)。10KM對(duì)于DML來說有點(diǎn)力不從心,只能上EML。
注:啁啾(Chirp)是指頻率隨時(shí)間而改變(增加或減少)的信號(hào),這種信號(hào)聽起來類似鳥鳴的啾聲。
3.LR4需要額外增加TEC(Thermo Electric Cooler 半導(dǎo)體熱電制冷器)
因?yàn)長(zhǎng)R4的相鄰?fù)ǖ乐g只有4.5nm的間隔,所以激光器需要放到TEC上控溫。電路上需要放置TEC Driver芯片,Laser也要集成到TEC材料上來做,這樣一來,相比CWDM4,LR4的成本又有所增加。
基于以上三點(diǎn),100GBASE-LR4標(biāo)準(zhǔn)的光模塊成本更高,所以MSA提出的100G CWDM4標(biāo)準(zhǔn)很好地補(bǔ)充了100GBASE-LR4在2Km以內(nèi)成本過高導(dǎo)致的空白。
除CWDM4之外,PSM4也是一種中距離的傳輸方案,那么相比CWDM4,PSM4有何優(yōu)劣勢(shì)呢?
100G PSM4規(guī)范定義了8根單模光纖(4個(gè)發(fā)送和4個(gè)接收)的點(diǎn)對(duì)點(diǎn)100 Gbps鏈路,每個(gè)通道以25 Gbps的速率發(fā)送。每個(gè)信號(hào)方向使用四個(gè)相同波長(zhǎng)且獨(dú)立的通道。因此,兩個(gè)收發(fā)器通常通過8光纖MTP / MPO單模跳線進(jìn)行通信。PSM4的傳輸距離最大為500米。
簡(jiǎn)單總結(jié)一下,如下圖所示,由于使用了波分復(fù)用器,所以CWDM4的光模塊成本要高于PSM4光模塊,不過CWDM4收發(fā)雙向只需要兩根單模光纖,遠(yuǎn)少于PSM4的8根單模光纖,隨著距離的增加,PSM4方案的總成本上升得非常快。在實(shí)際應(yīng)用中需要依據(jù)互聯(lián)距離來決定使用PSM4還是CWDM4。
聊完100G中長(zhǎng)距光模塊標(biāo)準(zhǔn),再來看100G短距光模塊。
100G短距光模塊標(biāo)準(zhǔn)主要有100GBASE-SR10和100GBASE-SR4兩種標(biāo)準(zhǔn)。當(dāng)年為了滿足市場(chǎng)上出現(xiàn)的100G需求, 100GBASE-SR10標(biāo)準(zhǔn)最早被提出且應(yīng)用于100G的短距互聯(lián)。
100GBASE-SR10標(biāo)準(zhǔn)使用10 x 10Gbps并行通道實(shí)現(xiàn)100Gbps點(diǎn)對(duì)點(diǎn)傳輸,電信號(hào)的速率是10G,光信號(hào)速率也是10G,采用NRZ的調(diào)制方式及64B/66B的編碼方式。因?yàn)镮EEE 802.3早在2010年提出100GBASE-SR10標(biāo)準(zhǔn),當(dāng)時(shí)交換機(jī)ASIC芯片(Application Specific Integrated Circuit)電接口最高只能支持10G,即CAUI-10(10通道 x 10Gbps)。
伴隨著交換機(jī)ASIC芯片電接口速率從10Gpbs提升到25G bps,電接口標(biāo)準(zhǔn)從CAUI-10(10通道 x 10Gbps)升級(jí)到CAUI-4(4通道 x 25Gbps),通道從SR10的并行10通道減少到并行4通道,光模塊的器件個(gè)數(shù)得以減少、成本得以降低、模塊尺寸得以縮小、功耗得以降低。
光模塊尺寸的減少使得交換機(jī)每1U空間可以提供的100G接口密度更大,基于以上的優(yōu)勢(shì),目前100GBASE-SR4已經(jīng)取代100GBASE-SR10成為目前主流的100G短距光模塊標(biāo)準(zhǔn)。
100G光模塊封裝
僅有光模塊的光接口以及電接口規(guī)范是不夠的,還需要配套的結(jié)構(gòu)封裝才能算是完整的光模塊解決方案。100G光模塊的封裝格式主要有CFP、CFP2、CFP4以及QSFP28。
CFP最早被提出,短距傳輸應(yīng)用100GBASE-SR10標(biāo)準(zhǔn),長(zhǎng)距傳輸應(yīng)用100GBASE-LR4。第一代CFP長(zhǎng)距傳輸方案如下,因?yàn)殡娊涌谀芰χ挥蠧AUI-10,所以需要內(nèi)置Gearbox(下圖的10:4 Serializer)來實(shí)現(xiàn)10 x 10Gbps與4 x 25Gbps電信號(hào)的轉(zhuǎn)換。后來隨著電信號(hào)提升到CAUI-4,第二代CFP(CFP2/CFP4)長(zhǎng)距傳輸方案中不需要內(nèi)置Gearbox。
但是,CFP尺寸實(shí)在太大了,隨著光模塊的集成度越來越高,后來的發(fā)展方向是把尺寸做小、功耗做低,CFP得以演進(jìn)到CFP2、CFP4,再到后來出現(xiàn)的QSFP28。相比CFP4,QSFP28的尺寸更小、功耗更低,QSFP28更小的尺寸使得交換機(jī)擁有更高的端口密度(典型的形態(tài)是每塊板卡可以部署36個(gè)100G接口)。目前QSFP28是數(shù)據(jù)中心內(nèi)部100G光模塊的主流封裝格式。
最后總結(jié)一下,關(guān)于25G/100G數(shù)據(jù)中心內(nèi)部互聯(lián)光模塊如何選擇,建議大家不妨參考如下標(biāo)準(zhǔn):
不超過100米的100G短距互聯(lián)場(chǎng)景(TOR-LEAF),使用100GBASE-SR4 QSFP28光模塊;100米到500米的100G中距互聯(lián)場(chǎng)景(LEAF-SPINE),使用100G PSM4 QSFP28光模塊;500米到2Km的100G中長(zhǎng)距互聯(lián)場(chǎng)景(LEAF-SPINE、SPINE-CORE),使用100G CWDM4 QSFP28光模塊;超過2Km的長(zhǎng)距互聯(lián)場(chǎng)景(CORE-MAN),使用100GBASE-LR4 QSFP28光模塊。
最后附上專業(yè)術(shù)語解釋
作者:銳捷網(wǎng)絡(luò) 陳冬林