欧美亚洲美日更新在线_国产av无码图_91精品无码中文字幕在线_久久人妻中文字幕乱码_亚洲无码视频一二三区在线

CFCF2021 | 百度系統(tǒng)部郭蕾:數(shù)據(jù)中心光互聯(lián)演進(jìn)探討

光纖在線編輯部  2021-07-19 09:04:09  文章來(lái)源:自我撰寫(xiě)  版權(quán)所有,未經(jīng)書(shū)面許可嚴(yán)禁轉(zhuǎn)載.

導(dǎo)讀:6月23~25日,在CFCF2021光連接大會(huì)上,百度系統(tǒng)部光網(wǎng)絡(luò)架構(gòu)師郭蕾發(fā)表了《數(shù)據(jù)中心光互聯(lián)演進(jìn)探討》的主題報(bào)告,該報(bào)告從四個(gè)維度分享和探討了數(shù)據(jù)中心光互聯(lián)演進(jìn)的狀況,即數(shù)據(jù)中心互聯(lián)帶寬趨勢(shì),光互聯(lián)技術(shù)變化帶動(dòng)的數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)的變化,數(shù)據(jù)中心運(yùn)維模式以及組網(wǎng)規(guī)模。

7/19/2021,光纖在線訊,6月23~25日,在CFCF2021光連接大會(huì)上,百度系統(tǒng)部光網(wǎng)絡(luò)架構(gòu)師郭蕾發(fā)表了《數(shù)據(jù)中心光互聯(lián)演進(jìn)探討》的主題報(bào)告,該報(bào)告從四個(gè)維度分享和探討了數(shù)據(jù)中心光互聯(lián)演進(jìn)的狀況,即數(shù)據(jù)中心互聯(lián)帶寬趨勢(shì),光互聯(lián)技術(shù)變化帶動(dòng)的數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)的變化,數(shù)據(jù)中心運(yùn)維模式以及組網(wǎng)規(guī)模。



郭總介紹到,百度在基于AI云計(jì)算有自己的相關(guān)技術(shù)。從服務(wù)器的規(guī)模來(lái)看,最早期是百兆、千兆的吞吐量,現(xiàn)在部署的是25G到100G服務(wù)器情況,再往后規(guī)劃的是100G到400G服務(wù)器的互聯(lián)帶寬。

一、數(shù)據(jù)中心互聯(lián)帶寬變化趨勢(shì)
    首先,整個(gè)數(shù)據(jù)中心服務(wù)器的帶寬,通信技術(shù)的發(fā)展跟社會(huì)的發(fā)展是息息相關(guān)的,從早期的信息經(jīng)濟(jì)到互聯(lián)網(wǎng)經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì),再到現(xiàn)在的智能經(jīng)濟(jì),背后的驅(qū)動(dòng)在于PC,移動(dòng)互聯(lián),以及基于云的技術(shù)的不斷推進(jìn)。正是有了這些技術(shù)革新的基礎(chǔ),智能家居、AR/VR、游戲、自動(dòng)駕駛、智慧園區(qū)、安防等新的應(yīng)用得以實(shí)現(xiàn),并給我們的數(shù)據(jù)中心流量帶來(lái)了無(wú)敵的變化:帶寬急劇爆發(fā)式增長(zhǎng),對(duì)時(shí)延的要求非常高,所以無(wú)論是整個(gè)數(shù)據(jù)中心的部署還邊緣部署以及Core的部署,目標(biāo)一致:都要求低成本、高帶寬、低時(shí)延,同時(shí)高可靠性、自動(dòng)化的運(yùn)維模式。

    以百度典型的計(jì)算資源為例,縱觀近幾年CPU、網(wǎng)卡性能的趨勢(shì),CPU性能在未來(lái)三年內(nèi)我們?cè)u(píng)估可能有近2倍以上的增長(zhǎng),對(duì)應(yīng)的網(wǎng)卡峰值流量則有更高的增長(zhǎng),這兩者肯定雖不是完全成正比,但也呈一定的線性關(guān)系。

二、光互聯(lián)技術(shù)變化的趨勢(shì)
    郭總重點(diǎn)介紹了最近十年來(lái)數(shù)據(jù)中心交換芯片和光模塊的部署情況:2010~2013年,主要以10G NRZ技術(shù)為主;2013~2018年,以25G NRZ技術(shù)為主的100G光模塊為主,對(duì)應(yīng)的交找機(jī)芯片是3.2T和6.4T;2018年,出現(xiàn)了12.8T的基于50G PAM4的芯片,基于56G PAM4技術(shù)的可能存在三種形態(tài):QSFP 56 200G,QSFP-DD 400G以及QSFP 2*200G的網(wǎng)絡(luò)架構(gòu);從2020年至今,25.6T交換機(jī)芯片的發(fā)布,基于56G和112G兩種;預(yù)計(jì)2022年或2023年將會(huì)有基于112G的51.2T Serdes面世;再之后可能就是102.4T。

    回顧過(guò)去光互聯(lián)技術(shù)的發(fā)展,可以看到交換機(jī)芯片的帶寬基本上是每?jī)赡攴槐,Serdes的速率是每四年翻一倍,如此推算,102.4T大概率會(huì)是基于224G的,基于224G Serdes到底是部署CPO還是可插拔的光模塊? 從目前的情況來(lái)看, 1.6T的可插拔光模塊仍在陸陸續(xù)續(xù)地研發(fā)。

    目前百度的網(wǎng)絡(luò)架構(gòu)主流的部署還是2*25G為主,下一代規(guī)劃是4.0的網(wǎng)絡(luò)架構(gòu),將會(huì)是基于400G的交換機(jī)的形態(tài),采用的是56G PAM4;與此同時(shí)百度規(guī)劃了DCN 5.0的網(wǎng)絡(luò)架構(gòu),主要是考慮應(yīng)用基于112G PAM4的技術(shù),但最終選擇400G還是800G,具體需要根據(jù)業(yè)務(wù)流量,集群規(guī)模做出相關(guān)調(diào)整,也可能兩種形態(tài)都會(huì)規(guī)劃。再往后是1.6T CPO PAM4,郭總認(rèn)為51.2T的CPO會(huì)有小規(guī)模部署,但大規(guī)模部署可能不切實(shí)際,因?yàn)镃PO最大的問(wèn)題就是如何運(yùn)維?

三、數(shù)據(jù)中心光互聯(lián)部署的趨勢(shì)
   郭總介紹,在去年百度開(kāi)始部署了25G DAC,無(wú)論是從成本、資本支出、可靠性來(lái)看都是不錯(cuò)的。下一步延伸將會(huì)基于50G PAM4,但在跨柜的連接更期待 ACC技術(shù),因?yàn)榉⻊?wù)器與交換機(jī)的互聯(lián)會(huì)是海量的部署需求,期待看到更低成本的解決方案。從ACC的供應(yīng)來(lái)看,品質(zhì)與交付都能很好地完成,但截止目前可批量交付的芯片玩家卻只有一家,期待更多的廠商關(guān)注。

    郭總認(rèn)為再下一步,將會(huì)部署400G DR4及FR4,在DR4方案更看好硅光,并期待硅光800G CPO。從當(dāng)前400G,800G相關(guān)的模塊MSA來(lái)看,更多的是基于電信號(hào)112G以上的,對(duì)于400G郭總認(rèn)為4通道從成本、失效率等角度來(lái)講依然更低,所以更期待基于Q112的相關(guān)產(chǎn)品。

    下一代到底是可插拔還是CPO?從郭總的角度,百度在去年于對(duì)400G做過(guò)評(píng)估,發(fā)現(xiàn)400G的成本遠(yuǎn)高于100G單G的成本,而且功耗更大,400G網(wǎng)絡(luò)要想做到批量部署,需要和當(dāng)前100G網(wǎng)絡(luò)單G成本對(duì)齊。另外,從目前技術(shù)和市場(chǎng)看,200Gbps/Lane 可插拔模塊可以支持,但200Gbps/Lane +是否適合可插拔的方式,有待業(yè)界進(jìn)一步探討。 CPO的優(yōu)勢(shì)完全可以解決這些痛點(diǎn)嗎?CPO的優(yōu)勢(shì)如低功耗、高密度、低成本、信號(hào)完整性等等,但同樣面臨自己的問(wèn)題,如封裝、運(yùn)維、熱管理、I/O怎么做,生態(tài)是否成熟?
 
    流量激增,網(wǎng)絡(luò)的變化也在影響成本的變化,早期部署40G模塊時(shí),模塊成本占比約30%;而到了400G時(shí),成本激增到70%。同時(shí)功耗也是在整機(jī)的占比也隨著速率的提升在增加。

   談到DCN網(wǎng)絡(luò)設(shè)備的變化趨勢(shì),郭總表示以前是商用設(shè)備為主,功能更完善,系統(tǒng)更復(fù)雜一些。下一步會(huì)把控制面和管理面分離,控制面可以具備全局的視野對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行管控,弱化交換機(jī)的功能加速白盒設(shè)備,也可以跟上互聯(lián)網(wǎng)對(duì)于網(wǎng)絡(luò)架構(gòu)迭代的時(shí)間點(diǎn)。

四、數(shù)據(jù)中心光互聯(lián)組網(wǎng)規(guī)模、運(yùn)維模式的變化趨勢(shì)
   對(duì)于下一代DCN光互聯(lián)組網(wǎng)規(guī)模變化,郭總表示:以前主要以典型clos架構(gòu)為主,未來(lái)則是多平面,以解決跨集群帶寬的問(wèn)題,也可以做到橫向延伸。未來(lái)從leaf、spine到DC層級(jí)會(huì)采用25.6T或者是51.2T單芯片的設(shè)備;在TOR這一層采用的是8.0T或者是12.8T單芯片的設(shè)備;對(duì)于TOR和服務(wù)器互聯(lián)來(lái)說(shuō),我們有存儲(chǔ)POD和AI POD,所以希望網(wǎng)絡(luò)架構(gòu)相對(duì)比較靈活,可以有50G、100G、200G、400G的接入,分POD去部署。在交換機(jī)上連會(huì)考慮400G SR8、DR4以及FR4。

    對(duì)于下一代DCN網(wǎng)絡(luò)運(yùn)維。郭總表示百度100G也部署了好幾年,對(duì)于早期來(lái)說(shuō)能監(jiān)控的參數(shù)只有DDM的參數(shù),如溫度、電壓、電流、Tx Power&Rx Power,但這遠(yuǎn)遠(yuǎn)不夠。從400G開(kāi)始,我們會(huì)加大DCN光網(wǎng)絡(luò)運(yùn)維的情況。我們從兩方面著手:一是從模塊的角度,除了目前的DDM的監(jiān)測(cè)之外,也會(huì)定制SNR、BER的監(jiān)控等等。與此同時(shí)我們會(huì)跟交換機(jī)的link特性結(jié)合起來(lái),抖動(dòng)的特性、或者CRC、丟包、時(shí)延、Fault等數(shù)據(jù)。兩部分?jǐn)?shù)據(jù)結(jié)合,同時(shí)建立生命周期管理模型,期望達(dá)到端到端自動(dòng)優(yōu)化的功能,同時(shí)可以做到主動(dòng)觸發(fā)。我們便有了提前預(yù)知、預(yù)判的能力,提前對(duì)光模塊進(jìn)行更換。
光纖在線

光纖在線公眾號(hào)

更多猛料!歡迎掃描左方二維碼關(guān)注光纖在線官方微信

熱門(mén)搜索

熱門(mén)新聞

最新簡(jiǎn)歷

  • 李** 廣東 銷(xiāo)售類(lèi)全部項(xiàng)目經(jīng)理/主管
  • 邱** 珠海 光學(xué)工程師生產(chǎn)經(jīng)理/主管
  • 羅** 深圳 品保經(jīng)理/主管供應(yīng)商管理工程師供應(yīng)商管理工程師
  • 陳** 廣東 副總經(jīng)理/副總裁生產(chǎn)經(jīng)理/主管營(yíng)運(yùn)經(jīng)理/主管
  • 張** 蘇州 技術(shù)/工藝設(shè)計(jì)經(jīng)理/主管

展會(huì)速遞

微信掃描二維碼
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。