欧美亚洲美日更新在线_国产av无码图_91精品无码中文字幕在线_久久人妻中文字幕乱码_亚洲无码视频一二三区在线

應(yīng)用分享丨光交換在云計(jì)算和HPC基礎(chǔ)設(shè)施解耦應(yīng)用

光纖在線編輯部  2024-10-08 12:19:58  文章來(lái)源:原文轉(zhuǎn)載  

導(dǎo)讀:隨著人工智能等應(yīng)用進(jìn)入商業(yè)主流,云計(jì)算和高性能計(jì)算(HPC)服務(wù)提供商面臨巨大壓力,需擴(kuò)展計(jì)算平臺(tái)以滿足不斷增長(zhǎng)的性能需求。同時(shí),在環(huán)境壓力和電力需求激增的雙重挑戰(zhàn)下,這些供應(yīng)商需探索控制資本支出(CAPEX)和降低能耗的策略。大語(yǔ)言模型訓(xùn)練、醫(yī)學(xué)圖像處理等應(yīng)用推動(dòng)了對(duì)高性能云計(jì)算網(wǎng)絡(luò)的新要求,進(jìn)而促使GPU等加速器在集群中廣泛應(yīng)用。

10/08/2024,光纖在線訊,隨著技術(shù)的演進(jìn),傳統(tǒng)的服務(wù)器結(jié)構(gòu)正逐步被解耦計(jì)算平臺(tái)所取代。這些平臺(tái)按需將資源以特定比例捆綁成“裸金屬”硬件主機(jī),實(shí)現(xiàn)靈活配置。這一過(guò)程可視為“硬件虛擬化”,允許多個(gè)物理主機(jī)在需要時(shí)動(dòng)態(tài)組合,通過(guò)專門的編排功能控制,共享底層資源池。這些平臺(tái)支持單一或多租戶使用,通過(guò)“軟件虛擬化”或云技術(shù)提供虛擬機(jī)(VM)服務(wù)。

關(guān)鍵構(gòu)建塊包括CPU、內(nèi)存、存儲(chǔ)及加速硬件如GPU和FPGA,用于支持高性能或通用云計(jì)算應(yīng)用。在上圖中,"Composed Machine #1" 是基于四個(gè)CPU單元構(gòu)建的,這些CPU單元來(lái)自資源池中的"Server #1"和"Server #2",以及四個(gè)RAM單元,只從"Server #1"獲取。在"Server #1"中,有兩個(gè)GPU資源單元,如果在非分解平臺(tái)上,這些資源將會(huì)被浪費(fèi)和未使用,但在這種情況下,它們被用來(lái)提供"Composed Machine #2" 所需的一半GPU資源,另一半來(lái)自"Server #2"。



解耦實(shí)現(xiàn)的效率和性能優(yōu)化取決于可以訪問(wèn)和消耗資源塊的粒度。在最細(xì)粒度下,每個(gè)資源塊都具備板載硬件以實(shí)現(xiàn)高速、低延遲的連接。這雖需新的硬件設(shè)計(jì),但提供了最大靈活性。同時(shí),也存在較粗粒度的解耦形式,與當(dāng)前硬件更兼容,可作為向完全解耦平臺(tái)過(guò)渡的橋梁。

在解耦計(jì)算平臺(tái)中,選擇合適的互連網(wǎng)絡(luò)技術(shù)對(duì)系統(tǒng)性能和能耗至關(guān)重要。常見(jiàn)的互連形式有分組交換和線路交換。線路交換提供確定性、電路交換和固定帶寬的數(shù)據(jù)路徑,特別適用于那些原本在服務(wù)器主板上低級(jí)直接連接的硬件資源,或通過(guò)特定總線技術(shù)(如PCI Express)連接的硬件資源。

光互連網(wǎng)絡(luò)技術(shù)的核心優(yōu)勢(shì)

使用光電路交換技術(shù)構(gòu)建的全光互連網(wǎng)絡(luò),也稱為全光交換,能夠滿足確定性和高容量端到端數(shù)據(jù)路徑的需求。光互連網(wǎng)絡(luò)的優(yōu)勢(shì)包括:
1、降低功耗:與電互連相比,光互連結(jié)構(gòu)的功耗顯著降低。
2、降低時(shí)延:光傳輸路徑的時(shí)延更低。
3、易于擴(kuò)展和升級(jí):光互連網(wǎng)絡(luò)物理擴(kuò)展和升級(jí)能力更強(qiáng)。
4、透明性和兼容性:對(duì)解耦資源間的串行數(shù)據(jù)流量格式和線路速率具有固有透明性,支持未來(lái)平滑升級(jí)。

在光鏈路通過(guò)交換網(wǎng)絡(luò)時(shí),最小化或消除前向糾錯(cuò)(FEC)對(duì)于減少端到端延遲至關(guān)重要。這要求光交換技術(shù)具有盡可能低的損耗,以確保最佳的誤碼率性能。



光電路交換技術(shù)的可擴(kuò)展性源于可以使用低損耗的光路交換機(jī)構(gòu)建多級(jí)交換網(wǎng)絡(luò),從而支持大量終端。例如,POLATIS DirectLightTM交換機(jī)允許構(gòu)建四個(gè)或更多級(jí)別的交換網(wǎng)絡(luò),而不會(huì)超出典型收發(fā)器的光學(xué)損耗預(yù)算。這使得光交換結(jié)構(gòu)可以按需增長(zhǎng),在初期采用少量OCS進(jìn)行架構(gòu)設(shè)計(jì)和構(gòu)建,用戶可以根據(jù)實(shí)際需求逐步擴(kuò)展OCS規(guī)模,降低初期投入成本。


POLATIS 384x384 with LC connectors


實(shí)踐探索:dReDBox項(xiàng)目與解耦計(jì)算的概念驗(yàn)證

從2016年至2019年,HUBER+SUHNER Polatis作為成員單位,參與了由工業(yè)界和學(xué)術(shù)界合作伙伴組成的聯(lián)合項(xiàng)目dReDBox。該項(xiàng)目由歐洲委員會(huì)資助,旨在探索智算中心的計(jì)算資源解耦。項(xiàng)目期間成功展示了硬件原型、編排軟件和用戶應(yīng)用程序。



上圖項(xiàng)目硬件原型展示了單塊板卡可容納多達(dá)16個(gè)細(xì)粒度資源塊(稱為“磚塊”)。每個(gè)“磚塊”配備了高容量、多通道、基于硅光的板載光學(xué)收發(fā)器陣列,使得這些磚塊資源可以通過(guò)一個(gè)可擴(kuò)展、低損耗的光路交換機(jī)進(jìn)行互聯(lián)共享,參考下圖。



解耦計(jì)算帶來(lái)的顯著益處

通過(guò)使用專用的交換結(jié)構(gòu)靈活地互連資源,解耦計(jì)算帶來(lái)了多種顯著的益處:
1、即時(shí)組合硬件計(jì)算平臺(tái):可以根據(jù)需求即時(shí)組合不同硬件資源。
2、靈活擴(kuò)展計(jì)算平臺(tái):可根據(jù)工作負(fù)載的特性,靈活地?cái)U(kuò)展計(jì)算平臺(tái)的規(guī)模和資源配置。
3、動(dòng)態(tài)調(diào)整計(jì)算平臺(tái)大小:在運(yùn)行特定工作負(fù)載的過(guò)程中,可以根據(jù)需要調(diào)整計(jì)算平臺(tái)的大小。
4、節(jié)省運(yùn)營(yíng)成本(OPEX):可以關(guān)閉不需要的資源,節(jié)省運(yùn)營(yíng)成本。

運(yùn)營(yíng)商的優(yōu)勢(shì)包括:
1、選擇最佳硬件:可以選擇不同供應(yīng)商提供的最優(yōu)質(zhì)硬件。
2、按需升級(jí):可以按需升級(jí)不同類型和/或資源塊。

這些優(yōu)勢(shì)帶來(lái)了顯著的資本支出(CAPEX)節(jié)省,并減少了在硬件更換計(jì)劃期間的服務(wù)停機(jī)時(shí)間。最近,一家超大規(guī)模互聯(lián)網(wǎng)企業(yè)發(fā)表多篇論文,介紹了在數(shù)據(jù)中心內(nèi)部基于數(shù)據(jù)分組的交換結(jié)構(gòu)中混合采用OCS光路交換技術(shù),獲得了類似的收益。

因此,解耦平臺(tái)在服務(wù)云計(jì)算和高性能計(jì)算(HPC)提供商中更為適用,能夠更有效地應(yīng)對(duì)各種需求。硬件組件可以獨(dú)立升級(jí),而編排軟件完全由運(yùn)營(yíng)商控制,解耦可以被視為從硬件定義的基礎(chǔ)設(shè)施(HDI)向更加靈活的軟件定義的基礎(chǔ)設(shè)施(SDI)過(guò)渡的關(guān)鍵推動(dòng)者。

隨著商業(yè)產(chǎn)品的開(kāi)發(fā),以光路交換為核心的云計(jì)算/HPC平臺(tái)解耦已經(jīng)逐漸成熟。通過(guò)概念驗(yàn)證和眾多模擬預(yù)期系統(tǒng)性能特征和運(yùn)營(yíng)成本的學(xué)術(shù)研究,可以清楚地看到運(yùn)營(yíng)此類基礎(chǔ)設(shè)施的益處。

技術(shù)亮點(diǎn):POLATIS®專有光纖交換技術(shù)的獨(dú)特優(yōu)勢(shì)

POLATIS®在解耦方面相較于其他全光(OOO)切換解決方案具有顯著優(yōu)勢(shì),包括:

最低的光損耗和卓越的穩(wěn)定性。
最廣泛的對(duì)稱(NxN)交換機(jī)系列:矩陣規(guī)模從16x16到576x576端口,支持網(wǎng)絡(luò)解耦不斷發(fā)展的需求,同時(shí)模塊化擴(kuò)展性可連接數(shù)千個(gè)光纖端點(diǎn)。
高密度交換矩陣:占用極少的機(jī)架空間。
協(xié)議和數(shù)據(jù)速率無(wú)關(guān):可切換任何類型的信號(hào)。
單一連接的切換時(shí)間<50毫秒。
幾乎零信號(hào)時(shí)延:實(shí)現(xiàn)最快資源傳輸。
真正的暗光纖切換:無(wú)需光線即可建立和保持連接,可預(yù)配未來(lái)路徑。
完全軟件控制:可與領(lǐng)先的編排解決方案無(wú)縫對(duì)接。
支持最廣泛的SDN接口:包括NETCONF和RESTCONF。
高可靠性:適用于關(guān)鍵任務(wù)應(yīng)用,配備雙冗余、熱插拔網(wǎng)絡(luò)接口控制器和電源。
新款POLATIS 576x576交換機(jī):具有雙冗余控制器和可選的現(xiàn)場(chǎng)可尋址備用端口,增加了可靠性。
環(huán)保低功耗:可平衡解耦機(jī)架的高功率密度。



關(guān)鍵字: 光交換 解耦平臺(tái) 凌云光
光纖在線

光纖在線公眾號(hào)

更多猛料!歡迎掃描左方二維碼關(guān)注光纖在線官方微信

熱門搜索

熱門新聞

最新簡(jiǎn)歷

  • 劉** 衡陽(yáng) 總工程師/副總工程師研發(fā)部經(jīng)理光學(xué)工程師
  • 劉** 衡陽(yáng) 總工程師/副總工程師技術(shù)/工藝設(shè)計(jì)經(jīng)理/主管光學(xué)工程師
  • 田** 陽(yáng)江 副總經(jīng)理/副總裁品保經(jīng)理/主管營(yíng)運(yùn)經(jīng)理/主管
  • 何** 深圳 研發(fā)部經(jīng)理生產(chǎn)經(jīng)理/主管技術(shù)/工藝設(shè)計(jì)工程師
  • 陳** 淮安 項(xiàng)目經(jīng)理/主管技術(shù)/工藝設(shè)計(jì)工程師技術(shù)支持工程師

展會(huì)速遞

微信掃描二維碼
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。