欧美亚洲美日更新在线_国产av无码图_91精品无码中文字幕在线_久久人妻中文字幕乱码_亚洲无码视频一二三区在线

阿里巴巴謝崇進:智能計算的光互聯(lián)需求與挑戰(zhàn)

光纖在線編輯部  2024-07-15 16:17:21  文章來源:本站消息  版權所有,未經(jīng)許可嚴禁轉載.

導讀:CFCF2024光連接大會上,阿里巴巴首席通信科學家謝崇進詳解了邁向智算時代,網(wǎng)絡架構以及光互聯(lián)的需求變化與挑戰(zhàn)。

7/15/2024,光纖在線訊,AI算力正成為光互聯(lián)領域新的增長引擎。在傳統(tǒng)的通用計算時代,算力大約每兩年翻一番;然而,在AI計算時代,這一速度被大大加快,算力每3到4個月就能翻一番,相當于每年增長200倍。因此,今年光互聯(lián)市場展現(xiàn)出強勁的增長勢頭。

近日于蘇州舉辦的CFCF2024光連接大會上,阿里巴巴首席通信科學家謝崇進詳解了邁向智算時代,網(wǎng)絡架構以及光互聯(lián)的需求變化與挑戰(zhàn)。

回顧過去十年阿里數(shù)據(jù)中心網(wǎng)絡的演進,阿里云幾乎每兩年就會有一次技術更新。從架構上看,從3.x版本到7.x版本,十年間經(jīng)歷了五代的變革;從1Gbps提升到今天的100Gbps,服務器的處理速度增長了100倍;從10Gbps發(fā)展到今天的200Gbps/400Gbps,光互聯(lián)的速度增長了40倍;而對分帶寬則在十年間提升了1000倍,主要是由于網(wǎng)絡架構的變革,從傳統(tǒng)網(wǎng)絡到Clos網(wǎng)絡的轉變。而在智算時代,隨著AI技術帶來的網(wǎng)絡架構變革,網(wǎng)絡帶寬的增長潛力仍然巨大,有望持續(xù)實現(xiàn)千倍的增長。

阿里為AI大規(guī)模計算推出的智算網(wǎng)絡HPN 7.0,為了AI的GPU增加后端加速計算網(wǎng)絡,架構發(fā)生了很大的變化。阿里于2023年7月開始大規(guī)模部署基于阿里自研的SONiC操作系統(tǒng),PHY-Less VSR設計的51.2T交換機,采用可插拔400G QSFP112光模塊,并依然采用單模和多模的混合技術,光模塊類型以400G VR4 和400G DR4為主,少量采用400G FR4。

謝崇進分享說,AI本質上是大規(guī)模并行計算的體現(xiàn),它涉及多種并行機制,包括矢量并行化,將復雜的運算分解為更小的單元,同時這些單元之間需要進行更頻繁的交互,這無疑對網(wǎng)絡帶寬提出了更高的要求。

在服務器和網(wǎng)絡的功耗方面,我們也見證了顯著的變化。服務器方面,數(shù)據(jù)中心正從以X86架構為主的通用計算服務器,轉向以GPU為主導的高性能計算服務器。在網(wǎng)絡層面,數(shù)據(jù)中心的網(wǎng)絡架構也從傳統(tǒng)的以太網(wǎng)轉向基于RoCE的以太網(wǎng)或基于InfiniBand(IB)的高性能網(wǎng)絡。

      
AI計算的基礎設施與傳統(tǒng)通用計算的基礎設施在多個方面存在顯著差異,包括服務器配置、處理器性能、網(wǎng)絡架構以及功耗管理等。我們追求在AI計算中實現(xiàn)高吞吐量、低延遲和高可靠性,期望建立一個無損的網(wǎng)絡環(huán)境。這一點凸顯了光互連技術的重要性以及在技術創(chuàng)新方面的迫切需求。

龐大的AI集群首先需要更多的光互聯(lián),光互聯(lián)鏈路主要包括主機ASIC和可插拔光模塊之間的電信道,以及光模塊之間的光鏈路;其次需要更大的帶寬和更高速的SerDes,預計明年200G/lane將真正走向市場;同時需要兼容更低時延、更低功耗、更高可靠性,包括鏈路質量/故障和丟包直接影響計算的效率和性能。尤其是低時延與低功耗,有賴于業(yè)界使用全新的光電調(diào)制器和激光器,同時進一步完善CPO/ LPO/ TRO等光電調(diào)制技術。

對于CPO,謝崇進認為CPO最大的挑戰(zhàn)在于改變了現(xiàn)有供應生態(tài),拋棄了現(xiàn)有成熟的可插拔模塊生態(tài),而面向下一代可插拔技相仍然可行。對于LPO最大的挑戰(zhàn)在于需要全新的大量的互聯(lián)互通,包括交換機、LPO光模塊之間的認證測試工作。對于TRO/LRO,具備更大的潛力,最大的優(yōu)勢在于測試變的簡單、互聯(lián)互通更容易,其功耗和時延等均介于Fully Retimed和LPO之間。

展望未來,AI時代更多的互聯(lián)需求,還將延伸至GPU-GPU之間scale-up 網(wǎng)絡的互聯(lián),CPU-GPU-DPU之間的 PCIe/CXL網(wǎng)絡互聯(lián)。而更多的芯片與芯片之間光互聯(lián)則具備更大的潛力,因此更多的創(chuàng)新技術,包括NPO、CPO、IPO技術,以及光交換OCS技術的發(fā)展迅速。
關鍵字: 阿里巴巴 謝崇進 AI
光纖在線

光纖在線公眾號

更多猛料!歡迎掃描左方二維碼關注光纖在線官方微信
微信掃描二維碼
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。