2/15/2023,光纖在線訊,ChatGPT引發(fā)的算力增長熱潮直接引發(fā)國內CPO相關技術研發(fā)廠商的股價大漲。雖然以光纖在線多站在國內光模塊廠商的角度看問題,CPO會是對國內光模塊公司擅長的可插拔技術的顛覆性技術,會顛覆中國光模塊供應商的競爭優(yōu)勢。而且可插拔技術其實一直也在進步。所以,或許我們不應該對CPO那么感冒。
剛剛結束的Photonic West上也有一場關于CPO技術的Panel討論。市場研究公司Lightcounting最新的研報對此進行了報道。這場討論之所以有趣,首先在于提出了一個很好的問題,既然網(wǎng)絡產(chǎn)生的功耗只占當前數(shù)據(jù)中心總體功耗的2-3%,那么我們?yōu)槭裁催要對這個問題這么看重呢?由此引發(fā)的就是,真的需要CPO嗎?
來自相干公司的Vipul Bhat引用兩年前科學雜志一篇文章的數(shù)據(jù)指出人們對于數(shù)據(jù)中心功耗的擔心有點過了(就像時下人們擔心全球變暖一樣?)。這篇文章比較了2010年和2018年的數(shù)據(jù)中心功耗,發(fā)現(xiàn)只增長了8%,將這一數(shù)據(jù)外插到2022-2023年度,增速只有2-3%。而導致這一低增速的背后是數(shù)據(jù)中心效率的提升,包括第一,負載從企業(yè)數(shù)據(jù)中心向云數(shù)據(jù)中心的遷移;第二,占功耗90%的服務器和存儲器效率的穩(wěn)步提升。而直接部署光通信產(chǎn)品的網(wǎng)絡部分導致的功耗占比在2012年是1%,到2018年是2%,2022年大約是3%。那么問題來了?致力于降低數(shù)據(jù)中心光傳輸功耗的CPO技術還值得這么重視嗎?
對此問題,LightCounting給出了自己的分析。如下圖可看,縱坐標的對數(shù)的每年數(shù)據(jù)中心功耗(不是累計的),橫坐標是年份。這種對數(shù)坐標下的直線增長意味著指數(shù)級的增長。所以,LC的結論是,對質疑者來說,當年發(fā)現(xiàn)功耗開始變大時,可能已經(jīng)太晚了。2018年到2022年期間,數(shù)據(jù)中心部署的光模塊的總功耗是330MW(秦山核電站總裝機容量的20分之一),或者1.2TWh(12億度電),只占到同期云數(shù)據(jù)中心總功耗的1%,但問題是到2028年,這一比例將達到8%以上,這還考慮到可插拔模塊自身功耗效率的提升,從100G模塊的35pJ每比特到800G模塊的20pJ每比特。8%將是一個不可忽視的比例。因為對于一直受到供電限制的數(shù)據(jù)中心運營商來說,光模塊增加的功耗,必須要從減少服務器和存儲的部署來找補。
一個更顯著的問題是AI服務器如今受到光連接的功耗和成本的嚴重限制。Nvidia說,如果沒有光連接的限制,他們本可以部署的光模塊會是現(xiàn)在的32倍。人工智能的計算需要大量的GPU和帶寬支持,光連接會是最好的解決方案,如果光連接的功耗和成本能夠降低的化。
來自Ayar Labs,博通,IBM和Ranovus等公司的下一代CPO設計預計在能量效率上可以達到2-3pJ每比特。Ayar Labs共同創(chuàng)辦人Rajeev Ram教授指出,采用現(xiàn)在的技術,在200G每通道下,有望實現(xiàn)0.1pJ每比特。他在MIT的團隊正在通過低電壓調制器以及更好的探測器等手段爭取實現(xiàn)0.001pJ每比特的連接功耗,F(xiàn)在MIT和Ayar Labs的方案實現(xiàn)低連接功耗都是基于較低的速率,比如Ayar Labs是64G NRZ來實現(xiàn)2pJ,每比特,是否能在112G每通道以上實現(xiàn)1pJ每比特的能量效率還要觀察。
LightCounting認為:“光通信行業(yè)正處在十字路口,我們可以堅持可插拔逐步改善,人工智能可能因此放慢發(fā)展速度,采用受限于帶寬的優(yōu)化算法;蛘呶覀儾捎闷渌k法,冒險來采用CPO技術來實現(xiàn)根本性改變。這將根本改變光模塊工業(yè)的面貌。這一路徑激動人心,但是充滿挑戰(zhàn)。無論如何,錯過這個機會都是一個錯誤。”