12/03/2021,光纖在線訊,借助 NVIDIA AI技術,戴爾、浪潮、Microsoft Azure 和 Supermicro 在今天發(fā)布的新 MLPerf 基準測試中創(chuàng)下快速訓練 AI 模型的記錄。
看看誰剛剛在快速訓練 AI 模型方面創(chuàng)下新速度記錄:戴爾科技、浪潮、Supermicro和在 MLPerf 基準測試中首次亮相的 Azure 均在使用 NVIDIA AI。
在今天宣布的 MLPerf 訓練 1.1 結果中,NVIDIA平臺在所有八個熱門工作負載中都創(chuàng)下了記錄。
圖示:在新一輪的測試中,NVIDIA AI 訓練所有模型的速度都快于替代方案。
NVIDIA A100 Tensor Core GPU 提供了最出色每芯片性能, Selene 是NVIDIA內部基于模塊化NVIDIA DGX SuperPOD架構構建的AI超級計算機,借助NVIDIA InfiniBand網(wǎng)絡和NVIDIA軟件棧進行擴展,A100在Selene上實現(xiàn)了最快的AI訓練速度 。
圖示:NVIDIA A100 GPU 在所有八項 MLPerf 1.1 測試中均實現(xiàn)最好的每芯片訓練性能。
云服務更上一層樓
根據(jù)最新結果,在訓練 AI 模型方面,Azure 的 NDm A100 v4 實例的速度遙遙領先。它運行了新一輪的每項測試,擴展到多達 2,048 個 A100 GPU。
Azure 不僅展示了出色性能,而且在美國的六個地區(qū),現(xiàn)在所有人都可以租借和使用其出色性能。
AI 訓練是一項需要大量投入的大型工作。NVIDIA希望用戶借助他們選擇的服務或系統(tǒng)以創(chuàng)紀錄的速度訓練模型。
因此,NVIDIA將 NVIDIA AI 與面向云服務、主機托管服務、企業(yè)和科學計算中心的產(chǎn)品相結合。
服務器制造商各顯身手
在 OEM 中,浪潮憑借其八路GPU服務器NF5688M6 和NF5488A5液冷服務器在單節(jié)點性能方面創(chuàng)下了最多記錄。戴爾和 Supermicro 在四路 A100 GPU 系統(tǒng)上創(chuàng)下了記錄。
共有 10 家 NVIDIA 合作伙伴提交了本輪測試結果,其中包含 8 家 OEM 和 2 家云服務提供商。它們占所有提交的 90% 以上。
這是 NVIDIA 生態(tài)系統(tǒng)在 MLPerf 訓練測試中的第五次亮相,也是到目前為止最出色的亮相。
NVIDIA的合作伙伴之所以積極參與,是因為他們知道 MLPerf 是唯一符合行業(yè)標準、經(jīng)過同行評審的 AI 訓練和推理基準測試。對于評估 AI 平臺和供應商的客戶來說,這是一個有價值的工具。
為速度認證的服務器
百度 PaddlePaddle、戴爾科技、富士通、技嘉科技、慧與、浪潮、聯(lián)想和 Supermicro 提交了基于本地數(shù)據(jù)中心的結果(單節(jié)點和多節(jié)點任務)。
NVIDIA幾乎所有的 OEM 合作伙伴都在 NVIDIA 認證系統(tǒng)上運行了測試,NVIDIA為需要加速計算的企業(yè)客戶驗證了服務器。
提交的范圍展示了 NVIDIA 平臺的廣度和成熟度,該平臺為各種規(guī)模的企業(yè)提供最佳的解決方案。
既快速又靈活
NVIDIA AI 是唯一用于提交所有基準測試和用例的平臺參與者,這展示了其通用性和高性能?焖凫`活的系統(tǒng)提供客戶所需的生產(chǎn)力,以加快他們的工作速度。
AI訓練基準測試涵蓋當今最熱門的八個 AI 工作負載和場景,例如計算機視覺、自然語言處理、推薦系統(tǒng)、增強學習等。
MLPerf 測試透明、客觀,因此用戶可以依靠結果做出明智的購買決策。該行業(yè)基準測試組織成立于 2018 年 5 月,得到阿里巴巴、ARM、Google、Intel 和 NVIDIA 等數(shù)十家行業(yè)領先公司的支持。
三年內加速 20 倍
回顧過去,數(shù)據(jù)顯示,僅在過去 18 個月,NVIDIA A100 GPU 的性能就提升了 5 倍以上。這要歸功于軟件的持續(xù)創(chuàng)新,這也是NVIDIA目前工作的重心。
自從三年前 MLPerf 測試首次亮相,NVIDIA 的性能提高了 20 倍以上。這種大規(guī)模加速源于NVIDIA在全棧 GPU、網(wǎng)絡、系統(tǒng)和軟件方面取得的進步。
圖示:NVIDIA AI 在三年內實現(xiàn)了 20 倍以上的改進。
持續(xù)改進軟件
NVIDIA的新進展來自多項軟件改進。
例如,借助一類新的內存復制操作,NVIDIA在針對醫(yī)學成像的 3D-UNet 基準測試中實現(xiàn) 2.5 倍的操作加速。
得益于微調 GPU 以進行并行處理的方式,NVIDIA在針對物體檢測的 Mask R-CNN 測試中實現(xiàn) 10% 的速度提升,而在針對推薦系統(tǒng)的測試中實現(xiàn)了 27% 的提升。NVIDIA只是重疊了獨立操作,這種技術尤其適合跨多個 GPU 運行的作業(yè)。
NVIDIA擴展了 CUDA 圖形的使用范圍,盡可能減少與主機 CPU 的通信。得益于此,NVIDIA在針對圖像分類的 ResNet-50 基準測試中實現(xiàn)了 6% 的性能提升。
NVIDIA在 NCCL 上實施了兩種新技術。NCCL 是NVIDIA的庫,用于優(yōu)化 GPU 之間的通信。對于 BERT 等大型語言模型,這樣可以將結果加速高達 5%。
利用NVIDIA工作結果
NVIDIA使用的所有軟件均在 MLPerf 倉庫提供,因此每個人都可以獲得NVIDIA的出色結果。NVIDIA不斷將這些優(yōu)化整合到 NGC(NVIDIA的 GPU 應用程序軟件中心)上的容器。
它是全棧平臺的一部分,已在新的行業(yè)基準測試中得到驗證,可從各種合作伙伴處獲得,能夠處理當今真正的 AI 作業(yè)。
關于 NVIDIA
NVIDIA(NASDAQ 股票代碼:NVDA)于 1999 年發(fā)明了 GPU。此舉極大推動了 PC 游戲市場的發(fā)展、重新定義了現(xiàn)代計算機圖形、高性能計算和人工智能。該公司在加速計算和 AI 領域的開創(chuàng)性工作正在重塑價值數(shù)萬億美元的行業(yè)(例如運輸、醫(yī)療健康和制造業(yè)),并推動許多其他行業(yè)的發(fā)展。有關更多信息,請訪問 https://nvidianews.nvidia.com/。