8/27/2019,三天前,華為輪值主席徐直軍在深圳華為坂田基地推出華為高端 AI 芯片昇騰 910 ,開啟華為在先進(jìn)技術(shù)領(lǐng)域挑戰(zhàn)硅谷的最新嘗試。
一直以來,華為自研芯片都是人們關(guān)注的焦點(diǎn)。,正是因?yàn)橛辛俗灾餮邪l(fā)的海思麒麟系列手機(jī)芯片,華為才能快速搶占手機(jī)市場(chǎng),一路“攻城略地”,躋身中國智能手機(jī)行業(yè)第一寶座。當(dāng)然,作為目前全球體量最大的通信設(shè)備商、全球坐三望二的智能手機(jī)廠商,華為自研芯片不止于此。巴龍、鯤鵬、凌霄還有這次發(fā)布會(huì)重點(diǎn)推出的昇騰,華為自研芯片已經(jīng)覆蓋手機(jī)、服務(wù)器、路由器,電視、AI 等多個(gè)領(lǐng)域。自研芯片已然成為華為的核心競爭力,一個(gè)其他競爭對(duì)手所不具備的獨(dú)特優(yōu)勢(shì)。
昇騰系列芯片主打人工智能領(lǐng)域,用于處理構(gòu)建人工智能算法的海量數(shù)據(jù)。華為的這次公布,讓不少人沸騰了,網(wǎng)上的言論越傳越神,被稱作“攻破了又一個(gè)讓國人蒙羞的城池”,“實(shí)現(xiàn)了彎道超車”,甚至出現(xiàn)了華為將在云端 AI 芯片領(lǐng)域干掉英偉達(dá)、谷歌的論斷。這些評(píng)價(jià)是否正確?華為昇騰芯片真的有那么大影響力嗎?
江湖霸主英偉達(dá)
AI 芯片是什么,半導(dǎo)體業(yè)界并沒有嚴(yán)格的界定。一般來說,AI 芯片被稱為 AI 加速器或計(jì)算卡,也就是 AI 應(yīng)用中的大量計(jì)算任務(wù)的模塊,目前主要有 GPU、FPGA 和 ASIC 三種技術(shù)路線。其中 GPU 在 AI 訓(xùn)練方面已經(jīng)發(fā)展到較為成熟的階段,谷歌、臉書、微軟、 推特和百度等公司都在使用 GPU 分析圖片、視頻和音頻文件,以實(shí)現(xiàn)深度學(xué)習(xí)等功能。
看到這里,很多人心里納悶, GPU 不是顯示芯片么,怎么用來搞 AI 。其實(shí)這個(gè)道理很簡單,GPU 負(fù)責(zé)處理圖形數(shù)據(jù)處理,擁有大體量的邏輯運(yùn)算單元用于數(shù)據(jù)處理,對(duì)于密集型數(shù)據(jù)可以進(jìn)行并行處理。人工智能的神經(jīng)網(wǎng)絡(luò)架構(gòu)有個(gè)特征,剛算出來的數(shù)往往再投入結(jié)算,一輪輪迭代以凸顯關(guān)鍵細(xì)節(jié),這種計(jì)算不需要太多數(shù)據(jù)緩存單元,不需要復(fù)雜的邏輯控制,只要計(jì)算單元夠多就行。相比注重邏輯判斷的 CPU ,GPU 芯片顯然更加適用于人工智能深度計(jì)算。
在 GPU 芯片領(lǐng)域,英偉達(dá)是當(dāng)之無愧的龍頭老大。在人工智能興起之初,由于 GPU 芯片在深度學(xué)習(xí)領(lǐng)域的優(yōu)勢(shì),英偉達(dá)與斯坦福大學(xué)的吳恩達(dá)合作開發(fā)了一種使用大規(guī)模GPU計(jì)算系統(tǒng)訓(xùn)練網(wǎng)絡(luò)的方法。與此同時(shí),英偉達(dá)與谷歌的人工智能團(tuán)隊(duì)合作,建造了當(dāng)時(shí)最大的人工神經(jīng)網(wǎng)絡(luò)。之后,各深度學(xué)習(xí)團(tuán)隊(duì)開始廣泛大批量使用英偉達(dá)的顯卡。
如今,全球估計(jì)有 3000 家 AI 創(chuàng)業(yè)公司,其中一半以上都是在英偉達(dá)的平臺(tái)上構(gòu)建的?萍季揞^也不例外,谷歌、微軟、臉書、亞馬遜都在購買英偉達(dá)芯片,用于構(gòu)建自己的數(shù)據(jù)中心。數(shù)據(jù)研究公司 Gartner 顯示,英偉達(dá)擁有 AI 芯片市場(chǎng)約四分之三的份額。上一財(cái)年,英偉達(dá)從用于數(shù)據(jù)中心的 AI 芯片銷售中獲得將近 30 億美元收入。在人工智能芯片領(lǐng)域,英偉達(dá)已經(jīng)是當(dāng)之無愧的江湖霸主。
挑戰(zhàn)者昇騰 910
AI 芯片這個(gè)江湖兇險(xiǎn)異常,英偉達(dá)目前是霸主,可誰也不敢保證未來會(huì)發(fā)生什么。深度學(xué)習(xí)算法分為訓(xùn)練和推斷兩部分,所謂訓(xùn)練,就是給不斷計(jì)算大數(shù)據(jù),讓它慢慢學(xué)會(huì)識(shí)別和區(qū)分對(duì)象;所謂推理,就是讓訓(xùn)練好的機(jī)器干活。GPU 芯片在算法訓(xùn)練上非常高效,可在推斷中對(duì)于單項(xiàng)輸入進(jìn)行處理的時(shí)候,并行計(jì)算的優(yōu)勢(shì)不能完全發(fā)揮出來。
因?yàn)?nbsp;GPU 芯片 在人工智能深度學(xué)習(xí)上的天生劣勢(shì),一些企業(yè)將目光投向?qū)S锰幚硇酒,采?nbsp;FPGA/ASIC 技術(shù)路線設(shè)計(jì)專業(yè) AI 芯片。FPGA 的前期啟動(dòng)成本低,后期可以進(jìn)行再編程,可以采用 OpenCL等更高效的編程語言,降低硬件編程的難度,還可以整合系統(tǒng)模塊,提高應(yīng)用的靈活性,與GPU相比,F(xiàn)PGA 具備更強(qiáng)的平均計(jì)算能力和更低的功耗。
ASIC 運(yùn)行速度比 FPGA 更快,是一種為專用目的設(shè)計(jì)的,面向特定用戶需求的定制芯片。在大規(guī)模量產(chǎn)的情況下具備性能更強(qiáng)、體積更小、功耗更低、成本更低、可靠性更髙等優(yōu)點(diǎn)。華為昇騰 910 就是 ASIC 芯片,它采用 7nm+ EUV 制程工藝,達(dá)芬奇架構(gòu),計(jì)算力可達(dá)到 256TFOPS,比英偉達(dá)最新的 V100 還要高出一倍。值得注意的是,昇騰 910 達(dá)到規(guī)格算力所需功耗僅 310W,明顯低于設(shè)計(jì)規(guī)格的 350W。