2023成都積分入學什么時候開始申請
2023-01-31
更新時間:2022-09-02 07:07:12作者:佚名
高性能GPU受限,會影響國內部分智算中心建設進度
文 | 吳俊宇 陳伊凡 尹路
編輯 | 謝麗容
美國政府正在限制對華出售用于數據中心的高性能GPU芯片。數據中心GPU通常用于深度學習訓練等場景。AMD、NVIDIA(英偉達)等半導體巨頭受到了直接的影響。
8月31日,英偉達、AMD兩家知名半導體企業(yè)旗下生產的GPU產品被美國列入限制范圍。英偉達被限制的產品包括A100和H100,以及搭載上述芯片的DGX服務器。AMD受管制GPU產品包括MI250。
阿里云、騰訊云、百度云等云廠商,聯想、新華三、浪潮等服務器制造商,均是英偉達A100 GPU芯片在華重點客戶。因此將受到這一限制的影響。
在9月1日的中國外交部、商務部例行記者會上,兩部門發(fā)言人均對此事做出了回應。外交部發(fā)言人稱,此舉違反市場經濟規(guī)則,破壞國際經貿秩序。商務部則表示,這一做法損害中國企業(yè)的正當權益,也將嚴重影響美國企業(yè)的利益,對全球產業(yè)鏈供應鏈穩(wěn)定和世界經濟恢復造成沖擊。
美國證券交易委員會官網8月31日發(fā)布的公告顯示,英偉達2022年8月26日接美國政府通知,向中國出售A100、H100、DGX服務器需要經過美國政府許可。未來,峰值性能等于或超過A100的GPU產品也要獲取許可證,并且禁止對俄羅斯出售產品,原因是避免軍事用途。
公告解釋,這會影響A100的后續(xù)服務,并影響H100的開發(fā)進度。英偉達正在與美國政府合作,為公司對中國的開發(fā)、服務活動尋求豁免。此外,英偉達還在為中國客戶尋找替代產品。如果替代產品不足,公司會為中國客戶申請A100、H100的許可,但不保證能獲得授權。
英偉達在公告中表示,將有約4億美元的對華銷售額可能會受到新許可要求的影響。
英偉達A100在2020年推出,是目前全球性能最強的數據中心專用GPU。H100今年3月發(fā)布,尚未全面商用,是英偉達面向數據中心的下一代GPU產品。
英偉達2021年財報顯示,其數據中心年營收106億元,約有10%來自中國市場。A100代表的高性能GPU在華銷售占比正在持續(xù)提升。
芯片許可限制影響了英偉達股價。英偉達(NASDAQ: NVDA)股價在盤中交易時一度下跌6.5%。截至美國西部時間8月31日16時收盤時,英偉達股價下跌3.7%。
尚未正式公布
一位半導體業(yè)內人士對《財經十一人》表示,如果細則落地,受影響最大的是阿里云、騰訊云、百度云等云廠商在建、新建的高端商用數據中心。
2021年開始,國內云廠商、服務器制造商都在大規(guī)模推出搭載英偉達A100的云服務器產品。
值得注意的是,上述芯片許可限制的執(zhí)行細則尚未出臺?!敦斀浭蝗恕窂膰鴥榷嗉以茝S商數據中心業(yè)務負責人士得到的消息是,他們暫時未收到英偉達、AMD方面的消息。
“這個細則涉及到美國14納米以下的芯片,以及邏輯芯片對華出口管制。細則可能很快就會出臺?!币晃环扇耸勘硎荆绹壳皩τミ_、AMD只是做出了預通知。目的是讓廠商提前做好準備。
英偉達A100于2020年推出,是目前全球性能最強的數據中心專用GPU。英偉達2022年二季度財報電話會中透露,特斯拉最新的超級計算機使用超過7000枚A100 GPU進行自動駕駛訓練。Facebook在今年初宣布,今年建成的AI研究超級集群至少采用了6080枚A100 GPU。
國內云廠商對A100 GPU的采購數量目前不詳。不過,2020年開始,部分領先的云廠商就在采購A100 GPU。一位云廠商數據中心人士對《財經十一人》表示,在智能計算,尤其是AI大模型訓練方面,英偉達A100是國內云廠商最主流的選擇。
在云計算的算力池中,CPU、GPU是兩種不同的算力。前者更多處理通用計算需求,后者處理處理大數據、機器學習和人工智能場景的效率更高。因此,AI大模型訓練、AI推理、數據分析、圖像分析等場景都有賴于英特爾、AMD、英偉達的GPU芯片。
云廠商正在把智能計算作為云計算下個技術階段的重要方向。中國信通院2021年一組數據顯示,通用算力占算力的比重由2016年的95%下降至2020年的57%,智能算力占算力的比重則由2016年的3%提升至2020年41%。
另一位國內數據中心技術人士對《財經十一人》說,一臺頂尖的智能算力服務器,通常會搭載1枚-2枚CPU、8枚英偉達A100 GPU。A100 為代表的高性能GPU受限,會影響部分智算中心的建設進度。解決方案是,被迫使用性能更低的替代產品,或靠“堆數量”獲得同等規(guī)模的算力。帶來的直接影響是,同等算力的計算成本提升,一些高精度要求的計算能力下降。
英偉達創(chuàng)始人黃仁勛也在公開渠道表示,將立即與中國客戶合作,尋找替代產品或申請許可證。但對需要A100全面性能的客戶來說,替代產品性能會不足。但對多數客戶而言,替代產品可以滿足需求。
相比之下,政府主導的超算中心影響不大。上述半導體業(yè)內人士表示,超算中心一般執(zhí)行單一任務,通常CPU可實現。此外,超算中心建設之初一般會考慮到供應鏈安全和自主可控,盡可能避免對國外公司芯片的依賴。
倒逼產業(yè)鏈自主化
現實之下,尋找AI算力的替代解決方案成為出路。用于數據中心的GPU芯片通常被稱為AI芯片。AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應用中的大量計算任務的模塊。當前的AI芯片主要分為 GPU(圖形處理器)、FPGA(現場可編程邏輯門陣列)、ASIC(特殊應用集成電路)。
若不考慮性能和效率,一個可行的做法是采購未被限制的產品,靠“堆數量”方式解決問題。事實上,無論是英偉達、AMD,仍有性能相對更弱的GPU仍可選擇。
一位半導體業(yè)內人士打了個比方,AI芯片是一個集群,一個數據中心可能需要幾萬片AI芯片,高性能芯片,如果需要5000片。那么性能更低的產品,可能就需要2萬片。這個做法盡管理論可行,卻會帶來更高的計算成本。
另一個解決方案是,依靠國產廠商生產的數據中心GPU。但是國產GPU、AI加速芯片目前缺少高端產品,能力相對單一。和英偉達GPU相比,相當于是單項運動員和全能選手。前者可能能夠在某一個方面的性能超過英偉達,但從通用性來說,遠達不到英偉達的性能。
專利壁壘也是國產GPU或AI加速芯片公司需要解決的問題。多年的技術積累,英偉達已經構筑起了一道專利高墻。如何繞過英偉達專利,是一個挑戰(zhàn)。
另一個挑戰(zhàn)是生態(tài)和適配。國產GPU需要軟件適配,更需要時間磨合。對于國產GPU廠商來說,構建生態(tài)比設計制造芯片更難。一直以來,英偉達已經搭建了一條完整的生態(tài)。
燧原科技CEO趙立東曾向《財經十一人》解釋生態(tài)的意義,所謂的AI芯片的生態(tài),指的是,芯片之上整個軟件棧來支持AI框架,而AI應用程序則是基于這些框架開發(fā)的。軟件棧包括驅動程序、編譯器、函數庫、算字庫、工具包等,是實現高性能、高通用性、高易用性,以及針對不同應用場景深度優(yōu)化的關鍵。
在AI云端訓練芯片上,極少有公司能夠突破英偉達的生態(tài)。英偉達生態(tài)形成多年,所有開發(fā)者都會順著這個生態(tài)做。重新更換底層芯片,適應新的生態(tài),背后也是巨額的學習成本。
“當然,如果斷供之后沒有選擇,那就只有自主化一條路可以走。再難也要走下去?!?/strong>上述半導體業(yè)內人士表示。這能夠倒逼國內AI芯片公司發(fā)展——廠商不得不做好隨時被斷供的準備,有客戶,就意味著有機會能夠驗證和試錯,本土企業(yè)構建自主生態(tài)有了進一步的可能。
作者為《財經》記者