2023成都積分入學什么時候開始申請
2023-01-31
更新時間:2022-09-06 07:05:48作者:佚名
對于互聯(lián)網(wǎng)公司來說,中臺是一個非常熟悉的概念。
但在芯片領域,提中臺概念的人并不多。
2022世界人工智能大會上,瀚博半導體創(chuàng)始人兼CEO錢軍在談及協(xié)同兩個產(chǎn)品線時說道:“我們用了中臺的概念。核心的IP就類似中臺,然后上層有統(tǒng)一的開發(fā)平臺??梢愿鶕?jù)產(chǎn)品和規(guī)劃和側重點,設計和推出更符合市場需求的產(chǎn)品?!?/p>
瀚博踐行這一理念的關鍵是自主研制的統(tǒng)一計算架構(Vastai Unified Compute Architecture)。
所謂的統(tǒng)一計算架構,是將多款高性能計算引擎進行整合,擁有高效統(tǒng)一的存儲管理、一致性接口和低鏈接延遲、完整的虛擬化功能、統(tǒng)一的底層軟件設計、模塊化的上層計算算子庫和功能模塊。
錢軍說:“瀚博統(tǒng)一架構讓計算密集型的AI、視頻、渲染任務性能得到最大化硬件加速,同時端到端縮小延時,一體化助力云端實時圖形渲染、AI增強處理、視頻編解碼等需求。這個架構包含硬件架構和軟件架構。”
與瀚博統(tǒng)一計算架構同時推出的是瀚博的軟件平臺VastStream,有統(tǒng)一接口、靈活調度、通用AI計算、多路高效視頻轉碼+AI增強、易編程快遷移、工具鏈完備等,可加速各類AI應用部署,包括計算機視覺、視頻處理、自然語言處理、搜索與推薦、算子自定義擴展等。
基于這樣的理念和軟硬件統(tǒng)一架構,更容易理解瀚豐富的產(chǎn)品線,以及統(tǒng)一架構的價值。
基于統(tǒng)一計算架構的AI和GPU芯片
去年,瀚博半導體發(fā)布了其首款云端AI推理芯片SV102及搭載此芯片的載天系列通用加速卡VA1。
“我們的第一個產(chǎn)品選擇了AI+視頻領域,這是我們的突破口。”錢軍透露,“在第一款芯片SV102中,就有一個性能不錯的圖形渲染模塊,只是我們沒有對外宣傳。兩款產(chǎn)品都基于瀚博的統(tǒng)一計算架構中?!?/p>
可以將瀚博的統(tǒng)一計算架構理解為一個構建好的房屋整體框架,框架確定了不同的功能區(qū)域,也就是對應不同的加速核。根據(jù)需求,房屋建設的時候可以在架構不變的前提下可以調整功能區(qū)并裝修成不同風格,對應到芯片上,也就是不同性能、功能有所差異的芯片。
這樣做最大的優(yōu)勢是可以復用很多資源,以最少的投入滿足更多的需求,其實也就是互聯(lián)網(wǎng)公司所提的中臺的優(yōu)勢。
體現(xiàn)到產(chǎn)品中,基于統(tǒng)一的計算架構,瀚博既能開發(fā)出高性能云端推理芯片以及邊緣的AI芯片,也能推出GPU。
2022世界人工智能大會期間,瀚博不僅發(fā)布了數(shù)據(jù)中心推理卡載天VA10,以及首款面向邊緣大算力場景推理卡載天VE1系列,還展示了即將發(fā)布的7你們云端GPU芯片SG100。
載天V10是VA1的后續(xù)產(chǎn)品,最大的亮點是Int8峰值算力達400TOPS,刷新業(yè)界紀錄,適用于直播視頻增強、智慧交通管理、實時語義理解等場景。
瀚博給出的數(shù)據(jù)顯示,載天VA10的功耗為150瓦,整體最高推理性能達到同功耗主流GPU的2倍以上,且延時低至后者的6%。在低延時場景(低于4毫秒的YoloV3檢測算法場景)下,載天VA10推理性能達到同功耗市場主流GPU的3倍以上。
“瀚博75瓦的加速卡就可以替代150瓦的卡,之所以我們還是150瓦的卡,主要是考慮到服務器有不同結構,有的結構不一定能插入16+75瓦的卡,150瓦的加速卡適用性更廣?!卞X軍表示。
載天VE1系列是瀚博首款面向邊緣大算力的推理卡,具有超低時延與超高吞吐率、低功耗、大算力的特性。在40-65瓦功耗下,INT8峰值算力達100 TOPS,支持60路1080P視頻實時解碼,支持主流AI框架的模型,提供從模型編譯到推理優(yōu)化的全流程低代碼開發(fā)框架VastPipe,提供端到端的軟硬件AI推理解決方案。
另據(jù)瀚博的測試數(shù)據(jù),載天VE1吞吐率達到主流GPU的2倍,時延僅為其的1/5。
“載天VE1可以在非常適用于智慧交通、車路協(xié)同、工業(yè)質檢等邊緣打算力場景,充分發(fā)揮超高吞吐率和超低時延的優(yōu)勢。”錢軍表示。
AI芯片之外,瀚博新產(chǎn)品的一大亮點就是7nm云端GPU——瀚博SG100。
錢軍稱SG100 GPU擁有世界領先的超高吞吐、超高質量、低延時的編碼能力,集渲染、AI、視頻于一體,還提供世界一流的SR-IOV虛擬化支持。
雷峰網(wǎng)了解到,SG100會在不久的將在正式發(fā)布和量產(chǎn)。
對于推出GPU,錢軍表示這一直在其公司的計劃中,也相信元宇宙的發(fā)展回對圖形渲染有爆炸式的需求增長,瀚博的GPU看好的是這一市場需求。
當然,瀚博能設計出GPU還有團隊的關鍵因素。錢軍在創(chuàng)業(yè)前是AMD 高管,曾帶領AMD中國團隊設計量產(chǎn)了業(yè)界第一顆7納米圖形處理器和第一顆7納米GPGPU架構的AI芯片。瀚博和核心研發(fā)團隊也都擁有18年以上高端芯片設計和量產(chǎn)的經(jīng)驗。
統(tǒng)一計算架構對產(chǎn)品落地的價值
對于一家初創(chuàng)公司來說,同時布局云端推理、邊緣高性能推理以及GPU三條產(chǎn)品線需要大量的資金投入,是一個巨大的挑戰(zhàn)。以中臺的理念,用統(tǒng)一計算架構的方式,能夠在很大程度上提升研發(fā)的效率,降低投入。
實際上芯片巨頭也在采用這樣的路線,比如高通就提出了統(tǒng)一的技術路線圖。
中臺理念,或者說統(tǒng)一計算架構在實際執(zhí)行中面臨著諸多挑戰(zhàn),要在一個統(tǒng)一的計算架構下,涵蓋多款不同特性的產(chǎn)品,非??简灱軜嬙O計者的能力,必須要有長遠的考慮,有架構思維,保證架構有足夠的靈活性,同時要兼顧效率等要求。
軟件層面,由于要直接面對最終用戶,在各種不同的需求下,要兼顧易用性和靈活性,同時還需要面對效率的挑戰(zhàn),并且還要在統(tǒng)一架構的框架下,保證產(chǎn)品的延續(xù)性。
這就意味著,統(tǒng)一的架構能帶來效率的提升,但也考驗著底層架構設計者的經(jīng)驗和能力,以及最終產(chǎn)品實現(xiàn)時的堅定決心。當然,統(tǒng)一架構的優(yōu)勢也十分明顯,在構建生態(tài)以及產(chǎn)品落地時,能夠集中力量,更快發(fā)展。
2022年,瀚博先后與福建大數(shù)據(jù)集團、國寧瑞能,高新興、超聚變等企業(yè),在智慧城市、智慧政務、智慧交通、智慧園區(qū)、智慧能源等場景開展了深入合作。
接下來,隨著邊緣大算力AI產(chǎn)品的推出和落地,加上即將發(fā)布的GPU,我們將能夠看到瀚博的統(tǒng)一架構戰(zhàn)略的成敗。