0
對于互聯網公司來說,中臺是一個非常熟悉的概念。
但在芯片領域,提中臺概念的人并不多。
2022世界人工智能大會上,瀚博半導體創始人兼CEO錢軍在談及協同兩個產品線時說道:“我們用了中臺的概念。核心的IP就類似中臺,然后上層有統一的開發平臺。可以根據產品和規劃和側重點,設計和推出更符合市場需求的產品。”
瀚博踐行這一理念的關鍵是自主研制的統一計算架構(Vastai Unified Compute Architecture)。

所謂的統一計算架構,是將多款高性能計算引擎進行整合,擁有高效統一的存儲管理、一致性接口和低鏈接延遲、完整的虛擬化功能、統一的底層軟件設計、模塊化的上層計算算子庫和功能模塊。
錢軍說:“瀚博統一架構讓計算密集型的AI、視頻、渲染任務性能得到最大化硬件加速,同時端到端縮小延時,一體化助力云端實時圖形渲染、AI增強處理、視頻編解碼等需求。這個架構包含硬件架構和軟件架構。”
與瀚博統一計算架構同時推出的是瀚博的軟件平臺VastStream,有統一接口、靈活調度、通用AI計算、多路高效視頻轉碼+AI增強、易編程快遷移、工具鏈完備等,可加速各類AI應用部署,包括計算機視覺、視頻處理、自然語言處理、搜索與推薦、算子自定義擴展等。
基于這樣的理念和軟硬件統一架構,更容易理解瀚豐富的產品線,以及統一架構的價值。
基于統一計算架構的AI和GPU芯片
去年,瀚博半導體發布了其首款云端AI推理芯片SV102及搭載此芯片的載天系列通用加速卡VA1。
“我們的第一個產品選擇了AI+視頻領域,這是我們的突破口。”錢軍透露,“在第一款芯片SV102中,就有一個性能不錯的圖形渲染模塊,只是我們沒有對外宣傳。兩款產品都基于瀚博的統一計算架構中。”
可以將瀚博的統一計算架構理解為一個構建好的房屋整體框架,框架確定了不同的功能區域,也就是對應不同的加速核。根據需求,房屋建設的時候可以在架構不變的前提下可以調整功能區并裝修成不同風格,對應到芯片上,也就是不同性能、功能有所差異的芯片。
這樣做最大的優勢是可以復用很多資源,以最少的投入滿足更多的需求,其實也就是互聯網公司所提的中臺的優勢。
體現到產品中,基于統一的計算架構,瀚博既能開發出高性能云端推理芯片以及邊緣的AI芯片,也能推出GPU。
2022世界人工智能大會期間,瀚博不僅發布了數據中心推理卡載天VA10,以及首款面向邊緣大算力場景推理卡載天VE1系列,還展示了即將發布的7你們云端GPU芯片SG100。
載天V10是VA1的后續產品,最大的亮點是Int8峰值算力達400TOPS,刷新業界紀錄,適用于直播視頻增強、智慧交通管理、實時語義理解等場景。
瀚博給出的數據顯示,載天VA10的功耗為150瓦,整體最高推理性能達到同功耗主流GPU的2倍以上,且延時低至后者的6%。在低延時場景(低于4毫秒的YoloV3檢測算法場景)下,載天VA10推理性能達到同功耗市場主流GPU的3倍以上。
“瀚博75瓦的加速卡就可以替代150瓦的卡,之所以我們還是150瓦的卡,主要是考慮到服務器有不同結構,有的結構不一定能插入16+75瓦的卡,150瓦的加速卡適用性更廣。”錢軍表示。
載天VE1系列是瀚博首款面向邊緣大算力的推理卡,具有超低時延與超高吞吐率、低功耗、大算力的特性。在40-65瓦功耗下,INT8峰值算力達100 TOPS,支持60路1080P視頻實時解碼,支持主流AI框架的模型,提供從模型編譯到推理優化的全流程低代碼開發框架VastPipe,提供端到端的軟硬件AI推理解決方案。

另據瀚博的測試數據,載天VE1吞吐率達到主流GPU的2倍,時延僅為其的1/5。
“載天VE1可以在非常適用于智慧交通、車路協同、工業質檢等邊緣打算力場景,充分發揮超高吞吐率和超低時延的優勢。”錢軍表示。
AI芯片之外,瀚博新產品的一大亮點就是7nm云端GPU——瀚博SG100。
錢軍稱SG100 GPU擁有世界領先的超高吞吐、超高質量、低延時的編碼能力,集渲染、AI、視頻于一體,還提供世界一流的SR-IOV虛擬化支持。

雷峰網(公眾號:雷峰網)了解到,SG100會在不久的將在正式發布和量產。
對于推出GPU,錢軍表示這一直在其公司的計劃中,也相信元宇宙的發展回對圖形渲染有爆炸式的需求增長,瀚博的GPU看好的是這一市場需求。
當然,瀚博能設計出GPU還有團隊的關鍵因素。錢軍在創業前是AMD 高管,曾帶領AMD中國團隊設計量產了業界第一顆7納米圖形處理器和第一顆7納米GPGPU架構的AI芯片。瀚博和核心研發團隊也都擁有18年以上高端芯片設計和量產的經驗。
統一計算架構對產品落地的價值
對于一家初創公司來說,同時布局云端推理、邊緣高性能推理以及GPU三條產品線需要大量的資金投入,是一個巨大的挑戰。以中臺的理念,用統一計算架構的方式,能夠在很大程度上提升研發的效率,降低投入。
實際上芯片巨頭也在采用這樣的路線,比如高通就提出了統一的技術路線圖。
中臺理念,或者說統一計算架構在實際執行中面臨著諸多挑戰,要在一個統一的計算架構下,涵蓋多款不同特性的產品,非常考驗架構設計者的能力,必須要有長遠的考慮,有架構思維,保證架構有足夠的靈活性,同時要兼顧效率等要求。
軟件層面,由于要直接面對最終用戶,在各種不同的需求下,要兼顧易用性和靈活性,同時還需要面對效率的挑戰,并且還要在統一架構的框架下,保證產品的延續性。
這就意味著,統一的架構能帶來效率的提升,但也考驗著底層架構設計者的經驗和能力,以及最終產品實現時的堅定決心。當然,統一架構的優勢也十分明顯,在構建生態以及產品落地時,能夠集中力量,更快發展。
2022年,瀚博先后與福建大數據集團、國寧瑞能,高新興、超聚變等企業,在智慧城市、智慧政務、智慧交通、智慧園區、智慧能源等場景開展了深入合作。
接下來,隨著邊緣大算力AI產品的推出和落地,加上即將發布的GPU,我們將能夠看到瀚博的統一架構戰略的成敗。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。