<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      芯片 正文
      發私信給劉伊倫
      發送

      0

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      本文作者: 劉伊倫   2025-12-26 15:07
      導語:并行算網已接入62個算力中心,已累計輸出超200億核時、近2億卡時。

      2025年12月12-13日,第八屆GAIR全球人工智能與機器人大會在深圳·博林天瑞喜來登酒店正式啟幕。

      作為AI 產學研投界的標桿盛會,GAIR自2016年創辦以來,始終堅守“傳承+創新”內核,始終致力于連接技術前沿與產業實踐。

      在人工智能逐步成為國家競爭核心變量的當下,算力正以前所未有的速度重塑技術路徑與產業結構。13日舉辦的「AI 算力新十年」專場聚焦智能體系的底層核心——算力,從架構演進、生態構建到產業化落地展開系統討論,試圖為未來十年的中國AI產業,厘清關鍵變量與發展方向。

      并行科技副總裁、AI聯合創始人趙鴻冰在「AI 算力新十年」論壇發表了主題為《基于用戶視角的算力服務及算網服務》的演講。

      歷經18年超算領域深耕,并行科技見證并參與了中國算力市場的演進。當前,算力市場呈現多場景、多業態的爆發式增長,從尖端超算到智算形態,從算力租賃到算力網絡,行業生態日趨多元;與此同時,大模型技術的快速迭代,也對算力的可用性、高效性與性價比提出了更高要求。

      在這樣的背景下,從用戶視角構建算力服務體系、通過算力網絡實現資源的高效整合與調度,以及應對推理需求爆發帶來的產業變革,成為算力行業亟待解決的核心問題。

      趙鴻冰在演講中指出,當前算力市場已形成四大核心業態:算力租賃作為最基礎的形態,以“裸金屬”算力資源長期交付用戶且不參與后續應用;算力服務聚焦用戶終端需求的“最后一公里”,核心是按需提供精準適配業務場景的算力支持;算力運營則依靠復雜調度平臺統籌管理資源,實現算力的高效分配與運營;而算力網絡作為更高維度的形態,通過納管多個算力平臺形成廣泛覆蓋的網絡,達成跨平臺整體調度。

      為此,并行科技推出“廠網結合”模式:“廠”即公司投入大量資金建設的萬卡集群等重資產布局,“網”則是通過輕資產擴張連接國內47個智算中心與15個超算中心,該算力網絡可調度200萬CPU核心、5萬多張GPU卡,服務超16萬用戶,商業化輸出累計超200億核時、近2億卡時。

      在算力資源適配方面,他強調“沒有絕對最優的算力資源,只有最適配的選擇”:例如在B200集群實測中發現,雖B200性能領先,但針對某具身智能客戶需求,H200性價比更優。

      基于18年行業經驗與數據積累,并行科技構建的算力性能預測模型,在小規模場景下預測誤差可控制在2%以內,中大規模場景下誤差也僅為個位數,能有效支撐用戶資源選型決策。在大規模推理場景中,消費級顯卡5090作為“性價比之王”,成為多數客戶的首選。(作者長期關注算力與芯片產業,歡迎添加微信 YONGGANLL6662 交流更多信息。)

      這些思考與經驗,均來自并行科技服務16萬用戶的真實市場沉淀,其打造的算力網絡已實現全國范圍內的資源調度與商業化輸出,希望能為算力行業的發展提供可借鑒的思路。

      演講結束后,雷峰網與趙鴻冰就演講中提及的“算力網絡”、“推理需求”等關鍵議題,進行了更深入的探討。以下是雷峰網在不改原意的基礎上,根據對話過程做的整理與編輯:

      對話環節

      雷峰網:您提到算力規模年復合增長率達到52.3%,當前市場已投入大量資本用于AI基建,為何算力規模仍能保持高速增長,背后的主要推動力是什么?如何看待市場討論的“算力泡沫”這一說法?

      趙鴻冰:人工智能是全球競爭的制高點,將成為未來數年乃至數十年發展的核心驅動力。一場革命性的產業變革,需要足夠的時間與周期來完成生產力和生產關系的重構,這個過程并不會一蹴而就。當前市場對 “算力泡沫” 的質疑,核心在于AI投入尚未形成大面積的商業閉環。但從產業發展規律來看,每一次重大技術革命都需要經歷投入期、探索期才能進入收獲期,算力是否為泡沫,時間會給出最終答案。

      另一方面,在當前的全球競爭格局下,頭部科技企業普遍對AI賽道抱有FOMO情緒。相較于因過度謹慎、投入滯后而錯失行業發展窗口期的代價,適度超前的算力基建投入可能獲得更可期的未來。

      雷峰網:您在演講中提到算力網絡,并行算網對接入的算力資源有什么要求?算網本質是資源整合工作,勢必會面臨諸多利益分配問題,這些問題如何解決?

      趙鴻冰:并行科技已經打造了一套成熟的算力資源接入標準體系。我們會根據資源的規模類型、調度能力、完善程度等多個維度,對擬接入的算力資源進行分級定義,這套標準就像“插銷與插座”的匹配規則,能夠實現算力資源的快速接入與網絡化輸出。資源接入周期沒有固定標準,若資源本身完全符合標準,可直接接入;若需要改造,并行科技會協助完成標準適配,整體周期通常較短。

      關于利益分配,并行科技的商業模式早已定義清晰,核心是以價值分層驅動利益分配。整個算力服務產業鏈可以拆解為多個價值環節:最前端是面向最終用戶的市場推廣、銷售對接與方案設計,這需要鐵三角組織中的銷售負責人、方案負責人共同完成,解決客戶的商務與技術需求;往下是產品平臺層,需要具備賬號開通、算力調度、計量計費、報告輸出等核心能力,這是算網運營的核心支撐;再往下是售后服務層,我們建立了7×24小時5分鐘響應的保障體系,常規問題由一線工程師解決,疑難問題由二線、三線工程師分層處理,確保客戶業務穩定運行;最底層則是服務器重資產投資與IDC托管的價值。

      在算網合作中,我們會根據合作伙伴的優勢,匹配對應的價值環節。比如有的合作伙伴擁有IDC和服務器資源,就可以獲取底層兩部分價值;若合作伙伴同時具備前端銷售推廣能力,就可以分得前端與底層價值,并行科技則主要獲取平臺調度與售后服務的價值。整個價值分配邏輯清晰,能夠保障各方的合理收益。

      雷峰網:異構算力(CPU/GPU/DCU 混合部署)虛擬化過程中,算力會面臨損耗,如何優化虛擬化層開銷?

      趙鴻冰:關于異構算力虛擬化損耗的問題,當前主流的算力調度形態包括裸金屬、高性能集群、云主機和容器。不同形態適配不同的客戶場景:如果客戶有極致性能需求,直接采用裸金屬或高性能集群即可規避虛擬化損耗;虛擬化損耗主要體現在云主機形態中。

      超級計算的核心邏輯不是切割算力單元,而是將更多小單元連接起來形成大規模并行計算的算力。對于有小粒度算力需求的場景,需要虛擬化切割時,容器是最優選擇,容器技術幾乎可以實現零虛擬化損耗,是解決虛擬化損耗的主流方案。

      雷峰網:行業內普遍將殺手級應用的誕生、推理需求的爆發,視作破解算力閑置困局的關鍵抓手,也將其視為下一波算力需求增長的核心引擎。您如何判斷推理需求全面爆發的時間節點與演進節奏?

      趙鴻冰:當前市場已經顯現出明確的信號,以OpenAI為例,2025年預估營收將達到130億美元,這正是推理業務規模化發展的直接體現。并行科技服務的眾多大客戶,也已經進入推理業務落地階段,整個行業正朝著推理需求爆發的方向邁進。

      從產業發展規律來看,技術研發不能無限制推進,最終必然要走向產業化落地,創造社會價值并形成商業閉環,推理需求的爆發是這一趨勢的必然結果。國產芯片在當前階段也可以通過更多地滿足推理場景需求,來推動自身業務的發展。

      雷峰網:推理需求成為算力產業主流需求后,將對當前的算力基建布局、技術路徑選擇及商業模式帶來哪些影響?您認為AI Infra公司未來最重要的迭代方向是什么?

      趙鴻冰:推理需求成為主流后,算力產業的各個環節都將迎來顯著變化。在訓練時代,算力競爭的核心是大規模集群的可靠性與穩定性,需要通過并行框架優化、checkpoint機制等技術手段,保障模型訓練高效完成。而到了推理時代,除了可靠性與穩定性的基礎要求外,市場對算力提出了新的核心訴求:一是更大規模的彈性資源調度能力,需要支撐應用隨時爆發的算力需求;二是更精細的資源匹配能力,因為推理與訓練的應用特征差異顯著,比如 DeepSeek的推理過程分為P階段和D階段,兩個階段的計算與訪存敏感特征完全不同,必須針對性匹配算力資源。

      對于AI Infra公司而言,未來最重要的迭代方向是緊跟客戶需求場景,持續升級產品與服務。不論迭代技術會帶來多高的成本,你都要跟,這是一個商業化的問題,不是一個技術的問題。

      雷峰網:今年超節點這一產品形態非常火熱,超節點通過高密度集成和高速互聯,在通信時延、硬件協同效率上有顯著提升,您認為這種硬件層面的優化,是否會壓縮軟件側的算力優化空間?這個產品形態主要是為了解決什么問題?

      趙鴻冰:并行科技深耕算力服務18年,我們認為無論是超算還是智算,本質都是為了更快地完成計算任務,計算過程中涉及的數據搬運與節點通信,都是額外的性能開銷,超節點的核心目標也是通過高密度集成與高速互聯,降低這些開銷,提升數據傳輸與通信效率。

      從本質上講,超節點就是一個小型化的超級計算機。硬件層面的優化,并不會壓縮軟件側的優化空間,反而需要軟硬協同才能發揮最大價值。一臺性能優異的超節點,必須搭配優秀的軟件調度與優化能力,才能充分壓榨硬件性能。硬件架構的升級是順應產業發展方向的必然選擇,軟件則需要同步迭代,實現對硬件的高效駕馭。

      雷峰網(公眾號:雷峰網):那么是否可以理解為,具備超算技術積累的企業,更容易獲得超節點的能力?

      趙鴻冰:確實如此,超節點的技術邏輯與超算一脈相承。國外在智算領域的布局,本質上也是在構建超級計算機,比如Stargate等,在描述上也是在建設超算。超節點與傳統超算的核心共性,都是通過優化卡間互聯、節點間互聯,實現大規模并行計算。

      區別在于,超節點的規模遠小于傳統超算,傳統超算動輒需要上萬個、甚至數萬個節點,而超節點更偏向于小型化集群,比如英偉達的NVL72、華為384超節點,本質上都是小型超級計算機。

      演講全文

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      演講完整視頻,詳見鏈接:https://youtu.be/acn8RLPTqHs

      以下是趙鴻冰演講的精彩內容,雷峰網作了不改變原意的整理與編輯:

      大家好,今天我想和大家分享并行科技在算力服務與算網服務領域的實踐探索與心得。并行科技深耕算力行業18年,以超算業務起家,在長期的發展過程中,我們從超算視角出發,基于客戶畫像與產品定位兩個維度,對當前的算力市場進行了劃分。

      算力市場的第一類場景,是以我國“天河”超級計算機為代表的尖端超算領域。2010年,天河超級計算機躋身全球超算500強首位,這類超算主要面向國家重大科技攻關項目的研發工作,其核心特征是需要十萬核、百萬核甚至更大規模算力支撐。

      第二類場景是通用超算領域,并行科技對這一領域的發展起到了核心推動作用。與尖端超算不同,通用超算面向的主要場景之一是高校師生的日常教學與科研需求,算力需求集中在萬核以下,以千核甚至幾十核為主,這是并行科技的主戰場之一。

      第三類場景是業務超算領域,主要服務于企業的業務模擬仿真需求,這類算力應用通常是企業生產流程中的關鍵環節。

      第四類場景就是2016年以來,伴隨大模型技術爆發而興起的智算形態,其核心計算載體為GPU加速卡。從技術指標來看,前三類超算場景的核心需求是高精度計算,普遍要求FP64雙精度,最低也需達到FP32精度;而智算場景的計算精度則大幅降低,以FP16、FP8甚至FP4為主,當前智算也是整個算力市場中增長最快的板塊。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      近兩年,算力市場迎來爆發式增長,各類參與者紛紛入局。從業態形態來看,當前算力市場可分為四大類型:

      算力租賃:這是最基礎的算力服務形態,相當于將“裸金屬”算力資源長期交付給用戶,用戶可自主支配算力用途,算力提供方不參與后續的應用環節。

      算力服務:這是面向用戶終端需求的“最后一公里”服務,核心是按需提供算力支持,精準匹配用戶的實際業務場景。

      算力運營:其核心是構建一個復雜的調度平臺,通過對算力資源的統籌管理,實現算力的高效分配與運營。

      算力網絡:這是更高維度的算力服務形態,通過將多個算力平臺納入統一管理,形成一張覆蓋廣泛的算力網絡,實現跨平臺的整體調度。

      這四類業態,清晰勾勒出當前算力服務與算力網絡的市場全貌。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      并行科技的經營核心理念,始終立足于用戶視角。我們認為,從算力需求方的角度出發,用戶的核心訴求可以歸結為三點:第一是可用,即需要有穩定的算力資源供應,且能夠有效支撐業務運行;第二是好用,算力資源不僅要 “跑起來”,更要具備高效的運行性能;第三是降本,要降低用戶的算力使用門檻,以高性價比滿足需求,尤其是大模型訓練這類高門檻的算力應用,性價比更是關鍵考量因素。

      “可用、好用、降本” 是用戶的核心剛需,并行科技的所有產品平臺,均圍繞這三大需求展開設計。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      在大模型時代,不同類型的客戶對算力產品平臺有著差異化的需求。例如,基模訓練場景中,受DeepSeek的影響,僅有少數企業需要大規模的算力集群;而垂類模型的研發場景,則覆蓋了更為龐大的用戶群體,這類需求可以通過標準化、高適配性的產品型平臺來滿足。

      并行科技的特色經營模式,是基于算力網絡的輕資產運營模式,其核心邏輯是“廠網結合”。其中,“廠”代表并行科技的重資產布局,我們已投入大量資金,建設了萬卡集群;而“網”則是我們的核心發展策略,通過輕資產擴張的方式,更多地把已建或在建的算力產能更大化的發揮出社會效益,并行科技已連接國內47個智算中心與15個超算中心,總計62個算力節點。

      目前,我們的算力網絡可調度資源總量達到200多萬CPU核心、5萬多張GPU卡,服務用戶規模突破16萬,業務布局覆蓋全國,商業化輸出總量累計超200億核時、近2億卡時,在算力服務企業中位居第一。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      從技術層面來看,并行科技的核心競爭力源于18年積累的行業數據與技術沉淀。我們的算力網絡服務模式覆蓋了包括行業大模型研發、文生文、文生視頻、AI for Science等在內的多元用戶場景,基于海量用戶的行業運行特征大數據,能夠快速為用戶提供精準的資源選型匹配服務。

      以具身智能場景為例,并行科技在中原區域合作了全國首套2000卡級別的全球性能最先進的智算算力集群,這也是目前全球能夠量產的性能領先的算力資源。我們會針對客戶的具體應用場景開展類似CT掃描的特征分析,輸出GPU利用率、FP16與FP8精度下的運行性能等量化數據,以此判斷算力資源的實際使用效率。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      算力的本質在于“更快地完成計算”,充分釋放GPU等硬件的性能優勢。

      我們發現,盡管B200的性能表現領先,但針對某一具身智能客戶的需求,H200的性價比更具優勢。這一結論也印證了資源選型的重要性:沒有絕對最優的算力資源,只有最適配的選擇。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      基于歷史經驗與數據積累,并行科技構建了算力性能預測模型,輸入相關參數后,即可有效預測算力的性能加速效果。該模型在小規模算力場景下的預測誤差可控制在2%以內,中大規模場景下的誤差也僅為個位數,足以支撐用戶的資源選型決策。此外,在大規模推理場景中,消費級顯卡5090是當前的性價比之王,成為多數客戶的首選。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      隨著DeepSeek的爆火,MaaS(模型即服務)模式迅速崛起,有觀點認為Token將成為未來算力市場的核心要素,并行科技也已布局MaaS平臺,緊跟行業發展趨勢。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      值得一提的是,并行科技專門設立了國產事業部,在國產算力資源的適配與應用方面持續發力。例如,華為昇騰910B在部分適配場景中,性能可與A100比肩,且在價格具備優勢的情況下,能夠為用戶提供更高的性價比選擇。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      最后,我想簡要介紹并行科技的市場地位與客戶布局。

      在客戶群體方面,國內前四五百所頭部高校均是我們的核心客群。以清華大學為例,并行科技與清華開展校級合作,為全校6萬余名師生提供算力支持,以更好開展AI的探索研究。目前,我們與復旦大學、中國計算機學會(CCF)的合作也已推進至第二期,取得了良好的成效,使更多高校的師生和科研機構的研究員們享用到普惠的算力。

      并行科技趙鴻冰:如何最大化發揮算力效益?丨GAIR 2025

      除高校外,科研機構是并行科技的另一大核心客群,中科院旗下數百家有算力需求的研究所,均已納入我們的精準服務體系。在企業端,美的、三一重工、比亞迪、小鵬匯天等知名企業,以及智譜 等 AI 領域的標桿企業,也都是并行科技的重要客戶。

      毋庸置疑,AI將是驅動未來數年乃至數十年產業發展的核心引擎,而算力則是這一進程中的關鍵基石。有專家將算力比作“水電”,這一比喻十分貼切,如同水電支撐社會生產生活一樣,算力已成為數字經濟時代的基礎設施。相關報告顯示,算力指數每增長1個百分點,將帶動GDP實現千億級別的提升。

      未來,并行科技愿與行業同仁攜手并行,以優質的算力服務與算網運營能力,助力科技強國建設。謝謝大家!

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 国产男女插插一级| 国产日韩欧美在线观看不卡| 亚洲国内自拍| 91青青草视频在线观看的| 日本一区二区三区在线 |观看| 人妻少妇| av高清| 久久无码一区| 国产成人无码a区在线视频无码dvd| 免费看欧美全黄成人片| 久久综合噜噜激激的五月天| 鄂伦春自治旗| 国产成人精品无码免费看夜聊软件 | 精品黑人一区二区三区| 国产熟女精品视频| 日日躁天天躁| 亚洲人成人伊人成综合网无码| 久久人妻少妇嫩草av| 亚洲精品9999久久久久无码| 日韩精品 中文字幕 视频在线| 少妇被粗大的猛烈进出视频 | 欧美国产日韩久久mv| 亚洲乱码中文字幕小综合| 九九视频精品免费观看6 | www.久久se精品一区二区.com| 国产一区二区三区精品综合| 亚洲一区精品一区在线观看| 91综合网| 青青草视频免费观看| 无遮挡又爽又刺激的视频| 亚洲天堂免费| 国产av一区二区三区无码野战| 伊川县| 亚洲国产成人极品综合| 无码人妻一区二区三区线花季传件| 国产成人精品午夜2022| 日韩码无第15页| 国产内射白浆| 色啪视频| 亚洲国语无码| 日本极品少妇videossexhd|