0
最近,國內開源界發生了不少大事,繼清華開源了計圖,曠視開源天元之后,3 月 28 日,在華為開發者大會 2020(Cloud)第二天,華為宣布全場景 AI 計算框架 MindSpore 在碼云正式開源。
MindSpore 發布于 2019 年 8 月。華為公司輪值董事長徐直軍表示,MindSpore 的推出,標志著華為全棧全場景 AI 解決方案(Portfolio)的構建,也標志著華為 AI 戰略的執行進入了新的階段。
MindSpore開源并不意外,早在去年,華為就透露今年春天將開源MindSpore的消息。
三大特性
AI 的研究和生產之間存在巨大的鴻溝。
一方面,在學術界,AI 相關的研究持續升溫,各種模型算法、訴求層出不窮;另一方面,工業界的 AI 模型應用層出不窮。各種不同的場景,如平安城市、智慧交通、生物醫療等,都需要非常大的數據集和完備的功能,以適應特定的需求。
現有的框架大多數開發門檻高,全場景能力不足,異構性差。而使用 MindSpore 架構就不用擔心這些問題。

華為 MindSpore 首席科學家陳雷表示,它有以下三個特性:
開發態友好:AI算法即代碼
通過自動微分、自動運行、自動調優,使代碼量減少20%,同時效率提升50%;
運行態高效:面向昇芯片優化
通過圖算子編譯加速以及神經網絡并行,協同生成芯片的算力,實現1.6倍性能優勢
部署態靈活:全場景按需協同
通過自適應的部署技術,實現IoT設備到云靈活部署,它的模型可大可小。
自動并行,降低開發門檻
在 AI 訓練過程中,分布式訓練非常重要。開發者不僅要設計算法邏輯,還需要分析數據量,參數量、網絡拓撲,模型切分策略等,設計一個性能較好的并行訓練策略。更糟糕的是,這些并行序列的優化細節與算法業務無關,卻需要算法科學家進行大量的工作。
隨著算法和模型越來越大,混合運行尤其重要,為此 MindSpore 實現了自動并行功能。只需要一行代碼就能自動混合并行,無需關注系統細節,而且保證性能。

舉個例子,當分類數逐漸增加到 1 千~3 萬左右時,自動并行跟手工并行策略性能持平;但是當分類數增加到 6 萬~13 萬左右時,自動并行的性能就完全超過了手工并行策略;當分類數超過 26 萬時,手工并行已經法無執行,而自動并行則不受影響。
同時,MindSpore 用一行代碼完成了 PPT 調試和運行的切換,既方便了用戶調試,又能保證運行使用性能。
黑盒模型的調試也不用擔心。MindSpore 的可視化工具可以實現訓練過程可視化、數據可視化、模型溯源、模型對比等功能。
在軟硬件協同加速方面,MindSpore 團隊也做了很多工作。
在框架層,團隊采取了 Pipeline 并行和跨層內存復用的方法來進行加速。數據流曲線是指在數據處理和模型訓練過程中進行內部計算,利用訓練的時間去覆蓋數據處理時間,保證生成芯片一直處于計算狀態,提高了芯片的利用率。
在軟硬協同方面,MindSpore 將整張計算中下沉到芯片,使得所有的計算都在芯片上運行,這樣充分發揮了昇騰的算力。
4 月將進行公測
今年 1 月,華為已經同步完成了 HMS4.0 ML Kit 商用發布。在即將到來的 4 月,MindSpore 將在 ModelArts 實現公測。屆時,大家就可以體驗 MindSpore了。在端側,MindSpore 將在 HMS ML Kit 的智慧服務中提供 10 多種功能。
據陳雷透露,MindSpore 團隊在近一年會根據用戶的反饋和訴求,持續調整計劃的優先級。團隊將提供更多的預置模型,補齊 API 和算法庫,不斷優化性能和軟件架構,完善可視化調整、調試、調優安全和相關的工具。

在本次開源后,華為將致力于構建碰蓬勃發展的生態。主要從開發者扶植、高校科研合作、開源社區合作三個方面著手。
開發者扶植:線上免費體驗資源、全年舉辦最少 10 場線下沙龍、舉辦 MindSpore 開發者大會;
高校科研合作:專項基金課題開放(包括 AI+HPC、下一代框架),MindSpore 教學扶植計劃;
開源社區:招募 Committer 參與社區項目。
傳送門:
MindSpore 開源社區:https://www.mindspore.cn
MindSpore 代碼托管:https://gitee.com/mindspore
雷鋒網雷鋒網雷鋒網
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。