0
得益于物聯網和工業4.0的興起,最近幾年,不少企業已經通過物聯網的手段,建立起了數據采集,監控和展示的平臺。對于數據的深層次應用,例如利用最新的機器學習算法,對數據進行智能化提升,則是目前工業用戶進行數字化轉型的必由之路。
從現在的趨勢來看,人工智能的熱點領域都集中在語言、圖像交互類, 或者商業應用類。對于工業領域,基于物聯網獲取的流式數據,如何通過人工智能來實現效率提升?在使用這些數據的過程中,如何避免踩坑,順利進行方案的部署?這是工業界需要解決的問題。為此,本期硬創公開課,雷鋒網邀請了覺云科技CEO常偉來為大家講解如何用物聯網數據來構建工業智能。

常偉先生是覺云科技的的創始人及CEO,在成立覺云科技前,他來自于微軟上海,是物聯網方案部門負責人,負責基于云端的物聯網的服務組件設計和推廣,包括了Azure的PaaS和SasS的服務在中國的落地,提供云端的數據接入,協議轉換,服務分配,平臺集成,分析和展示。主要客戶包括上海觀致,中國福特、中國通用等企業。
以下內容整理自本期公開課,雷鋒網做了不改變愿意的編輯:
整個互聯網到物聯網走到現在是可以通過數據其解決一些問題的。
在信息化時代,我們經歷了從數據到信息到知識再到智能的過程,我們也相信在商業、工業領域都有大量的信息或者數據,而這些數據的價值就需要業界來挖掘,最后才會走到金字塔頂端智能所要解決的問題。
大家常見的是交互類的智能,例如語音識別、圖像識別等,毋庸置疑,這是現在很熱門的一類課題,但今天講的內容主要聚焦工業領域,怎么利用工業智能解決工業領域的問題。

這張圖片列舉了常見的幾種算法,分類、回歸、推薦、異常點檢測、聚類。分類主要是用來區分不同的群體,回歸主要用來預測,例如預測一臺設備什么時候發生故障;推薦主要解決的是,用戶買了商品A之后,可以推薦商品B或者C;異常點檢測主要針對沒有歷史記錄如何在一個矢量集來找出異常點。
現在這些算法都已經存在,我們的任務主要是利用這些算法來應用到商業應用或者工業應用當中。
工業物聯網的范圍很大,包括數據傳輸、采集、通信以及平臺的展示等。覺云目前做的是工業算法和模塊。這處于工業物聯網中游的位置,即拿到工業領域的流失數據后,再進行智能分析得出結果后在跟企業應用系統做集成。

在工業智能里面,一般使用的數據是流式數據,采集的數據大部分來自設備端的數據,例如,泵、變速箱和機床這些和設備相關的變量。

在采集完數據后,可以通過算法模型進行建模評估,評估完之后就可以給客戶提供預測性維護、能效管理以及質量管理等。
針對不同業務領域提供算法模型,這些算法模型還會推送出一些結果。最后還會有不同的部署方式。有兩種,一種是結果會嵌入到現有的設備管理系統平臺,第二種是會構建SaaS服務平臺,例如機床診斷模塊。
工業大數據分析是最近一兩年有了工業物聯網后才興起的。目前覺云是基于既有經驗,已經有行業的know how,可以在8周的時間里進行部署。

在這期間,主要做兩大工作:第一階段是數據的準備,包括數據導入、數據清洗和基本的可視化;第二部分是數據建模,包括特征和算法的選擇、模型測試和評估。這兩大工作后面會結合實際案例作分析。
在這兩部分工作做完后,就是數據運營了。上述模型通過可視化之后會部署到現有的平臺或者是SaaS服務云。在這部分,需要有日常的運營工作,例如應用端的部署、分值計量和衡量指標,到最后還會反饋到第一個階段,算法不是一成不變的,隨著數據的積累、故障調優,會重新反饋到第一階段。所以實際上,算法是在云端或者在本地的自學習的算法,隨著數據的積累,也會更加智能。
電梯是量很大的設備,對安全質量要求很高。在電梯的智能化轉型過程中,有三個階段。

第一階段以安全監控為主,主要是東芝、日立這些日系企業通過總線系統收集電梯運行的實時數據,根據預先定義的閾值(例如最高速度)進行報警。
第二階段就是三菱電梯通過歷史數據進行存儲,然后對地洞次數、運行時間做統計。統計指的是數據分析來預測電梯的健康狀況。第一階段和第二階段主要用的是歷史數據或者是人工統計的方式來做分析。
第三階段就是智能預測了,這一階段可以通過電機總線和外加傳感器的方式來收集實時數據,這些數據可以從系統層面來分析故障、能耗等。與此同時,隨著這些數據的積累,還可以建立一個回修專家系統,像OTIS、蒂森克虜伯這些公司已經在做這部分工作。
Gartner曾對蒂森克虜伯的方案做出這樣評價,它是電梯預測性維護的第一個方案,它可以告訴技術工人怎么去維護。蒂森是一家德國高端電梯公司,在北美一共有一百萬的電梯在運行。蒂森和微軟、CGI合作,通過物聯網監控平臺BlueBox,可以把數據實時上傳到云端,在云端進行數據存儲分析,最后把結果展現到終端,所以售后團隊就可以提前知道電梯的情況,這樣就可以實現停機時間縮短一半。
雖然很多都能做到實時監控,但大數據需要做的是用云來做實時的分析。

這張圖顯示了某臺電梯在某個位置的健康狀況。從圖中可以看到,這臺設備的健康指數是70%,這其中采集了溫度、電梯速度高速、電梯門關門時間等,通過這些數值的綜合評估來給電梯做健康值的打分。
下一步就是實時性預測。采集這些電梯變量之后,通過分析就可以得出預測,再對工作人員進行通知,設備在幾天之后會出現故障。

這是蒂森電梯的應用架構
從圖中可以看出,BlueBox獲取數據后,進行前端處理并做存儲。事實上,在這一階段,做存儲并不容易,流式數據的采集、展示和分析,對數據質量要求很高。此外,還可以利用機器學習來對實時監控做評判。
做大數據分析出發點是解決用戶痛點,工業物聯網和傳統交互體驗的人工智能相比,最大的區別就是工業智能解決的是顯示存在的問題。預測維護可以幫助客戶進行提前預警、備貨,減少人力成本;創建新的可靠性標準;實時監控,可以給電梯提供商、業務和用戶帶來安全保障。
和電梯一樣,變速箱也是一臺成套設備,由電機、減速箱、驅動器、鋼絲繩等部分組成。而對成套設備做預測性維護并非是預測成套設別的生命周期,最終都是對系統的組成單元做預測性維護,把問題聚焦。

這是整體的分析框架
數據源來自客戶,包括報警數據、模擬數據(電流電壓溫度等)、數字數據(開關位置)、標簽描述。拿到這些數據后,就要做相應的數據存儲和分析。這里主要做兩部分工作:1.可視化,主要目的發現問題的時間分布在哪,從該圖可以看出,我們收集到的數據量非常大,模擬數據175M,數字數據10M,報警歷史記錄有1740條。。
然后再通過機器學習進行建模,對故障模型進行分析,分析后把故障預測的結果推送到可視化工具。
在之前的案例中我們發現,每個這些問題發生的頻率是不同的。變速箱過熱是常態問題,5個月一共發生了1340起,占到了整個故障的77%,如果能準確預測這類問題,那么就能結局大部分問題。
除此之外,需要注意的是,有些問題之間也存在關聯,例如變速箱過熱會產生其它的問題。當某天變速箱過熱問題特別集中,我們要分析這其中的原因,這對數據建模、特征分析、特征工程非常有幫助。
拿到數據做完分析之后,下一個工作是要工程處理。
工業智能數據有個特點:低維高頻,維度不多(相比購買行為預測的變量很少),但是頻次很高,每秒都在采集。所以,我們需要有相應的處理辦法:對傳感器的數據做聚合,最大、最小、中值、標準方差等,主要目的是讓初始變量更加豐富,變量越多預測的準確性也越高。
然后是數據建模。對于故障預測,我們進行了多個模型的選擇,尤其是在分類和異常檢測方面。分類是要告訴設備是否會壞,這會用到二元分類、回歸、多元分類和異常點檢測。

建模后要進行模型評估

這張圖顯示的是,在自由的算法包中進行評估來預測下5個小時內發生變速箱過熱的概率。右下角是預測的對比值(邏輯回歸、增強決策樹、決策樹、支持向量機):
最終評估下來,增強決策樹算法在準確性、精準度等擁有很好的表現,所以最后選擇用這個算來作為變速箱過熱的預測。
最后是模型部署。做完模型之后,輸出的結果是一條記錄,例如變速箱在未來5個小時發生過熱的概率是多少。這之后有三種選擇:第一是和現場維修工單系統對接,第二是把結果推送到系統監控平臺,另外也會發郵件提醒給管理人員。
從目前來看,能做數據采集的公司一般都具備這樣的維修工單系統平臺。
變速箱智能化主要給客戶帶來了四個方面的價值:提升設備、人員的生產力;減少故障停機,提高客戶滿意度;建立智能碼頭;構建新的價值體系。

另外,這個案例還得出了一個結論:如果要做成套設備的話,一定要從組件開始做預測。
在工業制造里面,機床最核心的問題就是刀具問題。實際上,刀具之于機床就如牙齒之于人類,如果刀具發生問題能提前感知,才能第一時間修復。
如果問題發生之后,再去修復就已經產生了廢品,這也會造成更大的損失。

上圖顯示的是某公司通過控制器收集了不同機床運行的數據,包括電流、電壓等。這里有幾個原則:因為影響刀具壽命的變量很多,所以需要人工智能算法來預測;另外,可以和多年經驗曲線進行結合;刀具壽命是非線性關系,一定要通過實時數據進行在線學習。
應用大數據算法形成智能化機床設備管理體系之后,會根據數據建模分為兩大問題:第一類,刀具會不會發生故障,第二類是多久發生故障。
針對第一類問題,用分類模型來解決,例如選擇用邏輯回歸、決策樹還是神經網絡來告訴我們會不會壞,如果會壞,就來到下一個問題。預測多久發生故障,則主要用決策樹、泊松回歸、神經網絡回歸等來告訴設備提供商設備多久會壞。
之前,我們看到的智能算法主要聚焦在商業或者交互領域,現在我們正在嘗試把智能算法帶到工業領域。
工業智能,解決問題的算法體系主要分為三大類:第一是預測性維護,這對于基于物理損耗為主的設備是最行之有效的算法;第二類是能效管理;第三類是質量管理。
Q:對于流程工業生產環境下的生產設備故障預測,在數據采集匯總階段,需要考慮哪些因素?或者需要哪些數據輸入呢?
A:這里面有兩個層次的問題:第一個是自上而下來做,現在流程工業里面,DCS(雷鋒網注:分布式控制系統,Distributed Control System)已經采取了很多數據,現在我們用這些DCS數據,我們可以做一些基本預測性維護;
第二種是自下而上,以泵為例,DCS有些數據是關于泵的,但是有些數據是沒有的,在這種情況下,一定是前裝+后裝的方式。前裝就是利用DCS固有的數據,后裝就是加裝一些沒有的數據,這樣配合才能準確預測泵或者管道的預測性維護的點。
我認為前裝方式所拿到的數據是最好的,后裝則更具挑戰。
Q:阿里云正式發布了ET工業大腦。這個大腦目前已經被用在了協鑫光伏工廠里,可以提高1%的生產良品率。常偉老師如何看待這個產品?對傳統工廠來說,怎么選擇?
A:阿里云這個是上文提到的第三類解決方案,質量管理方案。對于生產良品率來說,每個工廠都要case by case做分析,對傳統工廠肯定需要找一個比較靠譜的方案。
Q:小型工廠缺乏數據的積累,以您的經驗來看,對我們來說接入大數據方案需要考慮哪些問題?
A:小型工廠我建議采用SaaS解決方案,現在很多服務商提供一些現成的SaaS解決方案,幫助現有的工廠機床、泵等做到云端,然后再來根據數據做分析,對小型工廠來說,這種方案還是比較靠譜可行的。
Q:國內政府一直在喊數字化轉型,從目前來看,國內技術是否成熟了?
A:從現在來看,尤其是對制造企業而言,技術是比較成熟了,數字化轉型無非是數據采集、傳輸、存儲和分析這幾塊。目前的企業在幾部分都有比較成熟的解決方案,不過有些企業的管理水平有待提高。
大家一直在談我們的工業水平比較低,現在有一個問題是我們的管理能力是否能支持中國制造2020。
Q:工業化轉型最大的挑戰是什么?怎么去克服這些問題?
A:最大的挑戰我們認為有兩個方面:一個是人的管理水平;第二個是技術方面的問題。
覺云有一個客戶是做刀具的,通過傳統的方式他認為沒有法提升了。他們希望通過數字化的方式來提取數據,來告訴他這種刀具在加工哪種材料和工藝是最佳的,這就可以幫助他去挑戰國外一些企業。
目前來看,數字化轉型是解決技術問題的主要方式。做數字化平臺第一步是建立數字化預測,第二步是數字化工單系統,第三步建立和工藝之間的關系,這幾步下來最少要2-3年,所以工廠要對這個周期有一個認知。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。