云智擎信息技術(shù)(北京)有限公司副總經(jīng)理王曦出席“第五屆中國風(fēng)電后市場專題研討會”,在風(fēng)電場技改與優(yōu)化專題論壇,分享題為“基于神經(jīng)網(wǎng)絡(luò)的預(yù)防性維護(hù)策略實踐”的主旨演講。
云智擎信息技術(shù)(北京)有限公司副總經(jīng)理 王曦先生
以下為發(fā)言內(nèi)容:
王曦:我們是跟之前所有的演講嘉賓的公司不一樣,我們是純第三方做數(shù)據(jù)分析,工業(yè)大數(shù)據(jù)平臺獨(dú)立開發(fā)的一個廠商,風(fēng)電行業(yè)其實覺得也是蠻有淵源的,風(fēng)電行業(yè)的合作來講2014年就開始了,最近三四年的時間公司也比較大的投入做這方面的投入,公司本身我們是不做硬件,不做傳感器和采集盒子,我們本身是工業(yè)大數(shù)據(jù)的平臺以及算法,我們的合作伙伴,我們是第三方公司,我們技術(shù)上和微軟、亞洲研究院,和NVIDIA中國的團(tuán)隊有深度的合作,針對深度學(xué)習(xí)、記憶學(xué)習(xí)的行業(yè)應(yīng)用上。
客戶的群體來講,能源角度我們新能源、風(fēng)力發(fā)電和石油、石化方面有一些客戶的合作,目前主要的客戶來源都是設(shè)備的整機(jī)廠商和石油、石化設(shè)備研發(fā)公司,還有海油和中石油設(shè)備研發(fā)公司這樣,風(fēng)電行業(yè)業(yè)主的區(qū)公司有比較多的合作,設(shè)備的故障預(yù)測、診斷,以及我今天會主要講的運(yùn)維策略整體解決方案角度。
這頁片子講了我們行業(yè)面臨的問題以及挑戰(zhàn),很早以前,2014年國內(nèi)的廠商可利用小時數(shù),國外的可利用效率比我們多,發(fā)電效率比我們好,國內(nèi)這幾年整機(jī)的研發(fā)、整機(jī)的利用、整機(jī)的技術(shù)迭代來講,我不覺得硬件角度存在什么問題。我們可能存在運(yùn)維策略,對硬件沒有利用上,可能有一個很好的提升,這里面我們列了幾點(diǎn),包括我們運(yùn)維管理還不是完全的閉環(huán)管理,我們傳統(tǒng)的關(guān)系被動式的,不是預(yù)測系統(tǒng),報警系統(tǒng),是有問題了才報出來,現(xiàn)場有運(yùn)維和工程師解決,然后再反饋,這個反饋就很薄弱,包括數(shù)據(jù)的質(zhì)量。
我們從設(shè)備品牌來講已經(jīng)接入了6到5個設(shè)備品牌的數(shù)據(jù),我們發(fā)現(xiàn)數(shù)據(jù)質(zhì)量遠(yuǎn)遠(yuǎn)沒有達(dá)到這樣的標(biāo)準(zhǔn),我們在美國參觀過GE的現(xiàn)場,和他們的監(jiān)控中心,他們引以自豪的就是說可能我們的截面,我們的功能沒你們做的那么酷炫,那么強(qiáng)大,我們的數(shù)據(jù)質(zhì)量一定是非常好的,因為他們有很多對于數(shù)據(jù)質(zhì)量的提升機(jī)制。我們回來花了一年多的時間在這部分對數(shù)據(jù)質(zhì)量評判,數(shù)據(jù)有效性的評判,包括數(shù)據(jù)的機(jī)制都建立起來了。
對業(yè)主來說機(jī)型、品牌比較多也是一個困擾,比如說長時間等待備件也是一個問題。運(yùn)維整體方案來講這是整體的方案,數(shù)據(jù)實時接入,包括大數(shù)據(jù)計算方面的子系統(tǒng),包括后面無人式工單和策略的管理,底層是大數(shù)據(jù)的管理,大數(shù)據(jù)的分析和最后可視化結(jié)果的展現(xiàn)。
這頁騙子就一行字,這個就是我們踩過N多坑最后的總結(jié),每家企業(yè),每家運(yùn)維服務(wù)團(tuán)隊都在講我要提高運(yùn)維質(zhì)量,我要做基于預(yù)測性、主動性的運(yùn)維,怎么做?對于我們來說就這幾點(diǎn),首先我接入靠譜、高質(zhì)量的數(shù)據(jù),數(shù)據(jù)不管接了急控,接了實施數(shù)據(jù),我可能會接一些故障數(shù)的數(shù)據(jù),接一些比如說分資源的數(shù)據(jù),這個數(shù)據(jù)的質(zhì)量怎么樣,會不會幫我們形成比較好的結(jié)果?
此外精準(zhǔn)的算法,算法每年的法國都特別快,算法的角度講我們這里講精準(zhǔn),實操層面就是靠譜的算法,不一定每一個場景都要用深度學(xué)習(xí),每一個場景用CPU進(jìn)行大量的運(yùn)算,只要精準(zhǔn)貼合就好了。前兩個是一個基礎(chǔ),但同樣要和專業(yè)的專家的知識圖譜融合,否則你先做數(shù)據(jù)標(biāo)記,我沒有行業(yè)專家,沒有行業(yè)的知識圖譜,你連標(biāo)記都做不準(zhǔn),肯定有比較大的問題。
從整體來講這是我們整體用比較簡單的圖形表現(xiàn)出來我們工作的方式,所以要做一個基于深度學(xué)習(xí)比較精準(zhǔn)高質(zhì)量的運(yùn)維體系,所以左側(cè)就是剛才跟各位介紹的我們揭露的數(shù)據(jù),中間我們包括風(fēng)機(jī)數(shù)據(jù)、運(yùn)維數(shù)據(jù)、氣象數(shù)據(jù)N多數(shù)據(jù)的算法,左邊是包括故障預(yù)警、設(shè)備健康度,基于這兩個產(chǎn)出的運(yùn)維策略包。
其實剛才講的那么多,最離不開的就是我們基礎(chǔ)的大數(shù)據(jù)的運(yùn)行平臺,雖然預(yù)警、精準(zhǔn)運(yùn)維很出彩,所工作都是通過分布式的集群進(jìn)行計算,這個集群底層是數(shù)據(jù)揭露層,風(fēng)場的數(shù)據(jù),實時數(shù)據(jù),錄播各種設(shè)備的數(shù)據(jù),包括資產(chǎn)數(shù)據(jù),風(fēng)機(jī)生命檔案這樣的數(shù)據(jù)都要接進(jìn)來,當(dāng)然我們在數(shù)據(jù)大數(shù)據(jù)平臺進(jìn)行處理、規(guī)劃、分類、匯總,再上層是大數(shù)據(jù)分析平臺,上面有很多實時分析的算法,預(yù)警算法,以及我們叫運(yùn)維最優(yōu)化的算法,包括融入了很多故障數(shù)的數(shù)據(jù),融入了很多數(shù)據(jù)做最后整體的展現(xiàn)。
我今天的主題是深度學(xué)習(xí)基于神經(jīng)網(wǎng)絡(luò)的預(yù)測性運(yùn)維的策略,其實從整體來講,在我們開來最后要產(chǎn)生一個能落地的,能讓現(xiàn)場同事,現(xiàn)場工程師快速解決的方法,我們把運(yùn)維策略分三個部分,第一部分無論是預(yù)警也好,還是我們叫設(shè)備健康度,我們這個風(fēng)場25臺風(fēng)機(jī),哪臺或者是哪幾臺風(fēng)機(jī)運(yùn)行最差,最差是什么樣的問題我們首先要找到,有了個問題我找到問題了,派什么樣的人,帶什么樣工具,帶什么樣的備件什么時候點(diǎn)去做,什么時候做停機(jī)最合適,就叫運(yùn)維窗口期和運(yùn)維工作包,就是策略包。比如說這個運(yùn)維點(diǎn)需要4個人早上幾點(diǎn)做比較好,什么時候停機(jī)比較好,里面是不是有故障數(shù)、處理措施的支持,還是我有足夠的人員能力和備件的支持,我們有動態(tài)運(yùn)營、疲勞期等等設(shè)備分析是不是在比較差的疲勞期,這些都是我們中間結(jié)果和產(chǎn)出了,底層一樣,底層我們需要大量的數(shù)據(jù),運(yùn)維數(shù)據(jù),相關(guān)的其他數(shù)據(jù)做支撐。
這個剛才也提到了,我們要算健康度要看相關(guān)點(diǎn)位的動態(tài)預(yù)值,要看相關(guān)的一些問題,不會看到不相關(guān)部件的一些點(diǎn)位,另外要看全場對比,全場對比就是說全場里找出來模擬標(biāo)準(zhǔn)工況下什么指標(biāo)下運(yùn)行,不同的直銷是不是會有樣的問題,當(dāng)然我們會分析疲勞度,也會有故障預(yù)警來做這樣的工作。
說是這個想法的由來,現(xiàn)在覺得很普及,有很多做這樣的事情,主機(jī)的角度和運(yùn)維的角度SCADA很多運(yùn)維的設(shè)置比較靠后,不會是非常靈敏的數(shù)值,可能是比較靠后的準(zhǔn)備,以及提前準(zhǔn)備好工作包和運(yùn)維策略來幫助整體最終無論是成本的降低還是發(fā)電量的提升。
所以我們的基本原理也是剛才這幾點(diǎn),包括我們針對滑動窗口期一個坍塌的計算,什么叫滑動窗口期?這跟傳統(tǒng)SCADA和急控的考慮不一樣,我們是會往前延長一個有選擇的時間窗口期來選擇適當(dāng)?shù)臄?shù)據(jù),幫助我們做未來的預(yù)測,當(dāng)然這里面還是有一些統(tǒng)計學(xué)和應(yīng)用數(shù)據(jù)的理論在里面,我們會算疲勞期,疲勞期很多人會想,疲勞期很簡單,我就說這個風(fēng)機(jī)工作多式小時,我們后來發(fā)現(xiàn)這樣比可能不是完整的,雖然能夠解決一定問題,完整的想法我們是想說,疲勞期是不是應(yīng)該在同功率,同發(fā)電量的情況下比較疲勞期,疲勞期要跟時間關(guān)聯(lián),跟故障率相關(guān)聯(lián),這是比較完整的疲勞期。
我們用深度學(xué)習(xí)專干期記憶LSTM的模型做這樣的事情,這是建模的過程,這里不詳細(xì)講了,這也是涉及到剛才四個主要建模的過程。具體模型的創(chuàng)建和其他機(jī)器學(xué)習(xí)的方法沒有什么區(qū)別,數(shù)據(jù)進(jìn)來做聚合、提取做重要點(diǎn)位,然后做模型,做預(yù)測做驗證,效果好持續(xù)優(yōu)化,效果不好做一些各個點(diǎn)位的一些調(diào)整和技術(shù)的一些工作,當(dāng)然我們是分三步做的,這是第一個,第二個是針對我們?nèi)珗鰧Ρ鹊模槍σ恍顟B(tài)預(yù)測的結(jié)果,針對疲勞的一些分析,都是通過機(jī)器學(xué)習(xí)和深度學(xué)習(xí)進(jìn)行的這樣一個分析。
詳細(xì)說說動態(tài)閾值是什么概念?SCADA會進(jìn)行報警,這是詳細(xì)的閾值,動態(tài)閾值不同工況下不定不同,不同的風(fēng)速、不同的轉(zhuǎn)速有時候可能80度夠了,有的時候可能85度需要報,我們用深度學(xué)習(xí)歷史的數(shù)據(jù)作為模型,未來24小時、48小時溫度的點(diǎn)位、數(shù)值應(yīng)該在什么數(shù)值上,這是我們要考慮的問題,這個過程是實時數(shù)據(jù),沒有寫太細(xì),對于數(shù)據(jù)的質(zhì)量我們做了大量的工作,數(shù)據(jù)確實怎么補(bǔ)齊,數(shù)據(jù)有的水溫低于多少度以上,用什么樣的方式修整過來。體征提取,對于設(shè)備零部件的亞健康,特寫特征跟它比較密切。
當(dāng)然我們也會針對這些異常用聚類分析,判斷哪些點(diǎn)位是異常的,會匯聚到我們整體工作當(dāng)中,疲勞期開始的時候下降比較快,平穩(wěn)期,最后是損耗失效期,這個是一個樣子,每一臺設(shè)備算出來的比率或者是梯度都是不一樣的,整體的趨勢是這樣的,我們把它放在整體策略的前期分析里面做整體策略分析的支持。
當(dāng)然最后說一下預(yù)警,其實這個是我們的一個老片子了,我們預(yù)警模型不止這些了,針對預(yù)警模型來講,我們原來覺得這個跟SCADA差不多,用戶也覺得是SCADA,我們可能提前預(yù)測用戶覺得很好,后來只是覺得我只是預(yù)測出來一個事件意義是不大的,為什么我們要做針對這種大部件或者是整機(jī)的健康度?我們要把這些東西關(guān)聯(lián)到一個大部件,或者是二級、三級部件上才有意義。但是我們整體的一個分析計算里面都是按照計算,分析葉片、整機(jī)等等這些都會跟我們具體大部件健康度的分析融合在一起的。
剛才計算了那么多,無論是疲勞期、動態(tài)閾值還是其他的這些東西,我們要做成集成算法匯集起來,算法這邊會看到有幾個比例,70、20、10,動態(tài)閾值狀態(tài)預(yù)測70%,異常點(diǎn)檢測20%,疲勞度分析10%,我們每次比例都是不一樣的,只有我們觀察動態(tài)閾值還是70%,所以其他的每次都不一樣。
講了這么多我們這次結(jié)果還是不錯的,左側(cè)是我們預(yù)測的故障的時段,右邊是健康時段,雖然有下降,但是還是屬于我們健康的故障圖譜里面,我們通過這樣完成了整個的過程。說一個具體的例子,就拿齒輪箱,齒輪箱運(yùn)維上面的問題有時候還是比較多的,我們預(yù)防性策略上一個具體的例子,比如說我們會算齒輪箱健康度,我們會看齒輪箱的油溫,最佳時間,什么樣人可以做這個事情,我們可以用什么故障解決方案做,以及他需要什么樣的工具。齒輪箱健康度和我們運(yùn)維策略包會合成一個工單下發(fā)下去,這個工單做完之后會回來的。
這是內(nèi)蒙風(fēng)場廠的一個案例,我們做了一些處理,把一些隱患找到了。這里多說一句,其實SCADA這個是特別好的一個東西,它相當(dāng)于對設(shè)備是一個在最底層,或者是真正大的損壞之前會報出來,但是它不關(guān)注小的隱患,我們?yōu)槭裁匆P(guān)注小的隱患,部件的隱患?因為很多部件的隱患不做處理有一天報警了,SCADA的問題不做出來,然后有一天SCADA的問題真的出現(xiàn)了,我們正套的運(yùn)維就是查缺補(bǔ)漏,我們會預(yù)先、提前來發(fā)現(xiàn)這個問題,告知這個問題,以及具體怎么操作,形成我們策略包做這樣的事情。
這是我們產(chǎn)品的一些截屏,放在最后不是我們最重要的部分,是我們預(yù)警加策略包的產(chǎn)品,我們剛才講的算法、底層的計算,和大數(shù)據(jù)相關(guān)是我們的關(guān)鍵,但是沒有算法、底層的計算,高效的計算能力這些都沒有辦法做到實時。現(xiàn)在我們這套機(jī)制,包括全局管理、性能KPI指標(biāo),行業(yè)內(nèi)十幾個KPI指標(biāo),包括預(yù)警,健康度預(yù)警,審批及工單,以及策略包和解決方案建議,這是完整的一套體系。到了這邊工單完成之后還會回到整體的平臺里面做持續(xù)的優(yōu)化和分析。
簡單來說我們的初衷很簡單,就是能省的成本省下來,能發(fā)電的時間盡量發(fā)電,提升發(fā)電量,降低運(yùn)維成本,少換配件,提前維修就這么簡單。
這是我整體的介紹。
謝謝大家!
(根據(jù)發(fā)言整理,未經(jīng)本人審閱)