閱讀屋>機械/重工/工業自動化> 資料探勘機械學習演算法探討論文

資料探勘機械學習演算法探討論文

資料探勘機械學習演算法探討論文

  摘要:隨著我國經濟技術的不斷髮展,資訊科技水平也在不斷的提升,計算機技術的廣泛應用,對社會的各個領域都有著影響。資訊系統在現在社會中也有著廣泛的應用,在傳統的資料分析以及統計技術的基礎上有了一定的創新,現在社會在不斷的進步,對大規模資料的研究力度應該加強,不斷的挖掘出一些有用的知識,然後使挖掘技術不斷的完善。機械學習演算法有利於解決資料探勘問題。機械學習可以進行自我完善,在這個過程中,計算機會逐漸的積累經驗,從而提高自身的效能,機械學習的能力雖然沒有人類大腦學習能力強,但是隨著不斷的創新,使計算機具備了從大量資料中提取特徵、發現隱含規律的能力。也正是因為這樣,資料探勘中的機械學習演算法也被廣泛的運用。

  關鍵詞:資料探勘;機械學習;學習演算法;應用探討

  資訊管理技術在各大企業中資料管理技術也被廣泛利用,資料管理技術的廣泛運用有利於企業內部職能部門之間的溝通聯絡。但是在使用的過程中還是有些不足之處,資料資訊越來越多,這就會使資料分析具有一定的複雜性。

  1完善GA-BP神經網路模型

  本文就在傳統的遺傳演算法的基礎上提出了一種新的改進型遺傳最佳化BP神經網路模型。這種神經網路模型對傳統的這種神經網路模型在遺傳演算法的染色體結構和遺傳運算元兩個方面進行了相關的最佳化,然後在進行BP神經網路結構引數改進的時候,採用了自適應交叉和變異機率,下面就對改進的過程進行了簡要的分析說明。

  (1)設計染色體結構。控制基因和引數基因是上文所描述的新型染色體基因結構的兩個表現形式,這種神經網路模型對傳統的遺傳演算法的染色體結構和遺傳運算元進行了最佳化,從而對對BP神經網路結構引數進行改進。控制基因對BP神經網路結構引數的改進主要是對BP神經網路的隱含層節點數最佳化。另一種結構引數基因對BP神經網路的連線權值和閾值進行最佳化[2]。

  (2)對適應度函式進行設計,具體過程如下:在上述函式中,訓練樣本個數用n表示;訓練資料的均方根誤差用∫rmse表示,誤差一般在0~1之間。

  (3)選擇運算元。從提出的被改進的遺傳演算法上來看,在進行型遺傳最佳化BP神經網路演算法在實現運算元選取改進以常規適應值比例演算法的時候經常採用最優個體保留方法,這樣做會引發區域性最小值等問題。

  (4)交叉、變異運算元。採用單點交叉和基本變異運算元是上文中提出的控制基因是改進型遺傳最佳化BP神經網路演算法的上層所採用的。下層引數基因所採用的是整體算數交叉和非一致變異運算元。

  (5)自適應交叉、變異機率。上文中提出的改進型遺傳最佳化BP神經網路演算法的方式,在進行最佳化的時候可以對設計自適應交叉、變異機率,以此對遺傳最佳化BP神經網路神經演算法的機構和初始權重進行平衡最佳化。對設計分析的簡要過如下,自適應交叉機率可以表示為∫avr表示種群的平均適應值,∫min表示種群的最小適應值,k1,k2通常在1.0上。

  上文中提出的改進型遺傳最佳化BP神經網路演算法的過程的主要幾個步驟可以分為以下幾點:

  (1)對相關的資料進行及時的統一最佳化處理。訓練樣本資料和測試樣本資料是資料最佳化處理之後可分為的種類。

  (2)在對改進型遺傳演算法模型的基本引數進行設計的時候,可以用G來表示最大化代數,在設定的時候要考慮隱含層節點數對種群的規模N的有關規定。

  (3)在對種群上層個體進行最佳化的時候採用採用二進位制編碼,種群下層種群個體進行最佳化採用實數編碼。

  (4)在確定BP神經網路結構引數的時候,可以採用對種群各個個體解碼的形式進行。

  (5)對種群中適很好的個體,採用遺傳操作的形式。

  (6)獲得新的子群,可以對種群中的遺傳個體使用自適應機率進行交叉、變異操作。

  (7)對BP神經網路結構隱含層節點、權值以及閾值等結構引數進行最佳化改進,進行不斷的創新的.過程就是對上下層的子群個體解碼的最佳化。

  (8)進行(5)迴圈的要求有兩個,就是在迭代步數達到了設定的最大值執行(5)迴圈,在最大個體適應度值滿足要求的時候,也要進行(5)迴圈過程。

  (9)在確定最佳的BP神經網路隱含層節點數、閾值和連線權值等引數的時候,採用對適應值最佳的個體進行解碼的形式。

  2機械學習演算法例項

  下面就舉出有關的例子對上文所提出的最佳化過程進行簡要分析,下文所採用的例項是煤礦空壓機的故障診斷系統,然後對改進型遺傳最佳化BP神經網路演算法進行有效的探索研究。

  (1)首先應該做好相應的準備工作,閱讀相關的空壓機的說明書,例如使用說明書和故障說明書等。在使用空壓機的時候,還應該對使用過程中的經驗進行積累,在使用結束後再對相關經驗進行分析總結,空壓機的故障型別以及故障是怎麼來的,在進行資料整理的時候都要進行分析研究,及時的發現問題所在。煤礦空壓機的故障診斷系統就是本文所採用的例項。透過相應的實驗資料分析,煤礦空壓機呈現出5種工作狀態,用符號Y1-Y5表示,以此作為神經網路故障診斷模型的輸出。Y1-Y5所表示的內容如下:Y1表示煤礦空壓機正常的工作狀態;Y2表示煤礦空壓機冷卻水系統出現故障的工作狀態;Y3表示煤礦空壓機潤滑體統出現故障的工作狀態;Y4表示煤礦空壓機軸承出現故障的工作狀態;Y5表示煤礦空壓機電路系統出現故障的工作狀態。如果出現以上故障,根據相關的經驗以及故障的瞭解,故障的表現形式可以分為10種,用符號X1-X10表示,即為神經網路故障診斷模型的輸入。X1-X10分別表示:X1表示煤礦空壓機排氣量過低;X2表示空壓機排氣壓力不足;X3表示空壓機排氣溫度超限;X4表示空壓機冷卻水溫度超限;X5表示空壓機冷卻水壓力不足;X6表示空壓機主機轉速低限;X7表示空壓機振動超限;X8表示空壓機潤滑系統油溫超限;X9表示空壓機潤滑油壓力不足;X10表示軸承溫度超限。

  (2)空壓機經過資料探勘之後的故障診斷分析。透過對空壓機可能出現的故障進行分析,為了看出新的神經網路的良好的效能,採用傳統的遺傳神經網路演算法建立了煤礦空壓機故障針對系統,在進行網路訓練的時候應該採用相同的訓練資料樣本,在測試的時候也應該採用相同的測試資料樣本。透過相應的實驗可以看出,在經過569次迭代後改進型GA-BP神經網路演算法就使得誤差達到了設定範圍內,但是如果採用傳統的神經網路演算法就沒有那麼好的效果,只有在進行2779次迭代才使得誤差滿足要求。由此可以看出,最佳化改進後的BP神經網路演算法在各個方面上都有很好的效果,特別是網路的訓練速度、收斂速度和收斂精度方面。改進型GA-BP神經網路演算法在個方面都有比傳統的演算法要好。為了能夠更加明顯的看出效果,下面採用100組資料進行研究分析。從測試的結果可以看出,87.5%是傳統的P神經網路的診斷正確率,診斷時間為564s,輸出值存在一定的不穩定性,而上文中所提到的最佳化改進後的GA-BP神經網路的診斷正確率為98.2%,診斷時間為246s,輸出值相對穩定,從這資料可以看出,改進後的效果明顯比傳統的BP神經網路演算法要好的多。改進後的BP神經網路演算法的錯誤率比較低,檢測的準確率和速度都有提高,工作效能也有所提高。

  3結語

  在社會的不斷髮展進步的過程中,資料探勘技術也在不斷的創新,在社會中的運用也越來越廣泛,發展速度也越來越快。本文就在傳統的遺傳演算法的基礎上提出了一種新的改進型遺傳最佳化BP神經網路模型。這種神經網路模型對傳統的神經網路模型在遺傳演算法的染色體結構和遺傳運算元兩個方面進行了相關的最佳化,然後在進行BP神經網路結構引數改進的時候,採用了自適應交叉和變異機率,這樣有利於各種資料的處理。

  參考文獻

  [1]李運.機器學習演算法在資料探勘中的應用[D].北京郵電大學,2015.

  [2]胡秀.基於Web的資料探勘技術研究[J].軟體導刊,2015(1):149-150.

【資料探勘機械學習演算法探討論文】相關文章: