RapidMinerテンプレート メンテナンス予測 (PREDICTIVE MAINTENANCE)
1. はじめに
RapidMinerには多くのすぐに使えるテンプレートが備わっています。データを入れ替えて応用可能です。ここでは以下のメンテナンス予測 (PREDICTIVE MAINTENANCE)について見てみます。
2. プロセスの概要
過去のマシンの稼働と故障のデータに基づいて、マシンの故障をモデル化 (トレーニング)します。 モデルを現在の状況に適用 (テスト)して、マシンの故障を予測します。この予測により、事前にメンテナンスの計画ができます。
※元のテンプレートは説明が英語です。
3. 各Stepの説明
Step 1
データを取り込みます。ここでは以下の書式のデータ(マシンID 1~136, 故障の有無, センサー1~25の数値)になります。
STEP2とSTEP3用にデータをコピーします。
Step 2
以下をダブルクリックして中に入ります。
Correlation, Gini Index, 情報ゲイン, 情報ゲインの割合に基づいて重みづけし、Appendでこれらをマージし、Aggregate(集計)→Rename→Nominalize(1に規格化)→Sort→Reorder(並び替え)して、どのセンサーが重要かを出力します。
重要度の順番にセンサーが表示されます。
Step 3
この中にあるk-NN(k近傍法)のパラメータkを最適化します。k近傍法は、教師あり学習の分類問題に利用される機械学習手法で、最近傍のデータをk個取ってきて、それらがもっとも多く所属するクラスに分類します。
Optimize ParameteダブルクリックするとCross Validationがあります。
Cross Validationをダブルクリックするとk-NNのトレーニングとテストがあります。
Logオペレータによって、最適化結果を出力します。
Step 4
新しいデータ(マシンID 137~272)についてStep 3のk-NNモデルを適用し、マシン故障を予測します。
どのマシンが故障しそうか、confidenceとともに出力します。
5. まとめ
RapidMinerにはすぐに使えるサンプルのプロセスが多数あり、データを入れ替えれてすぐに活用できます。各オペレータの説明とチュートリアルもあり、使い方を確認できます。
このテンプレート (PREDICTIVE MAINTENANCE)では、マシンId、故障の有無、各センサー値のデータから、k近傍法を使ってマシンの故障を予測するモデルを作成しました。ほかにもk近傍法を使った分類問題にこのテンプレートは適用できます。
参考リンク
https://support.rapidminer.jp/rapidminer-ai-hub/9.8/web-services/predictive-maintenance/