RapidMinerテンプレート 解約予測モデリング (CHURN MODELING)
1. はじめに
RapidMinerには多くのすぐに使えるテンプレートが備わっています。データを入れ替えて応用可能です。ここでは以下の解約予測モデリング (Churn Modeling)について見てみます。
2. プロセスの概要
過去の解約データに基づいて解約予測モデルを決定木で作成します。予測モデルをトレーニングし評価します。
※元のテンプレートは説明が英語です。
3. 各オペレータの説明
Retrieve
データを取り込みます。ここでは以下の書式のデータ(9990件)になります。
Set Role
着目する列を指定します。ここでは解約指標(CurnIndicator)をlabelに指定します。
Numerical to Binominal
ChurnIndicatorは0~1.186の数値ですが、これを0.5より小さければFalseで継続, 大きければTrueで解約とします。
Cross Validation
ダブルクリックすると中身に入れます。左側がトレーニング、右側がテストになります。
左側で決定木モデルをトレーニングし、右側のApply Modelにトレーニング済みのモデルを適用してPerformance (Binomical Classification)で評価をします。
4. 結果
このモデルは以下のように実際に継続(true false)した9819+150件のうち、9819件を継続、150件を解約と予測しました(左側の列)。class recallは9819/(9819+150)=98.5%です。
実際に解約(true true)した4+17件のうち、4件を継続、17件を解約と予測しました(右側の列)。class recallは17/(4+17)=80.95%です。
決定木はまず、昨年のサポートコールの数が10回以上であれば、解約する率が高いことを示しています。
9回以下の場合、平均請求額が$14.5よりも大きく、サポートコールが9回で、契約開始が2011年4月19日以前であれば解約する率が高いことを示しています。
5. Tipsなど
各オペレータを選択すると右側にパラメータ、ヘルプが表示されます。ヘルプには概要と詳しい説明、チュートリアルのプロセスがあります。
各オペレータを右クリックしてブレークポイントを挿入し、オペレータの動作を確認できます。
5. まとめ
RapidMinerにはすぐに使えるサンプルのプロセスが多数あり、データを入れ替えれてすぐに活用できます。各オペレータの説明とチュートリアルもあり、使い方を確認できます。ブレークポイントを活用し、各オペレータの動作を確認できます。