RapidMinerテンプレート 解約予測モデリング (CHURN MODELING)


1. はじめに

RapidMinerには多くのすぐに使えるテンプレートが備わっています。データを入れ替えて応用可能です。ここでは以下の解約予測モデリング (Churn Modeling)について見てみます。

 

2. プロセスの概要

過去の解約データに基づいて解約予測モデルを決定木で作成します。予測モデルをトレーニングし評価します。

※元のテンプレートは説明が英語です。

3. 各オペレータの説明

Retrieve

データを取り込みます。ここでは以下の書式のデータ(9990件)になります。

Set Role

着目する列を指定します。ここでは解約指標(CurnIndicator)をlabelに指定します。

Numerical to Binominal

ChurnIndicatorは0~1.186の数値ですが、これを0.5より小さければFalseで継続, 大きければTrueで解約とします。

Cross Validation

ダブルクリックすると中身に入れます。左側がトレーニング、右側がテストになります。

左側で決定木モデルをトレーニングし、右側のApply Modelにトレーニング済みのモデルを適用してPerformance (Binomical Classification)で評価をします。

4. 結果

このモデルは以下のように実際に継続(true false)した9819+150件のうち、9819件を継続、150件を解約と予測しました(左側の列)。class recallは9819/(9819+150)=98.5%です。

実際に解約(true true)した4+17件のうち、4件を継続、17件を解約と予測しました(右側の列)。class recallは17/(4+17)=80.95%です。

 

決定木はまず、昨年のサポートコールの数が10回以上であれば、解約する率が高いことを示しています。

9回以下の場合、平均請求額が$14.5よりも大きく、サポートコールが9回で、契約開始が2011年4月19日以前であれば解約する率が高いことを示しています。

5. Tipsなど

各オペレータを選択すると右側にパラメータ、ヘルプが表示されます。ヘルプには概要と詳しい説明、チュートリアルのプロセスがあります。

各オペレータを右クリックしてブレークポイントを挿入し、オペレータの動作を確認できます。

 

5. まとめ

RapidMinerにはすぐに使えるサンプルのプロセスが多数あり、データを入れ替えれてすぐに活用できます。各オペレータの説明とチュートリアルもあり、使い方を確認できます。ブレークポイントを活用し、各オペレータの動作を確認できます。

 

RapidMinerの製品ダウンロードページ