チャーン予測とは、各顧客が実際に解約またはダウングレードする前に、その可能性をスコアリングする実践です。これにより CSM は、まだ結果を変える時間があるうちに介入できます。リテンションを、リアクティブな機能(解約メールが届いてから反応する)から、プロアクティブな機能(リスクのあるアカウントに 60〜90 日前から取り組む)へと転換します。
これは health score と同じものではなく、チャーン率とも同じものではありません。health score はアカウント状態の合成スナップショットであり、チャーン率はすでに起きたことを示す GRR/NRR の後ろ向きのインプットです。チャーン予測は前向きの確率です。「このアカウントは今後 90 日で更新しない確率が 38% です」。health score はその確率のインプットになり得ますが、両者は別物です。
実際にモデルを動かす先行指標
チャーンモデルの価値は、その feature の価値と同じです。最も重みを持つシグナルを、おおよその順に挙げます。
- プロダクト利用の減衰。 最も強力な単一の先行指標です。絶対的な利用量ではなく、トレンドです。ログイン数が前四半期比で 40% 下がるほうが、低いが安定した利用量よりもはるかにチャーンを予測します。アカウントごとの週次アクティブユーザー、feature 採用の深さ、プロビジョニング済み seat 対アクティブ seat を追跡します。
- champion の離脱。 economic buyer または power user が会社を去ると、更新リスクが急上昇します。メールのバウンス、LinkedIn 上の役職変更、またはその担当者の活動の急減から検知します。
- サポートのシグナル。 チケット量の増加、CSAT の低下、繰り返される escalation、または — 直感に反して — ゼロへの急落(アカウントが試みるのをやめた)。
- CS とのエンゲージメント。 QBR の欠席、メール開封率の低下、応答の遅さ、コールの無断欠席。
- コマーシャルのシグナル。 支払い遅延、ダウングレード要求、月次契約条件を求める procurement、明細行レベルでの縮小。
- オンボーディングの失敗。 初回価値(TTV)に到達しないアカウントは、到達するアカウントの何倍もの率でチャーンします。90 日のオンボーディングウィンドウは、手元にある最もレバレッジの高い予測インプットです。
利用量だけに依存するモデルは、champion 離脱とコマーシャルのクラスを完全に見逃します。だからこそ、純粋にプロダクトテレメトリ駆動のスコアは enterprise で過小予測になります。
スコアリングモデル、最も安価なものから最も擁護できるものへ
- ルール / 閾値モデル。 手書きのルール:「利用量 >30% 減 かつ QBR 欠席 かつ 更新まで 90 日未満 → リスクあり」。透明で、CSM に説明可能で、構築が安く、ゲームしやすい。ほとんどのチームが始めるべき場所です。
- 重み付けスコアカード。 シグナルごとにポイントを割り当て、合計し、緑/黄/赤にバンド分けします。これは Gainsight、ChurnZero、Vitally のほとんどの health score 機能が標準で提供するものです。何もないよりはまし。重みは通常、フィッティングではなく推測されています。
- 教師あり ML(ロジスティック回帰、gradient boosting)。 ラベル付きの過去チャーンで学習します。本当のリフトが生まれるのはここです — あなたが推測する代わりに、モデルが重みと相互作用を学習します。クリーンなラベル付きデータセットが必要です。最低でも、解約時点ではなくリスク時点での feature 履歴を持つ数百件のチャーンイベント(さもなければラベルがリークします)。
precision/recall と混同行列で評価し、「accuracy」では評価しません。年間チャーンのベースレートが 8% の場合、「誰もチャーンしない」と予測するモデルは accuracy 92% で、完全に無用です。重要なのは、モデルが赤と判定したアカウントのうち実際にチャーンしたのは何件か(precision)、そしてチャーンしたアカウントのうちモデルが間に合って判定したのは何件か(recall)です。
AI が役立つ領域と過大に約束する領域
本当に役立つ領域: 十分なラベル付き履歴があれば、ML は手動チューニングのスコアカードを上回ります。非自明な相互作用を見つけるからです(月次でレポートをエクスポートするためにログインするアカウントなら低利用でも問題ないが、以前は毎日だったアカウントなら五段階警報です)。LLM はスコアカードが無視する非構造化レイヤーに強いです — 1 年分のサポートチケットとメールにわたる sentiment トレンドの要約や、コールのトランスクリプトから「champion が上の空に聞こえる」とフラグを立てること。LLM は分類器そのものとしてではなく、feature を強化するために使います。
過大に約束する領域: 3 つの失敗モードが繰り返されます。第 1 に、cold-start 問題 — モデルは学習するためのラベル付きチャーンを必要としますが、顧客 40 社・チャーンイベント 3 件の Seed ステージの会社には学習する材料がありません。そこで「AI チャーン予測」機能を買うのは演出にすぎません。ルールを使いましょう。第 2 に、accuracy として売られるベースレートの混同 — vendor は、ナイーブなモデルがすでに 92% である低いチャーンベースレートに対して「accuracy 90%」を引用します。常に赤フラグに対する precision と recall を求めましょう。第 3 に、処方なしの予測 — 誰も行動しない確率はダッシュボードの装飾です。モデルは playbook(save タスクの自動作成、エグゼクティブ outreach のトリガー、renewal manager への escalation)に供給しなければ、何も変えません。
よくある落とし穴
- ラベルリーク(label leakage)。 予測ホライズンの時点ではなく解約時点で捕捉した学習 feature(利用量はすでにゼロ、サポートチケットはすでにクローズ済み)。モデルはオフラインで見事に見えて、本番で失敗します。ガード:feature のスナップショットはチャーンイベントの 90 日前時点で取り、当日では決して取りません。
- 行動が遅すぎる。 30 日の予測ウィンドウは enterprise の更新を救うには短すぎます — 決定は数か月前に下されています。save のモーションに滑走路がある enterprise では、60〜90 日で予測します。
- 全セグメントに 1 つのモデル。 SMB セルフサーブのチャーン(価格、低利用)と enterprise のチャーン(champion の喪失、エグゼクティブの不整合)はドライバーが異なります。1 つのモデルはそれらを粥に混ぜてしまいます。まずセグメント化し、それからモデル化します。
- ownership なしのスコアリング。 指名された CSM も、行動するための SLA もない赤フラグは、ダッシュボードで死にます。すべての赤アカウントに、オーナーと「X 日以内に対応する」ルールをペアにします。
関連
- Customer health score — しばしばモデルに供給される合成スコア
- Customer churn — あなたが予測している結果
- チャーン率の計算 — 後ろ向きの指標
- NRR vs GRR — リテンションが財務的に現れる場所
- Customer Success メトリクス — より広いメトリクスセット