Churn-Prediction ist die Praxis, jeden Kunden danach zu scoren, wie wahrscheinlich er kündigt oder ein Downgrade vornimmt, bevor er es tatsächlich tut, damit ein CSM eingreifen kann, solange noch Zeit bleibt, das Ergebnis zu ändern. Sie verwandelt Retention von einer reaktiven Funktion — reagieren, nachdem die Kündigungs-E-Mail eingetroffen ist — in eine proaktive Funktion — den gefährdeten Account 60 bis 90 Tage im Voraus bearbeiten.
Sie ist nicht dasselbe wie ein Health Score, und sie ist nicht dasselbe wie die Churn-Rate. Ein Health Score ist eine zusammengesetzte Momentaufnahme des Account-Zustands; die Churn-Rate ist ein rückblickender GRR/NRR-Input, der Ihnen sagt, was bereits geschehen ist. Churn-Prediction ist eine vorausschauende Wahrscheinlichkeit: „Dieser Account hat eine Wahrscheinlichkeit von 38 %, in den nächsten 90 Tagen nicht zu verlängern.” Ein Health Score kann ein Input dieser Wahrscheinlichkeit sein, aber beide sind unterschiedliche Objekte.
Die Frühindikatoren, die das Modell wirklich bewegen
Ein Churn-Modell ist nur so gut wie seine Features. Die Signale mit dem größten Gewicht, ungefähr in dieser Reihenfolge:
- Rückgang der Produktnutzung. Der mit Abstand stärkste Frühindikator. Nicht die absolute Nutzung — der Trend. Eine Login-Zahl, die im Quartalsvergleich um 40 % fällt, prognostiziert Churn weit besser als eine niedrige, aber stabile. Verfolgen Sie wöchentlich aktive Nutzer pro Account, die Tiefe der Feature-Adoption sowie provisionierte Seats vs. aktive Seats.
- Abgang des Champions. Wenn Ihr Economic Buyer oder Power User das Unternehmen verlässt, schießt das Verlängerungsrisiko nach oben. Erkennen Sie es an zurückgewiesenen E-Mails, Titeländerungen auf LinkedIn oder einem plötzlichen Einbruch der Aktivität dieses Kontakts.
- Support-Signal. Steigendes Ticketvolumen, sinkender CSAT, wiederholte Eskalationen oder — kontraintuitiv — ein Absturz auf null (der Account hat aufgehört, es zu versuchen).
- Engagement mit dem CS. Verpasste QBR, sinkende E-Mail-Öffnungsraten, langsame Antworten, Nichterscheinen bei Calls.
- Kommerzielle Signale. Verspätete Zahlungen, Downgrade-Anfragen, Procurement, das monatliche Konditionen verlangt, Kontraktion auf Positionsebene.
- Verfehltes Onboarding. Accounts, die nie den ersten Wert (TTV) erreichen, churnen mit dem Vielfachen der Rate von Accounts, die es tun. Das 90-Tage-Onboarding-Fenster ist der Prognose-Input mit dem höchsten Hebel, den Sie haben.
Ein Modell, das sich nur auf die Nutzung stützt, verpasst die Klassen Champion-Abgang und kommerziell vollständig — deshalb unterprognostizieren rein produkttelemetriegetriebene Scores im Enterprise.
Scoring-Modelle, vom günstigsten zum verteidigungsfähigsten
- Regel- / Schwellenwertmodell. Handgeschriebene Regeln: „Nutzung um mehr als 30 % gesunken UND eine verpasste QBR UND weniger als 90 Tage bis zur Verlängerung → gefährdet.” Transparent, dem CSM erklärbar, günstig zu bauen, leicht zu umgehen. Hier sollten die meisten Teams beginnen.
- Gewichtetes Scorecard. Vergeben Sie Punkte pro Signal, summieren Sie, bilden Sie Bänder in grün/gelb/rot. Das liefern die meisten Health-Score-Features in Gainsight, ChurnZero und Vitally ab Werk. Besser als nichts; die Gewichte sind meist geraten, nicht gefittet.
- Überwachtes ML (logistische Regression, Gradient Boosting). Trainieren Sie auf gelabeltem historischem Churn. Hier kommt der echte Lift her — das Modell lernt die Gewichte und Interaktionen, statt dass Sie sie raten. Erfordert einen sauberen gelabelten Datensatz: mindestens einige hundert Churn-Ereignisse mit Feature-Historie zum Zeitpunkt des Risikos, nicht zum Zeitpunkt der Kündigung (sonst leaken Sie das Label).
Bewerten Sie mit Precision/Recall und einer Confusion-Matrix, nicht mit „Accuracy”. Bei einer jährlichen Churn-Basisrate von 8 % hat ein Modell, das „niemand churnt” prognostiziert, 92 % Accuracy und ist völlig nutzlos. Worauf es Ihnen ankommt: Von den Accounts, die das Modell rot markiert hat, wie viele sind tatsächlich gechurnt (Precision), und von den Accounts, die gechurnt sind, wie viele hat das Modell rechtzeitig markiert (Recall).
Wo KI hilft — und wo sie zu viel verspricht
Wo sie wirklich hilft: ML schlägt handgetunte Scorecards, wenn Sie genug gelabelte Historie haben, weil es nicht offensichtliche Interaktionen findet (niedrige Nutzung ist in Ordnung für einen Account, der sich immer monatlich einloggt, um einen Report zu exportieren; sie ist ein Fünf-Glocken-Alarm für einen, der früher täglich war). LLM sind gut in der unstrukturierten Schicht, die Scorecards ignorieren — den Sentiment-Trend über ein Jahr Support-Tickets und E-Mails zusammenfassen oder aus Call-Transkripten markieren, dass „der Champion abwesend klingt”. Nutzen Sie das LLM, um Features anzureichern, nicht als den Klassifikator selbst.
Wo sie zu viel verspricht: Drei Fehlermodi wiederholen sich. Erstens das Cold-Start-Problem — ein Modell braucht gelabelten Churn, aus dem es lernen kann, und ein Unternehmen in der Seed-Phase mit 40 Kunden und 3 Churn-Ereignissen hat nichts zum Trainieren. Dort ein „KI-Churn-Prediction”-Feature zu kaufen, ist Theater; nutzen Sie Regeln. Zweitens Basisraten-Verwechslung, als Accuracy verkauft — Vendors zitieren „90 % Accuracy” gegen eine niedrige Churn-Basisrate, bei der das naive Modell bereits bei 92 % liegt. Fragen Sie immer nach Precision und Recall auf den roten Flags. Drittens Prognose ohne Verordnung — eine Wahrscheinlichkeit, auf die niemand reagiert, ist Dashboard-Dekoration. Das Modell muss ein Playbook speisen (automatisch einen Save-Task erstellen, ein Executive-Outreach auslösen, an den Renewal Manager eskalieren), sonst ändert es nichts.
Häufige Fallstricke
- Label-Leakage. Trainings-Features, die zum Kündigungszeitpunkt erfasst wurden (Nutzung bereits bei null, Support-Tickets bereits geschlossen) statt zum Prognosehorizont. Das Modell sieht offline brillant aus und versagt live. Guard: Erfassen Sie die Feature-Momentaufnahme 90 Tage vor dem Churn-Ereignis, niemals am Tag selbst.
- Zu spät handeln. Ein 30-Tage-Prognosefenster ist zu kurz, um eine Enterprise-Verlängerung zu retten — die Entscheidung fiel vor Monaten. Prognostizieren Sie im Enterprise bei 60-90 Tagen, wo die Save-Motion Anlauf hat.
- Ein Modell für alle Segmente. SMB-Self-Serve-Churn (Preis, niedrige Nutzung) und Enterprise-Churn (Champion-Verlust, Executive-Misalignment) haben unterschiedliche Treiber. Ein einzelnes Modell verrührt sie zu Brei. Erst segmentieren, dann modellieren.
- Scoring ohne Ownership. Ein rotes Flag ohne benannten CSM und ohne SLA zum Handeln stirbt im Dashboard. Koppeln Sie jeden roten Account mit einem Owner und einer „innerhalb von X Tagen reagieren”-Regel.
Verwandt
- Customer Health Score — das Composite, das das Modell oft speist
- Customer Churn — das Ergebnis, das Sie prognostizieren
- Berechnung der Churn-Rate — die rückblickende Kennzahl
- NRR vs GRR — wo Retention sich finanziell zeigt
- Customer-Success-Metriken — das breitere Metrik-Set