Ein Claude Skill, der prüft, welche Salesforce-Opportunities die Exit-Kriterien der Stage, in die sie gerade gewechselt sind, tatsächlich erfüllen. Für jede Opp, die in der Vorwoche vorangeschritten ist, überprüft der Skill die deterministischen Regeln (Pflichtfelder, protokollierte Aktivitäten, Stakeholder-Rollen) und vergleicht dann die qualitativen Behauptungen des Reps mit Gong-Call-Transkripten. Die Ausgabe ist eine Coaching-Queue für das wöchentliche RevOps-Review, kein Enforcement-Gate, das Deals automatisch zurückrollt.
Das Artefakt-Bundle wird unter apps/web/public/artifacts/stage-progression-validator-skill/ geliefert und enthält SKILL.md plus drei Referenzvorlagen: references/1-stage-criteria-template.md (das Stage-Rubrik des Teams), references/2-methodology-mapping-template.md (wie MEDDPICC, MEDDIC, SPICED, BANT oder ein benutzerdefiniertes Framework auf Ihre Salesforce-Felder und Gong-Phrasenmuster abgebildet wird) und references/3-sample-output-format.md (das genaue Markdown, das der Skill ausgibt).
Wann verwenden
Führen Sie dies im Rhythmus Ihres Forecast-Meetings aus. Das kanonische Muster ist ein Sonntagnacht-Batch, der auf week_ending verschlüsselt ist, wobei der Bericht in einem Slack-Kanal vor dem Montag-Morgen-Manager-Huddle erscheint. Einzelner-Opp-Modus ist ebenfalls gültig — ein Deal-Desk-Reviewer kann den Skill gegen eine Opportunity.Id vor einem Preisgenehmigungs-Meeting ausführen, oder ein Manager kann ihn gegen einen einzelnen Deal vor einem 1:1 ausführen, um das Gespräch auf die spezifischen Lücken zu erden, anstatt auf ein vages „das fühlt sich feststeckend an”.
Die qualitative Behauptungsprüfung ist der Teil, der sich bezahlt macht. Salesforce erzwingt bereits Pflichtfeld-Validierungsregeln; was es nicht kann, ist zu bemerken, dass der Rep behauptet hat „Buyer hat Erfolgskriterien zugestimmt” und dann kein Gong-Call in den letzten 45 Tagen dieses Gespräch tatsächlich erfasst hat. Der Skill ist methodology-bewusst in seiner Suche — für MEDDPICC’s Economic Buyer sucht er nach dem Namen des Buyers innerhalb von zwölf Token von Entscheidungssprache („genehmigen”, „abzeichnen”, „Budget-Inhaber”) anstatt nur eine beliebige Erwähnung des Namens. Diese Unterscheidung ist es, die einen nützlichen Flag von einem False Positive trennt, das Reps lernen zu ignorieren.
Wann NICHT verwenden
- Auto-Rollback. Verdrahten Sie die Ausgabe des Skills nicht in ein Salesforce-Update, das Deals bei einem
fail-Urteil herabstuft. Das Urteil ist eine Eingabe unter mehreren; der Manager besitzt die Herabstufungsentscheidung mit vollständigem Kontext, den der Skill nicht sehen kann (Off-Gong-Meetings, Side-Channel-Verpflichtungen, kundenseitige Beschaffungs-Quirks). - Performance-Management. Ein einzelnes
failbei einem einzelnen Deal ist Rauschen. Das Signal sind Muster über Wochen — der Rep, dessenfail-Rate von 5% auf 30% über ein Quartal steigt, während Kollegen stabil bleiben. Die Verwendung eines One-Shot-Urteils in einem PIP bricht das Vertrauen der Reps, und der Skill hört auf zu funktionieren. - Comp-Inputs. Stage bestimmt den Forecast, manchmal die Beschleuniger. Wenn Validator-Ausgabe in Comp-Berechnungen fließt, haben Sie einen direkten Anreiz für Reps geschaffen, die Inputs zu manipulieren — Gong-Aufnahme verweigern, Notizen weglassen, Daten in Desktop-Tabellen speichern. Halten Sie die Validator-Ausgabe im Coaching-Kanal und außerhalb der Comp-Pipeline.
- Stages ohne ein dokumentiertes Rubrik. Wenn
references/1-stage-criteria-template.mdkeinen Eintrag für die zu validierende Stage hat, gibt der Skillneeds_methodologyaus, anstatt zu raten. „Tunen” Sie den Skill nicht, um diese Stages mit einem Standard zu bewerten — korrigieren Sie stattdessen das Rubrik. - Teams, die nichts Strukturiertes speichern. Ein Team, das MEDDPICC in Folien und nicht in Salesforce betreibt, wird jede qualitative Prüfung nicht bestehen. Führen Sie den Skill zwei Wochen im Trockendurchlauf-Modus aus; wenn mehr als 40% der Opps in
needs_methodologyoder bei allen qualitativen Prüfungen unter 0,2 landen, ist das Methodology-Mapping-Dokument fiktiv. Korrigieren Sie das Dokument oder instrumentieren Sie die fehlenden Felder, bevor Sie live gehen.
Einrichtung
- Stages dokumentieren. Öffnen Sie
references/1-stage-criteria-template.mdund ersetzen Sie den Vorlageninhalt durch das echte Rubrik Ihres Teams, Stage für Stage. Jede Stage hat drei Regel-Buckets:field_rules(ein Salesforce-Feld muss einen Nicht-Standard-Wert haben),activity_rules(eine protokollierte Aktivität eines bestimmten Typs muss innerhalb eines Aktualitätsfensters existieren) undstakeholder_rules(OpportunityContactRolemuss einen Contact mit einer Rolle enthalten, die einem Regex entspricht). Markieren Sie Felder alsevidence_required: gong, wenn Sie eine Gong-Transkript-Kreuzprüfung der qualitativen Behauptung möchten. - Methodology abbilden. Bearbeiten Sie
references/2-methodology-mapping-template.md, um das Framework Ihres Teams anzupassen. Die Datei wird mit ausgearbeiteten Beispielen für MEDDPICC, MEDDIC und SPICED geliefert — kopieren Sie das passende und passen Sie die Salesforce-Feldnamen an die tatsächlichen API-Namen Ihrer Org an. Die Phrasenmuster-Spalte ist es, die dem Skill sagt, was als Gong-Beweis gilt; lassen Sie sie nicht als Vorlage, es sei denn, Ihre Felder entsprechen wirklich den Beispiel-Mappings. - Skill installieren. Legen Sie das Bundle in
~/.claude/skills/stage-progression-validator/ab. Setzen SieSFDC_TOKEN(schreibgeschützt aufOpportunity,OpportunityFieldHistory,Task,Event,OpportunityContactRole) undGONG_API_KEY(mitcalls/extensive- unddeals-Scopes). Schreibgeschützt ist der richtige Scope; der Skill darf nicht in Salesforce zurückschreiben. - Wöchentlichen Lauf planen. Ein einfacher Cron ist gut —
claude run stage-progression-validator week_ending=$(date -d 'sunday' +%F)sonntags um 22:00 Uhr. Leiten Sie die Ausgabe in Ihren Slack-Kanal oder eine wöchentliche Digest-E-Mail. - Mit einem Coaching-Ritual koppeln. Die Urteil-Queue ist nutzlos, wenn niemand sie öffnet. Fester 30-Minuten-Slot montags, Manager geht die
fail- undneeds_manager_review-Zeilen mit jedem Rep durch. Nach acht Wochen sollte das Volumen in diesen Buckets sinken — das ist die Erfolgsmetrik.
Was der Skill tatsächlich tut
Für jede Progression im Fenster berechnet der Skill zwei Scores. Der deterministische Score ist der Anteil der erfüllten Methodology-Regeln — fünf Regeln, drei bestehen, der Score ist 0,6. Dies ist strukturiertes-Rubrik statt Freitext-Natursprache by design: Freitext-Kriterien zwingen das Modell, Randfälle inkonsistent über Läufe und Reps hinweg zu interpretieren, und Reps können nicht vorhersagen, was ein fail auslöst, was das Vertrauen zerstört, von dem das Tool abhängt.
Der qualitative Score ist der Anteil der evidence_required: gong-Behauptungen, die unterstützende Transkriptbelege innerhalb des relevanten Fensters finden. Das Phrasen-Matching ist methodology-bewusst. Für MEDDPICC’s Economic Buyer sucht der Skill nach dem Namen des Buyers innerhalb von zwölf Token von Entscheidungssprache. Für SPICED’s Critical Event sucht er nach datumsbegrenzter Dringlichkeitssprache mit Konsequenzverben (“verpassen”, “rutschen”, “riskieren”) in der Nähe. Eine naive „jede Erwähnung des Namens des Buyers zählt”-Prüfung produziert zu viele False Passes — der Rep, der den Buyer beiläufig in einem Anruf mit einem anderen Stakeholder erwähnt, ist kein Beweis für das Buyer-Commitment.
Die zwei Scores kombinieren sich zu einem von fünf Urteilen: pass (beide bei 1,0), flag (ein Bucket stark, der andere schwach), fail (beide unter dem Grenzschwellenwert, Standard 0,6), needs_manager_review (das Grenzband zwischen flag und fail — weder ein Score klar schlecht noch klar gut) oder needs_methodology (das Rubrik hat keinen Eintrag für diese Stage). Der needs_manager_review-Bucket existiert, weil das Erzwingen jedes Grenzdeals in ein binäres flag versus fail Rauschen produziert, das Reps lernen zu ignorieren; die Grenzzeilen gehen in eine separate Queue, die der Manager von Hand auflöst, was das Signal in den anderen Buckets bewahrt.
Kostenrealität
Claude Sonnet 4 bei aktuellen Preisen läuft bei ca. 15-25 Cent pro validierter Opportunity, dominiert durch das Lesen von Gong-Transkripten (typisches 30-Tage-Fenster deckt 4-8 Calls pro aktivem Deal bei 5-15k Token jeweils, plus ein paar hundert Token Methodology-Rubrik aus Referenzen geladen). Ein 50-Deal-wöchentlicher Batch kostet ca. 7-12 USD an API-Ausgaben.
Die eingesparte Zeit ist das Argument für den Skill. Ein RevOps-Lead, der dieses Audit manuell durchführt, verbringt 20-30 Minuten pro Deal — Stage-Geschichte abrufen, jeden Gong-Call öffnen, nach dem Namen des Buyers und dem Erfolgskriterien-Gespräch suchen. Bei 50 Deals sind das zwei volle Tage manuelles Audit pro Woche, weshalb fast kein Team es tatsächlich macht. Der Skill reduziert das auf einen 4-6-Minuten-Bericht-Review-Durchgang des Digests, mit tieferer Inspektion nur bei den Zeilen in den fail- und needs_manager_review-Buckets — typischerweise 5-10 Deals von 50, also 30-60 Minuten fokussierter Review. Netto: 12-15 RevOps-Stunden pro Woche zurück, für unter 15 USD API-Kosten.
Erfolgsmetrik
Verfolgen Sie zwei Metriken über acht Wochen Ramp. Erste, die fail-Rate — der Anteil der wöchentlichen Progressionen, die in fail landen. Ein gesunder Ramp zeigt, dass sie von einem Basiswert (oft 25-40% im ersten Lauf) auf unter 10% sinkt, da Reps verinnerlichen, was das Rubrik vor dem Voranschreiben eines Deals erfordert. Wenn sie nicht sinkt, ist entweder das Rubrik zu streng (Reps können es physisch nicht erfüllen ohne Buyer-Gespräche, für die der Deal nicht bereit ist) oder der Coaching-Loop findet nicht statt. Zweite, das mediane Stage-Alter in der Stage unmittelbar vor dem strengsten Gate. Wenn das altert — d.h. Reps parken Deals eine Stage unter ihrer Realität, um dem Gate auszuweichen — ist das Rubrik falsch, nicht die Reps. Passen Sie das Rubrik an, bevor Sie den Skill weiterlaufen lassen.
vs. Alternativen
- Salesforce-Validierungsregeln — diese erzwingen die Feldpräsenz auf Datensatzebene (Sie können eine Opp in Stage 4 nicht speichern, ohne
Economic_Buyer__czu befüllen). Sie können die qualitative Prüfung nicht durchführen: Ein Rep kann irgendeinen Namen in das Feld tippen, Validierungsregeln bestehen, der Skill erfasst, dass kein Gong-Call die Behauptung unterstützt. Validierungsregeln sind auch ein stumpfes Instrument, weil sie das Speichern direkt ablehnen; der Skill produziert ein abgestuftes Urteil, mit dem der Manager arbeitet. - Clari, Gong Forecast und ähnliche KI-Forecasting-Tools — diese führen Stage-Validierung als Teil einer viel größeren Produktoberfläche durch (Forecast, Deal Review, Konversationsanalyse, Coaching). Erwarten Sie 50-150 USD pro Rep pro Monat gegenüber den ca. 10-15 USD pro Woche an API-Kosten dieses Skills. Wählen Sie die Plattform, wenn Sie auch ihre Forecasting- und Konversationsanalyse-Ebenen benötigen; wählen Sie diesen Skill, wenn Ihre Lücke speziell das Stage-Progression-Audit ist und Sie bereits Salesforce und Gong haben.
- Manuelle Deal-Desk-Reviews — ein menschlicher RevOps-Lead, der jede Progression liest. Das richtige Tool für High-ACV-Enterprise-Teams, bei denen Deals wenige und folgenreich sind. Falsches Tool für SMB oder Volume-Midmarket, wo die Audit-Kosten (12-15 Stunden pro Woche) bedeuten, dass es überhaupt nicht passiert und schlechte Progressionen in den Forecast gelangen.
- Nichts tun — die tatsächliche Baseline in den meisten Teams. Forecast-Genauigkeit bei den meisten B2B-SaaS-Orgs liegt irgendwo zwischen mittelmäßig und beschämend, genau weil die Stages, auf denen der Forecast aufgebaut wird, nicht validiert sind. Die Kosten des Nichtstuns zeigen sich in der CFO-Reaktion auf einen schlechten Quartalsabdruck, was ein schlechterer Moment ist, um herauszufinden, dass die Eingangsdaten nicht vertrauenswürdig waren.
Fallstricke
- Zu strenge Validierung treibt Reps dazu, Stages zu manipulieren. Guard: Instrumentieren Sie das mediane Stage-Alter in der Stage unmittelbar vor dem strengsten Gate. Wenn es nach dem Versand des Skills zunimmt, ist das Rubrik falsch; passen Sie es an, bevor Sie fortfahren.
- Methodology-Mismatch zwischen Folien und Salesforce. Guard: Zwei Wochen Trockendurchlauf. Wenn
needs_methodologyplus niedrige qualitative Scores mehr als 40% der Opps abdecken, korrigieren Sie das Methodology-Mapping oder die zugrunde liegende Feldinstrumentierung, bevor Sie ein Urteil als handlungsfähig behandeln. - Validator-Drift von echten Exit-Kriterien. Sales-Leader definieren Stage-Bedeutungen in QBRs still um; die Rubrikdatei wird nicht aktualisiert. Guard: Das Rubrik trägt ein
last_reviewed-Feld; der Skill stellt jedem Bericht eine Warnung voran, wenn das Datum älter als 90 Tage ist. - Gong-Aufnahme-Coverage-Lücken sehen wie Rep-Unehrlichkeit aus. Guard: Die Methodology-Mapping-Datei deklariert einen
recording_coverage_floorpro Stage. Deals unter dem Boden landen inneeds_manager_reviewmit der Coverage-Lücke explizit angezeigt, nicht infail. - Rep-Gegenwehr bei einem
fail-Urteil. Guard: Der Bericht enthält die deterministischen Regel-Misses wörtlich und die ungematchten Phrasenmuster. Das Gespräch gründet sich auf der spezifischen Lücke, die der Rep durch Aktualisierung des Felds und erneuten Lauf beheben kann, oder mit Off-Gong-Beweisen zurückdrängen kann, die der Manager akzeptiert.
Stack
- Salesforce — Stage-Geschichte, Deal-Felder, Contact-Rollen, protokollierte Aktivitäten
- Gong — aufgezeichnete Gesprächstranskripte, dealspezifische Call-Listen
- Claude (Sonnet 4) — methodology-bewusstes Phrasen-Matching gegen Transkripte, Urteilssynthese
- Cron / Scheduler der Wahl — der wöchentliche Auslöser
- Slack oder E-Mail — der Digest-Kanal, in dem der Bericht vor dem Manager-Huddle landet