Un Claude Skill qui prend une liste de comptes cibles ABM et une rubrique ICP et retourne un rapport de défauts par compte — chaque compte qui ne satisfait pas les critères reçoit un code de défaut issu d’une taxonomie définie (wrong-size, wrong-industry, wrong-geo, stale-data, low-intent, missing-field), un niveau de qualité (Q1 à Q4), un score de qualité de liste et une file de remédiation priorisée. Le bundle est disponible à apps/web/public/artifacts/abm-list-quality-audit-skill/ et contient SKILL.md ainsi que trois templates de référence que l’utilisateur adapte avant la première utilisation.
Il répond à la question que la plupart des campagnes ABM ignorent avant le lancement : « Des 300 comptes dans cette liste, combien correspondent réellement à notre ICP, et qu’est-ce qui ne va pas exactement chez ceux qui n’y correspondent pas ? » Sans cette réponse, le budget des plateformes ABM — 6sense, Demandbase, LinkedIn Matched Audiences — est dépensé sur des comptes que vous ne convertirez jamais, et les résultats décevants de la campagne sont attribués au message ou au canal plutôt qu’à la qualité de la liste.
Quand utiliser
Utilisez ce skill avant de charger une liste ABM dans une plateforme de médias payants, avant d’attribuer des comptes nommés à des AEs, et avant tout lancement de campagne dont la liste a été constituée il y a plus de 90 jours. Les listes ABM se dégradent plus vite que la plupart des équipes RevOps ne le réalisent : les données de headcount vieillissent, les étapes de financement changent, les entreprises sont rachetées, et la rubrique ICP elle-même évolue parfois sans que la liste soit réévaluée.
Le skill est également l’outil adapté pour l’hygiène trimestrielle des listes. Faites-le tourner sur l’ensemble de votre univers ABM — pas seulement les listes de campagne — pour trouver les comptes qui ont été ajoutés quand votre ICP était différent et qui n’ont pas été réévalués depuis. La table de fréquence des défauts vous indique quelles lacunes d’enrichissement sont les plus courantes dans votre univers, ce qui est actionnable pour le responsable du workflow d’enrichissement Clay.
Invoquez-le depuis :
- Une table Clay où chaque ligne est un compte, déclenchée manuellement avant un lancement de campagne ou selon un cron trimestriel. Le skill écrit
quality_tieretdefect_codesdans deux colonnes Clay ; l’automatisation en aval peut filtrer sur ces colonnes pour supprimer les comptes Q3/Q4 des exports de campagne. - Une vérification pré-vol CSV avant import dans 6sense ou toute plateforme publicitaire ABM. Le passage de l’audit supprime les comptes pour lesquels vous auriez sinon payé — aux CPM ABM typiques ($20-40 par millier d’impressions), retirer 50 comptes hors-ICP d’une liste de 500 réduit le gaspillage de 10%.
- Un trigger basé sur un rapport Salesforce sur des comptes nommés dans un segment, écrivant
ABM_Quality_Tier__cetABM_Defect_Codes__csur l’enregistrement de compte.
Quand NE PAS utiliser
Ignorez ce skill lorsque :
- Vous souhaitez noter des MQL inbound. L’audit est conçu pour les listes de comptes nommés outbound. Pour la triage de leads inbound, le skill lead-scoring-icp-rubric est l’outil adapté — il gère le flux lead unique et la logique d’escalade borderline qui compte pour l’inbound.
- Votre rubrique ICP n’existe pas encore. Le skill audite par rapport à une rubrique que vous fournissez. Si vous n’avez pas eu la discussion sur l’ICP — dans quels secteurs, tranches de headcount et zones géographiques vous gagnez vraiment — cette conversation doit avoir lieu en premier. Faire tourner un audit contre une rubrique de placeholder produit une fausse impression de rigueur.
- La liste nécessite une dédoublonnage, pas un audit. Si l’objectif est de supprimer les clients actuels, les concurrents, les comptes churned ou les contacts avec suppression GDPR, c’est une opération de filtrage, pas un audit ICP. Effectuez ces exclusions avant l’audit, sinon le skill dépensera des tokens à noter des entreprises dont vous savez déjà que vous voulez les exclure.
- Vous avez besoin de générer la liste, pas de l’auditer. Le skill prend une liste existante en entrée. Il n’effectue pas de découverte TAM et ne génère pas de nouveaux comptes. Utilisez un workflow dédié de construction de listes — Clay plus critères ICP — pour produire la liste brute en premier.
- La liste contient moins de 20 comptes. En dessous de cette taille, un RevOps ou AE expérimenté peut passer en revue chaque compte manuellement en moins d’une heure. Le coût de configuration du skill (configuration de la rubrique, personnalisation de la taxonomie de défauts) ne vaut pas la peine.
Configuration
La configuration prend 30-60 minutes en supposant que la rubrique ICP existe. La discussion sur la rubrique — aligner RevOps, le leadership GTM et un ou deux AEs sur ce que signifie réellement un secteur et une tranche de headcount de niveau A — prend plus longtemps et se déroule avant la configuration.
- Installer le Skill. Copiez
apps/web/public/artifacts/abm-list-quality-audit-skill/SKILL.mdet le dossierreferences/dans votre répertoire.claude/skills/abm-audit/, ou uploadez-le comme Skill dans claude.ai. Les champsnameetdescriptiondu frontmatter sont le déclencheur sur les prompts pertinents. - Configurer la rubrique ICP. Ouvrez
references/1-icp-rubric-template.md. Si votre équipe utilise déjà le skill lead-scoring-icp-rubric, vous pouvez référencer le même fichier de rubrique — la structure est identique. Remplacez les lignes de placeholder par des critères réels, des pondérations (1-5) et des valeurs de tier (A / B / C). Renseignez la section des disqualifiants définitifs. Mettez à jour « Last edited » — le SHA-256 que le skill enregistre dans chaque pied de rapport garantit que les parties prenantes peuvent voir quand la rubrique a évolué. - Configurer la taxonomie de défauts. Ouvrez
references/2-defect-taxonomy.md. Les codes de défaut eux-mêmes sont fixes — ne les renommez pas, car les parsers en aval utilisent les chaînes de code. Éditez la colonne « Remediation action » pour qu’elle corresponde au processus réel de votre équipe : quelle colonne Clay fournit le ré-enrichissement du headcount, qui possède l’abonnement ZoomInfo, quel segment prend en charge les comptes enterprise en débordement. - Préparer les scores d’intention (facultatif mais à forte valeur). Si vous utilisez 6sense ou Bombora, exportez une carte
domaine → score d'intentionpour votre univers de comptes et passez-la en entréeintent_scores. Cela ajoute des annotationslow-intentetintent-spikepar-dessus les scores de rubrique — le flagintent-spikeest particulièrement précieux pour les comptes Q2 qui sont dans l’ICP mais borderline, car il les fait remonter pour priorisation même avant le ré-enrichissement. - Définir le seuil d’obsolescence de l’enrichissement. Mettez à jour
enrichment_staleness_daysselon l’agressivité avec laquelle votre couche d’enrichissement recycle les données. Clay + ZoomInfo se rafraîchit typiquement sur un cycle de 90 jours ; si vous exécutez un enrichissement mensuel, vous pouvez définir 45 jours. Cela pilote le code de défautstale-data. - Tester sur une liste connue. Faites tourner le skill sur 20-30 comptes que vous connaissez bien — un mélange de clients actuels, de comptes churned et de prospects de qualité variable. Vérifiez que les niveaux de qualité correspondent à l’intuition de votre équipe. Si des comptes Q1 affichent des codes de défaut, la rubrique est mal calibrée. Si des comptes manifestement hors ICP obtiennent Q2, les disqualifiants définitifs ou les pondérations doivent être ajustés.
Ce que fait réellement le skill
Le skill exécute quatre étapes dans un ordre fixe.
Étape 1 — balayage des disqualifiants définitifs. Avant tout appel LLM, chaque compte est vérifié par rapport aux disqualifiants définitifs de la rubrique : pays sanctionné, secteur disqualifié, headcount en dessous du minimum absolu, comptes sur la liste d’exclusion explicite (concurrents, clients actuels). Les correspondances reçoivent le code de défaut hd:{raison} et le niveau de qualité disqualified. Cette étape est déterministe et s’exécute sur chaque compte en millisecondes. Pourquoi en premier : sur une liste de 500 comptes, il est courant que 5 à 15% soient des disqualifications immédiates — exécuter le scoring LLM sur ces comptes gaspille des tokens et ajoute de la latence sans apporter d’information.
Étape 2 — scoring de la rubrique ICP par compte. Les comptes qui ont passé le balayage des disqualifiants définitifs sont notés sur chaque critère de la rubrique. Pour chaque critère, le modèle émet un tier (A / B / C), une pondération (issue de la rubrique) et une justification d’une phrase citant la ligne de la rubrique. La somme pondérée correspond à un niveau de qualité : Q1 (score ≥ 8,0), Q2 (6,0-7,99), Q3 (4,0-5,99), Q4 (< 4,0). Les critères défaillants génèrent les codes de défaut correspondants — un score de critère C sur le headcount d’un compte en dessous du seuil du tier B génère wrong-size:too-small.
Pourquoi par critère plutôt qu’un score global : les codes de défaut qui alimentent la file de remédiation nécessitent de savoir quel critère spécifique a échoué, pas seulement que le score global était bas. Un compte Q3 avec missing-field:tech_stack est une tâche de remédiation différente d’un compte Q3 avec wrong-industry — le premier a besoin d’enrichissement, le second doit être supprimé.
Étape 3 — détection de défauts supplémentaires. Après le scoring de la rubrique, le skill vérifie les défauts non couverts par la rubrique : stale-data (enrichissement plus ancien que le seuil), missing-field:{champ} (critères qui n’ont pu être notés), low-intent et intent-spike issus des scores d’intention fournis. Le flag intent-spike peut apparaître même sur des comptes Q2 — il fait remonter des comptes où le comportement in-market devrait primer sur le score de rubrique borderline et déclencher un contact direct de l’AE quand même.
Étape 4 — agrégation au niveau de la liste. Après le scoring par compte, le skill calcule le score de qualité de liste (Q1% + Q2% - Q3% - 2×Q4%, mis à l’échelle sur 100), la table de fréquence des défauts et la file de remédiation. La file de remédiation est triée par gain estimé lors du re-audit : les comptes les plus susceptibles de devenir Q1 après ré-enrichissement apparaissent en premier. Un score de qualité de liste inférieur à 30 est le signal go/no-go du skill — la section de recommandation dira « Ne pas lancer avant que les comptes Q3/Q4 soient remédiés ou supprimés. »
Réalité des coûts
Le coût en tokens par compte dépend de la taille de la rubrique et de la quantité de données de compte fournies. Pour une rubrique typique à 6 critères avec output structuré par critère et un enregistrement de compte de 300-500 tokens de données, attendez environ 1 200-2 000 tokens d’entrée et 300-500 tokens de sortie par compte. Aux tarifs de Claude Sonnet 4.x (environ $3 par million de tokens d’entrée et $15 par million de tokens de sortie début 2026), cela représente $0,008-0,015 par compte.
Un audit pré-campagne de 500 comptes coûte $4-8 en tokens Claude. Un passage trimestriel d’hygiène sur un univers ABM de 2 000 comptes coûte $16-30. Ces montants sont inférieurs au coût d’une seule séquence AE mal routée. Le coût hors tokens est plus important : configurer correctement la rubrique et la taxonomie de défauts prend une session de 60-90 minutes ; planifiez-la.
Le coût en tokens par compte est inférieur à celui du skill de scoring de leads car les comptes ABM disposent typiquement de données structurées plus riches (moins de champs manquants) et les codes de défaut sont plus compacts qu’une justification complète par critère. Si vos comptes ont beaucoup de champs manquants, plus de traitement tombe sur l’étape de défaut supplémentaire, qui est déterministe et gratuite.
La mise en cache des prompts des fichiers de rubrique et de taxonomie de défauts est intéressante à l’échelle — sur un audit de 500 comptes, la rubrique est chargée une fois et mise en cache sur l’ensemble du lot. Sur une vérification ponctuelle de 5 comptes, cela ne fait pas de différence.
Métrique de succès
La métrique principale pour l’audit est la tendance du score de qualité de liste : exécutez l’audit sur le même univers ABM chaque trimestre et suivez si le score de qualité de liste augmente. Un score en hausse signifie que votre cadence d’enrichissement fonctionne, votre rubrique est stable et votre processus de construction de liste s’est resserré. Un score en baisse — ou un score qui reste stable malgré les efforts de remédiation — signifie que la rubrique a évolué ou que la source d’enrichissement n’est pas fiable.
Métrique secondaire : taux de conversion de campagne ABM par niveau de qualité. Après 90 jours de campagnes contre des listes auditées, comparez le taux de conversion en opportunité pour les comptes Q1 vs Q2 vs les comptes remédiés depuis Q3 avant d’être inclus. Q1 devrait convertir à un taux plus élevé que Q2, et Q2 après remédiation devrait convertir à un taux plus élevé que Q3 non audité. Si aucune différence de conversion n’apparaît entre les niveaux, la rubrique n’est pas prédictive et doit être rediscutée.
Modes d’échec
- Codes de défaut qui incriminent la rubrique, pas la liste. Si 35% de votre liste reçoit
wrong-size:too-small, le problème est souvent le plancher de headcount dans la rubrique, pas la liste. La rubrique a peut-être été définie quand votre motion était purement enterprise et n’a jamais été mise à jour depuis l’ouverture d’un segment SMB. Agir sur ces codes de défaut en supprimant 35% de la liste est le mauvais réflexe ; réviser la rubrique est la bonne réponse. Guard : après chaque audit, vérifiez si un seul code de défaut s’applique à plus de 25% des comptes. Si c’est le cas, examinez le critère de rubrique qui génère ce code avant de remédier la liste. La table de fréquence des défauts dans le résultat de l’audit rend cette vérification facile — le code le plus courant est toujours la première ligne du tableau. - Enrichissement obsolète produisant des faux négatifs sur de bons comptes. Un compte avec un
last_enrichment_datedatant de 14 mois peut avoir triplé son headcount, levé une Série B et ajouté Salesforce à son tech stack depuis la collecte de ces données. Le verdict Q4 du skill sur ce compte n’est pas un verdict sur l’entreprise — c’est un verdict sur votre cadence d’enrichissement. Supprimer ou déprioriser ces comptes avant de les ré-enrichir fait perdre de vraie pipeline. Guard : le skill ajoutestale-dataà tout compte dont l’enrichissement dépasse le seuil d’obsolescence et note « scored on potentially stale data » dans la justification. La file de remédiation place les comptesstale-dataavec fort potentiel de score de rubrique en tête. La règle immuable : ne jamais supprimer un compte de la liste uniquement à cause destale-data; toujours ré-enrichir d’abord. - Inflation du score d’intention par le comportement d’un seul utilisateur. Une entreprise dans un segment « haute intention » de 6sense peut s’y trouver parce qu’un analyste junior de l’entreprise a lu trois articles de blog. Signaler cette entreprise comme
intent-spikeet la router vers un contact direct AE sur la base de ce signal est un faux positif qui consume du temps AE. Guard : quand desintent_scoressont fournis, le skill affiche le score d’intention brut et la source à côté du flagintent-spike. La recommandation dans le résultat du skill : avant d’agir sur un signalintent-spike, vérifiez avec 6sense ou votre plateforme ABM que l’activité d’intention provient de personas du comité d’achat — niveau directeur et au-dessus dans les domaines fonctionnels pertinents — et non d’un unique utilisateur à faible autorité. - Dérive de la rubrique invalidant les comparaisons historiques d’audit. Si la rubrique change entre l’audit Q2 et l’audit Q3, les scores de qualité de liste ne sont pas comparables — un score en hausse peut simplement refléter une rubrique plus souple, pas une amélioration réelle de la liste. Guard : le skill enregistre le SHA-256 de la rubrique dans chaque pied d’audit. Pour comparer les scores de qualité de liste d’un trimestre à l’autre, confirmez que le SHA-256 de la rubrique est identique. Si la rubrique a changé, ré-exécutez la liste du trimestre précédent contre la nouvelle rubrique avant de faire des comparaisons. La date « Last edited » dans le fichier de rubrique et le rappel trimestriel dans le calendrier pour réviser la rubrique agissent conjointement pour rendre la dérive visible avant qu’elle ne fausse la tendance.
vs alternatives
vs révision RevOps manuelle. Pour une liste de moins de 50 comptes, un analyste RevOps expérimenté avec la rubrique ICP ouverte peut revoir chaque compte manuellement en 2-3 heures et produire un résultat mieux calibré que le skill — les humains repèrent les cas limites, comme « cette entreprise a un code SIC étrange mais son produit réel est clairement dans notre ICP », que le skill ratera. Au-delà de 150 comptes, la révision manuelle devient inconsistante : l’intuition ICP de l’analyste dérive entre le premier et le 130ème compte. Le skill applique la rubrique de manière cohérente quelle que soit la taille de la liste.
vs le grading de comptes intégré de 6sense. 6sense fournit un score de fit de compte basé sur son modèle ICP propriétaire, entraîné sur des entreprises de votre CRM avec un historique d’engagement positif. Il est utile une fois que vous avez suffisamment d’historique CRM pour que 6sense puisse apprendre (typiquement 50-100 comptes gagnés). Pour les équipes en dessous de ce seuil, le modèle de fit de 6sense est sous-entraîné et bruité. Ce skill fonctionne dès le premier jour car la rubrique est rédigée manuellement. La contrepartie : le modèle de 6sense capte des patterns que vous n’avez pas explicitement consignés ; ce skill ne sait que ce que vous lui avez dit. Pour les équipes avec 50+ comptes gagnés, utilisez les deux — la note de 6sense pour « ce qui me surprend » et les codes de défaut de ce skill pour « ce qui ne va pas précisément chez les comptes Q3 ».
vs une matrice de scoring ICP dans un tableur. De nombreuses équipes RevOps ont un tableur où elles évaluent chaque compte manuellement par rapport aux critères ICP. L’approche tableur s’effondre à l’échelle (la cohérence chute au-delà de 50 comptes), ne produit pas de taxonomie de défauts (elle donne le score, pas pourquoi il est mauvais), et devient obsolète dès que la rubrique change car personne ne met à jour toutes les lignes précédemment notées. Ce skill applique la rubrique de manière cohérente, nomme le défaut spécifique, et le mécanisme SHA-256 garantit que vous savez quand la rubrique a évolué. Le tableur est l’outil adapté pour les 20 premiers comptes ; le skill est l’outil adapté ensuite.