ooligo
claude-skill

Auditor de slates de diversidad con Claude

Dificultad
avanzado
Tiempo de setup
45min
Para
recruiter · sourcer · talent-acquisition · dei-leader
Reclutamiento y TA

Stack

Una Claude Skill que audita un slate de candidatos (la lista de entrevistas que el recruiter pretende enviar, o el pool completo de sourcing, o el pool de aplicaciones) contra el pool de referencia del mercado laboral relevante para el rol, expone gaps de composición y emite un registro de auditoría estructurado — sin correr inferencia estadística sobre candidatos individuales y sin recomendar qué candidatos agregar o quitar. El output es soporte de decisión para el recruiter y el lead de DEI, no un sistema de decisión automatizado.

Cuándo usarla

  • Estás cortando un slate desde un pool de sourcing para enviarlo al hiring manager y quieres saber si la composición del slate refleja el pool de referencia del mercado laboral del rol antes de enviarlo.
  • Estás cerrando trimestre y necesitas una auditoría agregada por roles para la revisión del programa de DEI.
  • Estás preparando una presentación bajo NYC Local Law 144 (bias-audit) y necesitas una pre-revisión interna de la composición del slate antes de la auditoría independiente formal.

Cuándo NO usarla

  • Identificar la pertenencia de candidatos individuales a una clase protegida. La skill procesa únicamente datos demográficos agregados y auto-reportados. Se rehúsa a inferir demografía a partir del nombre, foto, universidad o cualquier señal a nivel candidato.
  • Auto-rechazar candidatos para “rebalancear” un slate. Rechazar a un candidato para alcanzar un número de composición es discriminación inversa y dispara la misma exposición legal que el desbalance original. La skill expone el gap; el fix está aguas arriba (canales de sourcing, query de búsqueda, lenguaje del JD), no en el paso de cortar el slate.
  • Datos de composición a los que el candidato no consintió. Los datos de auto-ID tienen su propio flujo de consentimiento bajo la autorización del candidato que captura el ATS de la empresa (Ashby, Greenhouse y Lever lo exponen). La skill procesa solo los datos que el candidato aceptó compartir, en agregado.
  • Slates de un solo rol con menos de 5 candidatos. Cuanto más pequeño el slate, menos significa la señal de la auditoría. La skill advierte por debajo de 5; se rehúsa a calcular estadísticas de composición por debajo de 3.

Setup

  1. Coloca el bundle. Pon apps/web/public/artifacts/diversity-slate-auditor-skill/SKILL.md en tu directorio de skills de Claude Code.
  2. Configura la fuente del pool de referencia. La skill necesita un pool de referencia para comparar — usualmente las estadísticas ocupacionales del BLS (gratis, públicas), aumentadas con datos específicos de la industria cuando estén disponibles. El selector de pool de referencia en references/1-reference-pools.md documenta qué tabla del BLS mapea a qué familia de roles.
  3. Conecta la exportación del ATS. Tanto Ashby como Greenhouse exponen exportaciones de auto-ID vía sus APIs (Ashby /candidate.list con columnas de self-id; Greenhouse endpoint applications con campos EEOC). La skill lee la exportación; no llama al ATS directamente. Esta separación significa que la minimización de datos ocurre en el momento de la exportación y la skill nunca ve registros crudos de candidatos.
  4. Define los guardrails de tamaño de slate. Por defecto: advertencia bajo 5, rechazo bajo 3. Ajústalo por familia de rol si los tamaños típicos de slate de tu equipo difieren.
  5. Haz un dry-run sobre un slate cerrado. Audita el slate de un rol que cerraste el trimestre pasado. Compara el análisis de gaps de la skill con la lectura del mismo slate por parte de tu lead de DEI. La skill expone deltas de composición; si esos deltas importan es un juicio que la skill no hace.

Qué hace la skill realmente

Seis pasos. La skill está estructurada para mantener la inferencia a nivel agregado — nunca a nivel candidato — y para exponer gaps sin recomendar intervenciones, porque la intervención correcta varía según la fuente del gap y no es el paso de cortar el slate.

  1. Carga el slate (los candidatos que pretendes entrevistar, o el pool de sourcing, o el pool de aplicaciones — según lo que el recruiter quiera auditar). La skill espera una exportación a nivel agregado: el self-ID por candidato se lee pero solo se usa para calcular agregados; no se emite ningún análisis por candidato.
  2. Carga el pool de referencia para la familia de rol. Las estadísticas ocupacionales del BLS son el default; el mapeo de familia de rol a tabla del BLS vive en references/1-reference-pools.md. El recruiter puede sustituir pools de referencia específicos de la industria (p. ej. Stack Overflow Developer Survey para ingeniería de software).
  3. Calcula deltas de composición a nivel slate vs. pool de referencia. Para cada dimensión demográfica sobre la que el slate tiene datos de self-ID (género, raza/etnia según las categorías EEOC, estatus de veterano, estatus de discapacidad — solo las dimensiones que la empresa recolecta), calcula el porcentaje del slate y el del pool de referencia. Calcula el delta absoluto.
  4. Expone gaps por dimensión con una banda de confianza. Un delta de 5pp en un slate de 50 significa más que el mismo delta en un slate de 8. La banda de confianza refleja el tamaño del slate y la especificidad del pool de referencia.
  5. Expone candidatos de gap aguas arriba. Para cada delta expuesto, lista 3-5 causas probables aguas arriba que el recruiter puede investigar — mix de canales de sourcing, lenguaje de la query de búsqueda (el Boolean search builder pre-vuelo de fairness atrapa algunas), lenguaje del JD, lenguaje del hiring manager en el screen. NO rankea ni recomienda; lista candidatos para que el recruiter y el lead de DEI los investiguen.
  6. Emite registro de auditoría. Una línea JSONL firmada con composición del slate, pool de referencia usado, deltas calculados y la versión de la skill. Sin PII. El registro de auditoría es lo que hace defendible una presentación bajo NYC LL 144 o una revisión interna de DEI.

Realidad de costos

Por auditoría de slate, sobre Claude Sonnet 4.6:

  • Tokens del LLM — 5-10k de input (agregados del slate + tabla del pool de referencia + instrucciones de la skill) y 2-3k de output (análisis de gap por dimensión + candidatos aguas arriba). Aproximadamente $0.05-0.10 por auditoría.
  • Datos del pool de referencia — los datos del BLS son gratis. Stack Overflow Developer Survey es gratis. Los datasets específicos de industria varían; la ruta solo-BLS cuesta $0.
  • Tiempo de recruiter / lead de DEI — la ganancia. Las auditorías de composición usualmente se saltan porque son tediosas; la skill convierte la auditoría en el costo por defecto en vez de un paso extra. Espera 5-10 minutos por slate para leer la auditoría, más 20-40 minutos por trimestre para investigar los candidatos de gap aguas arriba expuestos.
  • Tiempo de setup — 45 minutos una sola vez para el mapeo del pool de referencia y la conexión de la exportación del ATS.

Métrica de éxito

Trackea tres cosas, mensualmente, no por slate:

  • Drift del delta de composición en el tiempo — ¿se cierra el gap slate-vs-pool-de-referencia en los roles trackeados? Si no, las intervenciones aguas arriba no están funcionando.
  • Shift del mix de canales de sourcing — cuando la auditoría expone un candidato de gap en canal de sourcing, ¿se mueve el mix de canales realmente al trimestre siguiente? Si sourcing sigue recomendando los mismos canales, la superficie aguas arriba de la auditoría no está llegando a sourcing.
  • Gap de auditoría NYC LL 144 / DEI interna — cuando ocurre la bias-audit anual formal, ¿coinciden sus hallazgos con lo que las auditorías slate-por-slate expusieron durante el año? Si la auditoría formal expone gaps que las auditorías de slate omitieron, el mapeo de pools de referencia o las dimensiones trackeadas están incompletos.

vs alternativas

  • vs dashboards de diversidad nativos del ATS (Greenhouse Inclusion, el reporting de diversidad de Ashby). Los dashboards nativos del ATS muestran composición; no calculan deltas contra pool de referencia ni exponen candidatos aguas arriba. Elige el nativo del ATS si solo necesitas reporting. Elige la skill si necesitas soporte de decisión por slate.
  • vs Crosschq Diversity / SeekOut DEI / la capa de diversidad de Eightfold. Esos son productos más profundos con sus propios pools de referencia y capas de análisis. Elígelos si el presupuesto soporta la jugada de plataforma y quieres un producto gestionado. Elige la skill si quieres la lógica de auditoría en tu repo, el mapeo de pool de referencia bajo tu control y el registro de auditoría portable.
  • vs estadísticas de composición calculadas a mano. Hacerlas a mano está bien para la revisión anual de DEI pero se rompe a cadencia de slate; nadie las calcula a mano por slate. La skill hace que la auditoría sea barata como para correrla en cada slate.
  • vs ninguna auditoría. El default, y la exposición legal bajo NYC LL 144 (bias-audit anual obligatoria para herramientas de IA usadas en hiring en NYC). La skill es la postura defendible más barata.

Cosas a vigilar

  • Discriminación inversa por “rebalancear”. Guard: la skill nunca recomienda agregar o quitar candidatos individuales. Ajustar un slate eliminando candidatos para alcanzar números de composición es discriminación inversa y crea la misma exposición legal que el desbalance original. La auditoría expone; el fix está aguas arriba.
  • Inferir demografía desde señales del candidato. Guard: la skill procesa solo datos de self-ID que el candidato consintió compartir. Se rehúsa a inferir raza/etnia desde el nombre, género desde pronombres, edad desde el año de graduación, o cualquier inferencia a nivel candidato. Los pools de referencia usados para comparar son estadísticas agregadas, no features a nivel candidato.
  • Ruido de slates pequeños. Guard: tamaños de slate por debajo de 5 producen un header de advertencia en la auditoría; por debajo de 3 la skill se rehúsa a calcular estadísticas de composición.
  • Pools de referencia desactualizados. Guard: el mapeo de pools de referencia en references/1-reference-pools.md lleva una fecha last_verified por fuente. Fuentes mayores a 18 meses disparan una advertencia para refrescar el mapeo.
  • Manipulación del audit trail. Guard: los registros de auditoría son JSONL append-only con la versión de la skill embebida. Modificar rompe la cadena de firmado del archivo. La retención rutinaria del registro de auditoría debe ser al menos tan larga como la retención de registros de hiring de la empresa (típicamente 2-7 años).
  • Riesgo de exfiltración de datos DEI. Guard: el registro de auditoría contiene agregados y deltas, no campos por candidato. La skill se rehúsa a escribir datos de self-ID por candidato dentro del registro de auditoría.

Stack

El bundle de la skill vive en apps/web/public/artifacts/diversity-slate-auditor-skill/ y contiene:

  • SKILL.md — la definición de la skill
  • references/1-reference-pools.md — el mapeo de familia-de-rol a pool-de-referencia (BLS, Stack Overflow Developer Survey, etc.)
  • references/2-audit-record-format.md — el formato de output literal para el registro JSONL de auditoría

Herramientas que el workflow asume que usas: Claude (el modelo), Ashby o Greenhouse (el ATS, para la exportación de self-ID). Para la auditoría paralela de canales de sourcing, ver el Boolean search builder — su pre-vuelo de fairness atrapa algunas causas de gap aguas arriba.

Conceptos relacionados: diversity recruiting, AI screening bias, structured interviewing.

Archivos de este artefacto

Descargar todo (.zip)