ooligo
claude-skill

Construtor de loop de entrevista estruturado com Claude

Dificuldade
intermediário
Tempo de setup
30min
Para
recruiter · hiring-manager · talent-acquisition
Recrutamento e TA

Stack

Uma Claude Skill que recebe uma descrição de vaga, o nível da vaga, as competências must-have e o pool de entrevistadores elegíveis com os pontos fortes calibrados de cada entrevistador, e produz um design de loop completo — progressão de estágio, rubric por estágio com descrições de âncoras, perguntas comportamentais por dimensão e uma tabela de atribuição de entrevistadores com o raciocínio para cada escolha. Em seguida, para em um gate de revisão do gestor de contratação antes que qualquer coisa seja configurada no ATS. Substitui “vamos descobrir o loop quando um candidato estiver em triagem” por uma sessão de design de 30 minutos que produz disciplina operacional.

Quando usar

  • Você tem um JD aprovado, um nível confirmado e uma lista de competências must-have que diferenciam hire de no-hire nesta vaga.
  • Você tem uma biblioteca de rubrics de structured interviewing com descrições de âncoras por nível de pontuação por faixa de nível. O template de competência em apps/web/public/artifacts/interview-loop-builder-skill/references/1-competency-library.md mostra o formato; se você não conseguir preenchê-lo, ainda não tem um rubric do qual esta skill pode extrair.
  • Você tem um pool de entrevistadores com pontos fortes calibrados registrados por competência por faixa de nível — veja references/2-interviewer-strengths.md no bundle para a matriz.
  • Um gestor de contratação revisará o loop antes de ser configurado no Ashby ou Greenhouse. A skill escreve arquivos e para; ela não publica para o ATS.

Quando NÃO usar

  • Agendamento automático. Esta skill projeta o loop. Ela não agenda entrevistas, não combina calendários nem envia links de booking para candidatos. Isso é Goodtime, Ashby Scheduling ou Greenhouse Scheduling. Acoplar design e agendamento em uma skill acopla dois modos de falha que deveriam falhar independentemente.
  • Substituir o design do rubric com o gestor de contratação. A skill emite descrições de âncoras por nível de pontuação extraindo da biblioteca de competências, mas a biblioteca em si — como é um 5 para systems-design no nível IC5 — é de propriedade do gestor de contratação e do head da função. Se a biblioteca estiver vazia ou toda template, a skill recusa e surfacea um TODO em vez de inventar âncoras de rubric para uma função sobre a qual não tem sinal calibrado.
  • Loops templated genéricos sem calibração específica da vaga. Se os inputs não nomeiam o nível, as competências must-have ou o pool de entrevistadores elegíveis, a skill recusa. Um loop de quatro estágios com rótulos genéricos “comportamental”, “técnico”, “system design”, “liderança” parece estruturado mas não é. Cada candidato recebe as mesmas perguntas independentemente das prioridades da vaga, o que derrota o propósito da estrutura.
  • Vagas abaixo de um limiar de complexidade definido. Uma vaga de prestador de duas semanas não precisa de um loop de quatro estágios. A skill avisa e sugere uma triagem de um estágio se a vaga for contratual, horista ou com expectativa de menos de 6 meses.
  • Substituir o treinamento em behavioral interviewing. As perguntas emitidas pela skill seguem o formato situação/comportamento/resultado, mas os entrevistadores ainda precisam de calibração treinada para pontuar consistentemente. A skill é o andaime; o treinamento é o pré-requisito.

Configuração

  1. Coloque o bundle. Coloque apps/web/public/artifacts/interview-loop-builder-skill/SKILL.md no seu diretório de skills do Claude Code (ou Skills personalizadas do claude.ai). A skill expõe uma função callable: design_loop.
  2. Preencha a biblioteca de competências. Copie references/1-competency-library.md para o repo da sua equipe. Substitua cada placeholder pelas suas competências reais, definições, faixas de nível cobertas e descrições de âncoras por nível de pontuação. A skill recusa executar se a biblioteca for apenas template.
  3. Preencha a matriz de pontos fortes dos entrevistadores. Copie references/2-interviewer-strengths.md. Liste cada entrevistador elegível, sua equipe e as faixas de nível para as quais estão calibrados para pontuar cada competência. A coluna “Última entrevista” é o trigger para re-calibrar aos 6 meses de inatividade.
  4. Configure os inputs por vaga. Para uma determinada vaga, passe o caminho do JD, o nível, um array de 3-6 IDs de competência e um caminho para a matriz de pontos fortes preenchida. A skill emite loop.md e scaffolds de scorecard por estágio em scorecards/.
  5. Dry-run em um loop fechado. Execute em uma vaga que você projetou manualmente no último trimestre. Compare o mapeamento de estágio e as atribuições de entrevistadores da skill com o design manual. Se divergirem, a biblioteca de competências ou a matriz de entrevistadores é geralmente a coisa que precisa de ajuste, não o prompt da skill.

O que a skill realmente faz

Seis passos, em ordem. A ordem importa: validação determinística e mapeamento acontecem antes que o LLM gere âncoras de rubric e perguntas, e o passo de experiência do candidato no final re-lê o loop montado para capturar sobrecarga que é invisível ao atribuir cada estágio isoladamente.

  1. Valida os inputs. Cada ID de competência existe na biblioteca; o pool de entrevistadores tem pelo menos uma pessoa calibrada por competência must-have no nível da vaga; o nível está dentro das faixas cobertas da biblioteca. Para com TODOs explícitos se qualquer verificação falhar. Projetar um loop de Diretor com uma biblioteca apenas de IC produz rubrics inflados — este é o passo que evita isso.
  2. Mapeia competências para estágios. A triagem do recrutador avalia fit e básicos (nunca no rubric). A triagem do HM pega as 1-2 competências mais diferenciantes. O loop on-site distribui o restante uma por entrevista onde possível. A regra de uma-competência-por-entrevista é opinionada — agrupar duas competências em uma entrevista de 60 minutos produz sinal mais raso em ambas e torna o rubric mais difícil de aplicar no momento.
  3. Gera o rubric por estágio. Para cada estágio pós-triagem, extrai as descrições de âncoras para a faixa de nível do candidato da biblioteca de competências. Gera 3-5 perguntas comportamentais por dimensão seguindo o formato situação/comportamento/resultado, mais um acompanhamento sugerido por pergunta. Perguntas hipotéticas “o que você faria” são excluídas por padrão — elas recompensam suposição articulada sobre experiência evidenciada.
  4. Atribui entrevistadores com raciocínio. Para cada estágio pós-triagem, propõe 1-3 entrevistadores do pool. Combina por fit de calibração (requisito rígido), carga (nenhum entrevistador em mais de um estágio do mesmo loop) e diversidade de perspectiva (pelo menos um entrevistador fora da equipe de contratação onde o pool permite). Cada atribuição vem com uma string de raciocínio explícita.
  5. Passo de experiência do candidato. Re-lê o loop montado. Tempo total de entrevista ativa acima de 5 horas para IC ou 7 para liderança → sinaliza e sugere um take-home. Mais de 6 entrevistadores distintos → sinaliza fadiga do loop. Dois estágios sondando a mesma competência → sinaliza sinal redundante. Estágios em fusos horários diferentes sem acomodação → surfacea um TODO.
  6. Gate de revisão do gestor de contratação. Escreve loop.md e scorecards/<NN>-<stage-id>.md. Para. A skill não define nenhuma ação “publicar no ATS.” O HM abre o arquivo, edita e configura o loop no Ashby ou Greenhouse eles mesmos.

O formato de output literal e o layout do scaffold de scorecard estão em references/3-loop-output-format.md no bundle. O formato é fixo porque os consumidores downstream — entrevistador lendo o scorecard, facilitador de debrief consolidando pontuações — precisam de estrutura previsível.

Realidade de custos

Por design de loop, com Claude Sonnet 4.5:

  • Tokens LLM — tipicamente 30-60k tokens de input (JD mais biblioteca de competências mais matriz de entrevistadores mais instruções da skill) e 10-20k tokens de output (loop mais 3-5 scaffolds de scorecard com âncoras e perguntas). No Sonnet 4.5, isso é aproximadamente US$0,20-0,40 por design de loop. Uma função contratando 8 vagas por trimestre gasta menos de US$5 em custo de modelo nesta skill.
  • Tempo do recrutador e do gestor de contratação — a vitória está aqui. Um design de loop manual do zero com pulls de rubric calibrados é 90-120 minutos de tempo de HM mais recrutador na chamada de design, mais outros 30-60 minutos documentando perguntas e atribuições. A skill comprime isso para uma sessão de revisão de 30 minutos no loop gerado. Por vaga, isso é aproximadamente 90 minutos de tempo de IC sênior ou gestor economizados.
  • Tempo de configuração — 30 minutos por vaga uma vez que a biblioteca de competências e a matriz de entrevistadores estejam preenchidas. A biblioteca e a matriz são o pré-requisito — net-new, essas levam uma sessão de calibração por faixa de competência, que é um investimento em structured interviewing, não a configuração desta skill.
  • Benefício composto — loops estruturados produzem melhor quality of hire do que loops ad-hoc em todos os estudos publicados nos últimos vinte anos. A vitória da skill é tornar “estruturado” o padrão em vez da exceção, removendo o overhead de design por vaga.

Métrica de sucesso

Acompanhe três números por vaga por trimestre, no ATS:

  • Lead time de design do loop — horas de “vaga aprovada” até “loop configurado no ATS”. Deve cair materialmente após a skill estar no loop. Se não cair, o gargalo é a revisão do HM, não o design — surfacea o loop mais cedo na sequência de kickoff da vaga.
  • Concordância entre avaliadores no rubric — por dimensão de competência, com que frequência as pontuações independentes dos entrevistadores caem dentro de um ponto. Deve atingir 80% ou mais em competências calibradas. Abaixo disso, as descrições de âncoras na biblioteca de competências são a coisa a ajustar, não a skill.
  • Quality of hire em 12 meses — a métrica de longo prazo que o loop visa mover. Compare coortes contratados por loops projetados pela skill vs loops ad-hoc na mesma família de vagas. Se o coorte projetado pela skill não superar, re-examine o mapeamento de competência para estágio em vez de abandonar a estrutura.

vs alternativas

  • vs templates de entrevista estruturada do Ashby — o Ashby possui o loop configurado, a renderização do scorecard e o debrief em um produto. Escolha os templates do Ashby se quiser uma UX gerenciada e sua equipe vai viver no ATS. Escolha esta skill se quiser as âncoras de rubric, a matriz de pontos fortes dos entrevistadores e o mapeamento de competência para estágio no seu próprio repo, com controle de versão, com o passo de design substituível conforme a biblioteca de competências evolui. O output da skill é o input para a configuração de loop do Ashby, não uma substituição para ele.
  • vs loops templated genéricos — todo ATS inclui templates padrão de quatro estágios (“triagem por telefone, triagem pelo HM, técnica, painel on-site”). Passam por estruturados à primeira vista mas não são. O mesmo template é aplicado a um Backend IC4 e a um CS Manager M2, com as mesmas perguntas genéricas, independentemente de quais competências realmente diferenciam hire de no-hire em cada vaga. A skill ganha seus 30 minutos de configuração na segunda vaga porque o design é calibrado por vaga em vez de tamanho único.
  • vs design DIY de loop pelo gestor de contratação — um HM sênior consegue projetar um bom loop do zero em 90-120 minutos. Eles tendem a não fazer isso, porque sob pressão de prazo eles reutilizam o último loop que executaram, independentemente do fit. A vitória da skill não é “projeta melhor do que um HM experiente no pico”; é “projeta tão bem quanto um HM experiente consistentemente, em todas as vagas e todas as semanas.” A consistência é o benefício composto.
  • vs nenhum loop estruturado — as meta-análises publicadas em structured interviewing colocam entrevistas estruturadas em aproximadamente o dobro da validade preditiva de não estruturadas para desempenho no trabalho. Se o seu status quo é não estruturado, a skill não é a questão — adotar estrutura é. A skill é como tornar a estrutura barata o suficiente para realmente implantar em cada vaga.

Pontos de atenção

  • Sobrecarga de entrevistador da mesma pessoa sendo atribuída em todo lugar. Proteção: o passo de atribuição na skill impõe “nenhum entrevistador em mais de um estágio do mesmo loop” como regra rígida. A tabela de atribuição surfacea um entrevistador reserva por estágio para que o recrutador tenha um fallback quando o primário estiver indisponível, em vez de reutilizar o primário em dois estágios.
  • Sinal redundante entre estágios. Proteção: o passo de experiência do candidato re-lê o loop montado e sinaliza qualquer competência sondada em mais de um estágio. A tabela de mapeamento competência-para-estágio no topo do output do loop torna a redundância visível para o gestor de contratação no momento da revisão.
  • Experiência do candidato negligenciada. Proteção: o passo de experiência do candidato é um passo separado e nomeado na skill em vez de uma frase no final do loop. Ele impõe limites de tempo total (5 horas IC, 7 horas liderança), limites de entrevistadores distintos (6), sugestões de take-home para competências que inflam o loop e TODOs de acomodação de fuso horário. Sem esse passo, “mais uma conversa de 30 minutos” se acumula invisivelmente.
  • Drift de calibração dentro de um único loop. Proteção: o bloco de rubric emitido por estágio inclui descrições de âncoras por nível de pontuação extraídas da biblioteca de competências, não texto livre “rate 1 to 5”. As âncoras são o que mantém a calibração quando o mesmo candidato é pontuado por quatro entrevistadores diferentes no mesmo loop. Rubric vago → pontuações vagas → debrief que re-debate cada dimensão por anedota.
  • Gestor de contratação homologando o design sem ler. Proteção: a skill para no gate de revisão e escreve para arquivos. Não há ação “publicar no ATS.” O HM tem que abrir o arquivo e editá-lo antes de configurar o loop — esse atrito é intencional. Se os HMs começarem a assinar sem ler, o conteúdo do loop deriva dos requisitos da vaga e a skill para de ganhar seu tempo economizado.
  • Calibração de entrevistadores desatualizada. Proteção: a matriz de entrevistadores tem uma coluna “Última entrevista.” Células com mais de 6 meses acionam re-calibração antes que o entrevistador seja atribuído novamente. Quando a interview intelligence revela perguntas que não estão produzindo sinal útil, atualize as âncoras da biblioteca de competências e a skill emite as novas âncoras na próxima execução.

Stack

O bundle de skill está em apps/web/public/artifacts/interview-loop-builder-skill/ e contém:

  • SKILL.md — a definição da skill com frontmatter, regras de quando invocar, inputs, método e pontos de atenção emparelhados com proteções
  • references/1-competency-library.md — a taxonomia de competências com descrições de âncoras por nível de pontuação por faixa de nível; preencha por função antes de executar
  • references/2-interviewer-strengths.md — a matriz do pool de entrevistadores elegíveis com cobertura calibrada por competência; preencha por equipe antes de executar
  • references/3-loop-output-format.md — o formato Markdown literal que a skill emite, incluindo o layout do scaffold de scorecard

Ferramentas que o workflow assume que você já usa: Claude (o modelo), Ashby ou Greenhouse (o ATS onde o HM configura o loop projetado), BrightHire ou Metaview (interview intelligence cujo sinal alimenta de volta o ajuste de âncoras da biblioteca de competências). Combina diretamente com o JD writer upstream e o interview debrief summary downstream.

Arquivos deste artefato

Baixar tudo (.zip)