n8n-flow

Suivi automatique des mentions et changements concurrentiels avec n8n et Claude

Difficulty

intermédiaire

Setup time

60min

For

revops · sales-enablement

RevOps

Stack

La plupart des renseignements concurrentiels au sein des équipes de vente B2B arrivent de la mauvaise façon : un commercial perd une transaction, publie dans #lost-deals que le prospect a mentionné un nouveau palier tarifaire d’un concurrent, et le reste de l’équipe le découvre trois semaines plus tard. Le coût d’une découverte tardive se cumule — chaque transaction qui se clôture dans cette fenêtre entre dans la conversation mal préparée. Ce flow est la solution simple et pérenne. Un cron quotidien crawle une liste de pages concurrentes qui vous importent réellement, normalise le HTML pour éliminer le bruit de déploiement, demande à Claude de résumer ce qui a changé matériellement (et de retourner NO_CHANGE quand le diff est cosmétique), et publie un seul digest hebdomadaire dans Slack pour que le canal reste suffisamment riche en signal pour que les commerciaux continuent à l’ouvrir après un mois.

Le bundle dans apps/web/public/artifacts/competitive-intel-tracker-n8n/ contient le workflow n8n importable (competitive-intel-tracker-n8n.json, 20 nœuds sur trois déclencheurs) et _README.md avec la configuration des credentials, les deux tables Postgres à créer, et une vérification en six étapes du premier démarrage qui teste à la fois la branche de saut de matérialité et la commande Slack slash à la demande.

Quand utiliser

Vous avez entre cinq et quinze concurrents contre lesquels vous vous positionnez activement, vous pouvez nommer trois à cinq pages publiques par concurrent qui changent de manière significative (tarification, positionnement produit, signal de recrutement laissant entrevoir la stratégie), et vous avez au moins un canal Slack que l’équipe commerciale ouvre réellement. Vous êtes prêt à maintenir une liste d’URL suivies à mesure que les concurrents restructurent leurs sites. Vous disposez d’une base de données Postgres (ou d’un autre store adaptable) et d’une instance n8n accessible depuis l’internet public si vous souhaitez que la commande slash à la demande fonctionne.

C’est aussi la bonne approche si vous avez déjà essayé un flux RSS « alerte Slack à chaque article de blog concurrent » que l’équipe a mis en sourdine en moins d’une semaine — le filtre de matérialité et la cadence hebdomadaire ici sont des réponses directes à ce mode d’échec.

Quand NE PAS utiliser

Ne déployez pas ce flow si votre ensemble concurrentiel est dominé par des agrégateurs d’avis JS-lourds comme G2, Capterra, ou TrustRadius. Leur HTML public est une coquille vide — le contenu des avis est rendu côté client ou derrière authentification, et les crawler respectueusement ne vous retournera presque rien. Payez un fournisseur qui les gère (Crayon, Klue, Kompyte) ou ignorez ces sources entièrement.

N’utilisez pas ce flow si votre équipe a besoin d’une intelligence en temps réel — par exemple, un cycle de transaction qui se clôture en moins d’une semaine et dont les appels de découverte dépendent du changement de tarification du concurrent de la veille. La cadence ici est : récupération quotidienne, digest hebdomadaire. Si vous avez besoin d’une latence inférieure à une heure, vous achetez un produit différent (alertes Klue) ou construisez un workflow différent (webhooks de changement par page alimentant les DMs Slack des commerciaux, pas un digest).

N’utilisez pas ce flow contre des surfaces concurrentes privées (essais avec portail, portails clients payants, tout ce qui est derrière une connexion). Crawler celles-ci est dans une classe éthique et juridique différente du simple fait de consulter des pages marketing publiques, et ce flow n’est pas le bon substrat pour cela.

N’utilisez pas ce flow pour moins de trois concurrents. Le coût de configuration (vingt à trente lignes de pages suivies, schéma, credentials, réglage de la matérialité) ne se rentabilise pas si vous n’en surveillez qu’un ou deux — une alerte Google et un rappel calendrier sont la bonne réponse à cette échelle.

Configuration

Lisez apps/web/public/artifacts/competitive-intel-tracker-n8n/_README.md de bout en bout avant d’importer. En résumé : importez competitive-intel-tracker-n8n.json via Import from File de n8n, créez les deux tables Postgres (competitor_tracked_pages et competitor_change_log) avec le DDL du README, câblez quatre credentials (PLACEHOLDER_POSTGRES_CRED_ID, PLACEHOLDER_ANTHROPIC_CRED_ID, PLACEHOLDER_SLACK_CRED_ID, plus l’URL webhook Slack slash-command optionnelle), définissez explicitement le fuseau horaire du workflow dans Settings, alimentez la table des pages suivies avec vingt à trente lignes, et parcourez la vérification en six étapes du premier démarrage avant d’activer. La vérification teste délibérément le chemin sans snapshot préalable, le chemin économique sans changement, le chemin de diff forcé, le chemin de saut de matérialité, le chemin de digest, et le webhook à la demande — six branches, six petits tests.

Ce que le flow fait réellement

Le crawler est une boucle splitInBatches avec batchSize: 1 afin qu’une défaillance d’une seule page n’interrompe pas l’exécution. Chaque itération attend quatre secondes avant la récupération HTTP — cela répartit trente pages sur deux minutes, ce qui vous maintient bien en dessous de tout rate limit raisonnable par hôte et apparaît comme un bot poli dans les logs serveur. Le nœud httpRequest définit neverError: true car un 403 dû aux défenses anti-bot doit être enregistré et ignoré, pas faire planter le workflow.

La normalisation se produit dans un nœud Code qui supprime entièrement <script>, <style>, <noscript>, et les commentaires HTML, puis masque quatre classes de contenu volatil : les timestamps ISO, les dates au format américain, les années à quatre chiffres, et toute chaîne hexadécimale de plus de 32 caractères (identifiants de build, hashes d’assets). Sans cette étape, chaque déploiement Astro/Next/Hugo qui re-rend un pied de page « © 2026 » ou un og:updated_time mis à jour s’enregistrerait comme un changement, le digest hebdomadaire enverrait vingt entrées sans signification, et le canal mourrait.

La porte de matérialité est un ET de quatre conditions : la récupération a réussi, le hash diffère du snapshot précédent, un snapshot précédent existe, et le delta de longueur dépasse 0,5 %. Le terme delta-longueur est le pré-filtre économique qui économise des appels Claude — les modifications d’un seul caractère ou les espaces seuls n’atteignent jamais le modèle. Le terme « snapshot-précédent-existant » est ce qui rend le premier démarrage économique : une page nouvellement suivie capture son hash de référence et saute le diff entièrement.

L’appel Claude envoie les deux snapshots tronqués à 6 000 caractères chacun (environ 1 500 tokens chacun, plus le prompt système et les surcoûts → environ 3 500 tokens en entrée par page matérielle). Le prompt système force un choix binaire : retourner NO_CHANGE si le diff est cosmétique, de navigation uniquement, de pied de page uniquement, ou non identifiable, ou retourner exactement deux phrases — ce qui a changé et pourquoi un commercial devrait s’en préoccuper. Le nœud Parse traite NO_CHANGE comme une sentinelle et bascule is_material = false afin que la ligne soit quand même enregistrée pour audit mais n’atteigne jamais le digest.

Le digest du lundi à 14h30 exécute une seule requête SQL qui regroupe les changements matériels des sept derniers jours par concurrent, puis rend un message Slack Block Kit par concurrent — pas un méga-post. Les commerciaux mettent en sourdine les longs digests ininterrompus ; les messages par concurrent sont consultables et permettent les fils de discussion. Les semaines silencieuses (aucun changement matériel nulle part) ne publient rien. Le webhook à la demande est un troisième déclencheur, complètement indépendant : il consomme un POST de commande Slack slash, exécute une requête LIKE contre le journal des changements sur les 90 derniers jours, et répond avec jusqu’à dix blocs formatés de manière éphémère à l’utilisateur demandeur.

Réalité des coûts

Par exécution de crawl, avec 30 pages suivies et généralement 3 à 5 d’entre elles changeant matériellement : environ 11 000 tokens en entrée et 1 000 tokens en sortie contre claude-sonnet-4-6, ce qui représente environ 0,05 $ par exécution. Quotidiennement pendant 30 jours : ~1,50 $/mois en dépenses Claude. n8n auto-hébergé : 0 $ incremental ; n8n Cloud Starter : 20 $/mois en standalone ou 0 $ si vous l’utilisez déjà pour d’autres flows. Postgres : quelques mégaoctets de stockage si vous conservez indéfiniment le journal des changements (la colonne last_content_text est la plus lourde — 30 lignes × ~50 Ko ≈ 1,5 Mo total, croissant lentement).

Temps d’exécution par cycle : ~2,5 minutes (30 pages × 4 s de throttle + latence Claude pour les matérielles). Digest Slack : moins de 5 secondes. Webhook à la demande : moins de 2 secondes pour la réponse.

Temps opérateur : 30 à 60 minutes une fois par trimestre pour rafraîchir la liste des pages suivies quand les concurrents restructurent leurs sites, plus ~5 minutes la première fois que quelqu’un signale un faux positif (« le digest disait que les tarifs avaient changé mais ce n’était pas le cas ») pour ajuster le seuil de matérialité ou ajouter un pattern de masquage du bruit.

À quoi ressemble le succès

Métrique concrète à observer pendant les huit premières semaines : taux d’ouverture du digest ou équivalent accusé de réception dans Slack (vous pouvez l’approximer par le comptage de réactions ou en sondant manuellement les commerciaux). Si moins de 30 % du canal lit le digest, le rapport signal/bruit est trop faible — resserrez le seuil de matérialité (relevez la porte delta-longueur de 0,5 % à 1 %), supprimez les types de pages à plus faible signal (les pages de recrutement de concurrents avec une page d’offres d’emploi permanente qui change chaque semaine sont généralement du bruit), ou fusionnez les concurrents peu fréquents dans une section « longue traîne » du digest. Si plus de 60 % le lit régulièrement, vous avez construit le bon outil et la prochaine étape est d’ajouter un chemin à la demande pour le cas d’usage de l’appel de découverte (déjà câblé — publiez simplement la commande slash).

Une deuxième métrique : le nombre de fois par trimestre où un commercial cite le digest dans un fil #won-deals ou #lost-deals. Cinq citations par trimestre dans une équipe de 20 commerciaux est un bon signal ; zéro citation après deux mois signifie soit que le digest n’est pas lu, soit que le contenu n’est pas actionnable.

Par rapport aux alternatives

Klue ou Crayon (30 000 à 80 000 $/an pour le palier SMB de l’un ou l’autre, dernière vérification T1 2026) gère les sources d’agrégateurs d’avis JS-lourds que vous ne pouvez pas crawler vous-même, offre une expérience consommateur soignée pour l’équipe commerciale (battlecards, thèmes win/loss, hub d’intelligence), et inclut une couche de curation humaine qui capte les nuances que Claude manque. Si votre intelligence concurrentielle est suffisamment centrale dans votre cycle de vente pour justifier un employé à temps plein dédié à l’IC, achetez Klue ou Crayon. Ce flow est la bonne réponse quand vous gérez une équipe de 20 commerciaux sans recrutement dédié à l’IC et que vous devez arrêter de découvrir les changements de tarification des concurrents dans vos fils de transactions perdues — il vous donne 70 % de la valeur à 1 % du coût.

Visualping ou Distill.io (moins de 10 $/mois) fait bien la couche de détection des changements de page, mais s’arrête à « cette page a changé » et déverse le diff dans votre boîte mail. Le travail intéressant — transformer un diff en « voici ce que votre équipe commerciale doit dire différemment » — est exactement ce que Claude fait ici. Vous pourriez connecter Visualping à n8n et contourner la moitié crawler/hasher de ce flow si vous vouliez sous-traiter la préoccupation du crawler poli ; le filtre de matérialité et l’étape de diff Claude sont les parties qui comptent vraiment.

Un seul flux Google Alerts est ce que la plupart des équipes utilisent par défaut et ce que la plupart des équipes arrêtent silencieusement de lire après un mois. Google Alerts se déclenche sur les mentions presse, pas sur les changements de page ; il manque complètement les modifications de page de tarification (la page ne reçoit pas d’entrée d’index d’actualités fraîche) ; et le volume est dominé par le bruit de communiqués de presse syndiqués. Utilisez Alerts comme complément à ce flow pour le signal presse, pas comme remplacement du substrat de surveillance des pages.

Un crawler Python sur mesure sur un cron job dans votre entrepôt de données est ce que chaque ingénieur staff veut construire. Ils feront fonctionner le crawler en un sprint, la couche de diff en un sprint après, le formatage Slack en un sprint après, et personne ne le maintiendra quand l’ingénieur changera d’équipe. La raison d’utiliser n8n ici est qu’il rend le workflow visible (le graphe est la documentation), modifiable par un non-ingénieur (la personne Marketing Ops peut ajouter une page suivie sans PR), et suffisamment ennuyeux pour survivre à la personne qui l’a construit.

Points de vigilance

Les blocages anti-bot retournent 403/503 et votre hash devient silencieusement obsolète. Garde : le nœud Fetch Page HTML définit neverError: true et la condition fetch_ok de la porte de matérialité (status 200-399 ET longueur du corps > 200 octets) route les récupérations échouées vers la branche fausse — elles sont enregistrées mais n’atteignent jamais Claude ni le digest. Ajoutez une requête hebdomadaire contre competitor_change_log pour les pages dont last_seen_at est antérieur à 7 jours et traitez cela comme le rapport « pages suivies obsolètes ».
Claude hallucine un changement quand le diff normalisé est confus (ex. : un renommage de classe CSS a touché chaque <div> et le texte dépouillé ne s’est pas tout à fait récupéré). Garde : l’échappatoire du prompt système est la chaîne littérale NO_CHANGE, et le parser traite tout ce qui correspond à ^NO_CHANGE\b (insensible à la casse) comme non matériel. Quand vous voyez une entrée de digest manifestement fausse, la correction est d’ajouter un pattern de masquage du bruit dans le nœud Code Normalize + Hash, pas de baisser la température du modèle.
Le canal Slack est mis en sourdine dans les quatre semaines suivant le démarrage si même 20 % des entrées du digest sont non matérielles. Garde : cadence hebdomadaire plutôt que quotidienne (le cron du digest intégré est 30 14 * * 1, lundi 14h30 uniquement), le plancher delta-longueur de matérialité à 0,5 %, la sentinelle NO_CHANGE de Claude, et la porte IF des semaines-silencieuses-restent-silencieuses qui supprime entièrement le digest quand aucun concurrent n’a de changements matériels. Si les commerciaux le mettent quand même en sourdine, la prochaine chose à ajuster est de supprimer les valeurs page_type à plus faible signal de la liste des pages suivies — généralement les pages de recrutement.
Les noms de concurrents longs ou les gros volumes de changements dépassent la limite de 50 blocs de message de Slack. Garde : un message par concurrent (pas un méga-post), donc le plafond est par concurrent, pas par semaine. Si un seul concurrent a genuinement plus de ~15 changements matériels en une semaine, c’est en soi un signal que le seuil de matérialité doit être relevé pour ce concurrent spécifiquement.
La commande slash à la demande expose l’intelligence concurrentielle à n’importe qui dans le workspace car les commandes Slack slash n’appliquent pas l’appartenance aux canaux. Garde : le respondToWebhook retourne response_type: "ephemeral" afin que seul l’utilisateur demandeur voit le résultat, et la requête est limitée au journal des changements (aucun texte de page brut retourné). Si vous avez besoin d’un contrôle d’accès plus strict, conditionnez la commande slash sur un ID de groupe utilisateur Slack dans le nœud Code Parse Slash Command avant d’exécuter la requête SQL.

Stack

n8n — trois déclencheurs (cron de récupération quotidienne, cron de digest hebdomadaire, webhook à la demande), récupérateur HTTP, normalisateur, porte de matérialité, persistance
Postgres — competitor_tracked_pages (la liste source de vérité, 20-30 lignes) et competitor_change_log (piste d’audit de chaque changement détecté, matériel ou non)
Claude Sonnet 4.6 — l’étape de diff-et-résumé, avec la sentinelle NO_CHANGE comme échappatoire
Slack — le canal de distribution du digest et la surface de commande slash à la demande

Modifier cette page sur GitHub

Files in this artifact

Download all (.zip)

# Competitive intel tracker — n8n bundle

## What this flow does

A daily cron pulls a list of tracked competitor pages from Postgres, fetches each one with a real user-agent and a 4-second throttle, normalizes the HTML by stripping volatile noise (script blocks, build IDs, server-rendered timestamps, current-year strings), hashes the result, and compares it to the previously stored hash. Pages whose hash and length-delta both clear a materiality threshold get diffed by Claude Sonnet against the prior snapshot; the model is instructed to return the literal string `NO_CHANGE` when the diff is cosmetic. Material summaries land in a `competitor_change_log` table. A second cron fires Mondays at 14:30 and aggregates the last seven days of material changes into one Slack Block Kit message per competitor — silent weeks stay silent. A third trigger (a Slack slash command webhook) lets sales reps query the same change log on demand for a single competitor over the last 90 days.

## Import

1. In n8n, open the workflow list and click **Import from File** in the top-right kebab menu.
2. Select `competitive-intel-tracker-n8n.json`.
3. Confirm the workflow opens with 20 nodes across three triggers (the daily crawler, the weekly digest, and the on-demand webhook). The graph should read left-to-right with the digest below the crawler and the webhook below that.
4. Open **Settings** on the workflow and confirm `executionOrder: v1` and a sensible `timezone` (the bundle ships `Europe/London` — change it to your team's working timezone before activating; Cron expressions are interpreted in this zone).
5. Do **not** activate yet. Wire credentials and create the database tables first (next two sections).

## Credentials

The flow references four credential placeholders by name. Each placeholder must be replaced with a real n8n credential of the matching type before the workflow will execute.

### `PLACEHOLDER_POSTGRES_CRED_ID` — Postgres (read/write)

Used by five nodes (`Pull Tracked Pages`, `Persist Change + Update Snapshot`, `Touch Snapshot (No Material Change)`, `Aggregate Last 7 Days Of Material Changes`, `Fetch On-Demand History`). Create an n8n **Postgres** credential pointing at the database that holds your tracked pages and change log. The bundle assumes two tables — create them with:

```sql
CREATE TABLE competitor_tracked_pages (
page_id bigserial PRIMARY KEY,
competitor_name text NOT NULL,
page_type text NOT NULL, -- 'pricing' | 'blog' | 'hiring' | 'reviews' | 'docs'
url text NOT NULL UNIQUE,
active boolean NOT NULL DEFAULT true,
last_content_hash text,
last_content_text text,
last_seen_at timestamptz
);

CREATE TABLE competitor_change_log (
id bigserial PRIMARY KEY,
page_id bigint REFERENCES competitor_tracked_pages(page_id) ON DELETE CASCADE,
competitor_name text NOT NULL,
page_type text NOT NULL,
url text NOT NULL,
content_hash text NOT NULL,
summary text NOT NULL,
is_material boolean NOT NULL,
detected_at timestamptz NOT NULL DEFAULT now()
);

CREATE INDEX ON competitor_change_log (competitor_name, detected_at DESC);
CREATE INDEX ON competitor_change_log (detected_at DESC) WHERE is_material;
```

Seed `competitor_tracked_pages` with twenty to thirty rows before the first run. The recommended starter set per competitor: pricing page, two recent blog posts, careers/jobs index, docs landing page. Skip JS-heavy review sites (G2, Capterra, TrustRadius) unless you have a rendering service — the raw HTML they ship is mostly empty.

### `PLACEHOLDER_ANTHROPIC_CRED_ID` — Anthropic API key

Used by `Claude — Diff + Summarize`. Create an n8n **Header Auth** credential with header name `x-api-key` and value set to your Anthropic API key (find it at console.anthropic.com → API Keys). The flow uses `claude-sonnet-4-6` — change the model in the JSON if your account routes elsewhere. Token budget per run: roughly `(pages × ~3000 input tokens) + (material pages × ~200 output tokens)` — see the cost-reality section in the page body for absolute numbers.

### `PLACEHOLDER_SLACK_CRED_ID` — Slack bot token

Used by `Slack — Post Weekly Digest`. Create a Slack app at api.slack.com/apps, add the bot scopes `chat:write` and `chat:write.public` (the latter so the bot can post to channels it has not been explicitly invited to), install the app, and copy the **Bot User OAuth Token** (starts with `xoxb-`). Create an n8n **Header Auth** credential with header name `Authorization` and value `Bearer xoxb-...`. Update the channel name in the `Slack — Post Weekly Digest` node from `#competitive-intel` to whatever channel your sales team actually reads.

### Slash command (optional, no credential — webhook URL only)

The `On-Demand Webhook` node exposes a path at `/webhook/intel-on-demand`. To wire a Slack slash command to it: in your Slack app config, add a slash command (e.g. `/whatsnew`), set the request URL to your n8n public URL plus that path, and grant the `commands` scope. No n8n credential is needed because Slack POSTs to the webhook directly. If your n8n is not internet-reachable, either expose it via a tunnel or skip this trigger and run the on-demand query manually from the n8n editor.

## First-run verification

Run these in order. Each step proves a different branch of the flow.

1. **Insert one tracked page that you know changes daily** (a competitor's blog index works well). Verify with `SELECT * FROM competitor_tracked_pages;` that the row exists with `last_content_hash IS NULL`.
2. **Manually execute the `Daily Cron — 5am UTC` trigger** from the n8n editor. The first run should: fetch the page, compute a hash, *fail* the `Material Change?` IF (because there is no prior snapshot to compare — the `had-prior-snapshot` condition is false), and route to `Touch Snapshot (No Material Change)` which writes the initial hash. Confirm `competitor_tracked_pages.last_content_hash` is now populated and `competitor_change_log` is still empty.
3. **Manually execute the trigger a second time, immediately.** The hash should match (page didn't change in two minutes), the IF fails, no Claude call. This proves the cheap path.
4. **Edit the row to force a diff.** Run `UPDATE competitor_tracked_pages SET last_content_text = 'lorem ipsum placeholder', last_content_hash = 'force-diff' WHERE page_id = <id>;` and re-execute the trigger. The IF should now pass, Claude should be called, and you should see a row appear in `competitor_change_log`. Open the row and read the summary — it should describe the page in two sentences. If it returned `NO_CHANGE` despite the forced diff, lower the materiality threshold or check the truncation in the prompt.
5. **Test the no-op materiality filter.** Insert a row pointing at a page that has trivial dynamic content (e.g. a homepage with rotating testimonials). After the first snapshot is captured, re-run the cron. The hash will likely differ but the length delta should be small — confirm it routes to the false branch and does not spend a Claude call.
6. **Test the weekly digest.** Manually execute `Weekly Digest Cron — Mon 14:30`. If `competitor_change_log` has at least one `is_material = true` row from the last 7 days, you should see a Slack message land in the configured channel. If the table is empty for the window, no message fires — that is correct behavior, not a bug.
7. **Test the on-demand webhook.** From a terminal, `curl -X POST https://<your-n8n>/webhook/intel-on-demand -d 'text=acme'` (or trigger your wired Slack slash command). Expect a JSON response with up to 10 of the most recent material changes for any competitor whose name contains `acme`. With an empty change log, expect the "No material changes recorded" fallback.
8. **Activate the workflow** only after all six branches above behaved as described.

{
  "name": "Competitive intel tracker",
  "nodes": [
    {
      "parameters": {
        "rule": {
          "interval": [
            {
              "field": "cronExpression",
              "expression": "0 5 * * *"
            }
          ]
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000001",
      "name": "Daily Cron — 5am UTC",
      "type": "n8n-nodes-base.scheduleTrigger",
      "typeVersion": 1,
      "position": [240, 300],
      "notesInFlow": true,
      "notes": "Crawl runs daily at 05:00 in the workflow timezone (set in Settings). Digest fan-out is gated to Mondays only by the Weekly-Digest IF node."
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "SELECT\n  page_id,\n  competitor_name,\n  page_type,\n  url,\n  last_content_hash,\n  last_content_text,\n  last_seen_at\nFROM competitor_tracked_pages\nWHERE active = true\nORDER BY competitor_name, page_type\nLIMIT 200;",
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000002",
      "name": "Pull Tracked Pages",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [460, 300],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — competitive-intel"
        }
      },
      "notesInFlow": true,
      "notes": "Source-of-truth table for the tracked-pages list. Twenty to thirty rows is typical; cap at 200 to fail closed if the list grows unmanageably."
    },
    {
      "parameters": {
        "batchSize": 1,
        "options": {
          "reset": false
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000003",
      "name": "Iterate One Page At A Time",
      "type": "n8n-nodes-base.splitInBatches",
      "typeVersion": 3,
      "position": [680, 300],
      "notesInFlow": true,
      "notes": "Batch size 1 — each iteration handles one URL so per-page failure does not abort the run. Pair with a Wait node downstream to throttle."
    },
    {
      "parameters": {
        "amount": 4,
        "unit": "seconds"
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000004",
      "name": "Throttle — 4s Between Fetches",
      "type": "n8n-nodes-base.wait",
      "typeVersion": 1.1,
      "position": [900, 300],
      "notesInFlow": true,
      "notes": "Spreads ~30 fetches over ~2 minutes. Combined with one-request-per-page-per-day this keeps us well under any reasonable rate limit."
    },
    {
      "parameters": {
        "method": "GET",
        "url": "={{ $json.url }}",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "User-Agent", "value": "ooligo-intel-bot/1.0 (+https://ooligo.com/bots)" },
            { "name": "Accept", "value": "text/html,application/xhtml+xml" }
          ]
        },
        "options": {
          "timeout": 20000,
          "redirect": {
            "redirect": {
              "followRedirects": true,
              "maxRedirects": 3
            }
          },
          "response": {
            "response": {
              "fullResponse": true,
              "neverError": true
            }
          }
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000005",
      "name": "Fetch Page HTML",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [1120, 300],
      "notesInFlow": true,
      "notes": "neverError:true so a 403/503 from anti-bot does not kill the batch — we record it and move on."
    },
    {
      "parameters": {
        "jsCode": "// Strip noise from the HTML, normalize, and hash. The 'noise' is anything that\n// re-renders on every deploy without representing a content change: build IDs,\n// CSRF tokens, current-year strings, server-rendered timestamps, CDN cache\n// busters in asset URLs. Without this filter the digest fires every day with\n// nothing actually changed and the Slack channel gets muted within a week.\n\nconst page = $('Iterate One Page At A Time').item.json;\nconst response = $json;\nconst statusCode = response.statusCode || response.status || 0;\nconst rawBody = typeof response.body === 'string' ? response.body : JSON.stringify(response.body || '');\n\nfunction stripNoise(html) {\n  return html\n    // Remove <script> and <style> blocks entirely\n    .replace(/<script[\\s\\S]*?<\\/script>/gi, '')\n    .replace(/<style[\\s\\S]*?<\\/style>/gi, '')\n    .replace(/<noscript[\\s\\S]*?<\\/noscript>/gi, '')\n    .replace(/<!--[\\s\\S]*?-->/g, '')\n    // Strip all tags to plain text\n    .replace(/<[^>]+>/g, ' ')\n    // Decode common entities\n    .replace(/&nbsp;/g, ' ').replace(/&amp;/g, '&').replace(/&lt;/g, '<').replace(/&gt;/g, '>').replace(/&quot;/g, '\"')\n    // Mask volatile values\n    .replace(/\\b\\d{4}-\\d{2}-\\d{2}T\\d{2}:\\d{2}:\\d{2}(?:\\.\\d+)?Z?\\b/g, '<TS>')\n    .replace(/\\b(?:Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)[a-z]*\\s+\\d{1,2},?\\s+20\\d{2}\\b/g, '<DATE>')\n    .replace(/\\b20\\d{2}\\b/g, '<YEAR>')\n    .replace(/[a-f0-9]{32,}/gi, '<HASH>')\n    .replace(/\\b[A-Z0-9]{16,}\\b/g, '<TOKEN>')\n    // Collapse whitespace\n    .replace(/\\s+/g, ' ')\n    .trim();\n}\n\nconst normalized = stripNoise(rawBody);\n\nconst crypto = require('crypto');\nconst contentHash = crypto.createHash('sha256').update(normalized).digest('hex');\n\n// Materiality pre-filter: very small diffs are not worth a Claude call.\nconst prevText = page.last_content_text || '';\nconst lengthDelta = Math.abs(normalized.length - prevText.length);\nconst lengthRatio = prevText.length === 0 ? 1 : lengthDelta / prevText.length;\n\nreturn [{\n  json: {\n    page_id: page.page_id,\n    competitor_name: page.competitor_name,\n    page_type: page.page_type,\n    url: page.url,\n    fetch_status: statusCode,\n    fetched_at: new Date().toISOString(),\n    new_hash: contentHash,\n    old_hash: page.last_content_hash || null,\n    new_text: normalized,\n    old_text: prevText,\n    hash_changed: contentHash !== (page.last_content_hash || ''),\n    length_delta_pct: Math.round(lengthRatio * 1000) / 10,\n    fetch_ok: statusCode >= 200 && statusCode < 400 && rawBody.length > 200\n  }\n}];"
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000006",
      "name": "Normalize + Hash",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [1340, 300]
    },
    {
      "parameters": {
        "conditions": {
          "options": {
            "caseSensitive": true,
            "leftValue": "",
            "typeValidation": "strict"
          },
          "conditions": [
            {
              "id": "fetch-ok",
              "leftValue": "={{ $json.fetch_ok }}",
              "rightValue": true,
              "operator": { "type": "boolean", "operation": "equal" }
            },
            {
              "id": "hash-changed",
              "leftValue": "={{ $json.hash_changed }}",
              "rightValue": true,
              "operator": { "type": "boolean", "operation": "equal" }
            },
            {
              "id": "had-prior-snapshot",
              "leftValue": "={{ $json.old_text }}",
              "rightValue": "",
              "operator": { "type": "string", "operation": "notEmpty" }
            },
            {
              "id": "non-trivial-delta",
              "leftValue": "={{ $json.length_delta_pct }}",
              "rightValue": 0.5,
              "operator": { "type": "number", "operation": "gte" }
            }
          ],
          "combinator": "and"
        },
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000007",
      "name": "Material Change?",
      "type": "n8n-nodes-base.if",
      "typeVersion": 2.2,
      "position": [1560, 300],
      "notesInFlow": true,
      "notes": "Four-part gate: fetch succeeded, hash differs, we have a prior snapshot to compare against, and length delta exceeds 0.5% (filters out single-character or whitespace-only edits)."
    },
    {
      "parameters": {
        "method": "POST",
        "url": "https://api.anthropic.com/v1/messages",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "anthropic-version", "value": "2023-06-01" },
            { "name": "content-type", "value": "application/json" }
          ]
        },
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendBody": true,
        "specifyBody": "json",
        "jsonBody": "={\n  \"model\": \"claude-sonnet-4-6\",\n  \"max_tokens\": 400,\n  \"system\": \"You compare two snapshots of a competitor's public web page and report what changed in a way that helps a B2B sales team. Output rules: (1) If the diff is cosmetic, navigation-only, footer-only, or you cannot identify a specific factual delta, return exactly the string NO_CHANGE on a single line. Nothing else. (2) Otherwise return two short sentences. Sentence one: what changed (a price, a feature, a target customer, a hire, a positioning shift). Sentence two: why a salesperson should care (a new objection to pre-empt, a new wedge to use, a new threat to flag). Do not invent details that are not in the diff. Do not speculate about strategy. Do not pad with generic commentary.\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"Competitor: {{ $json.competitor_name }}\\nPage type: {{ $json.page_type }}\\nURL: {{ $json.url }}\\n\\n--- PREVIOUS SNAPSHOT ---\\n{{ $json.old_text.slice(0, 6000) }}\\n\\n--- CURRENT SNAPSHOT ---\\n{{ $json.new_text.slice(0, 6000) }}\"\n    }\n  ]\n}",
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000008",
      "name": "Claude — Diff + Summarize",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [1780, 200],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_ANTHROPIC_CRED_ID",
          "name": "Anthropic — x-api-key"
        }
      },
      "notesInFlow": true,
      "notes": "Snapshots truncated to 6000 chars each — keeps input ≤ ~3k tokens per page. NO_CHANGE sentinel is the model's escape hatch when the diff is noisy."
    },
    {
      "parameters": {
        "jsCode": "// Pull the model's text out of the Anthropic response and decide whether to keep it.\nconst page = $('Material Change?').item.json;\nconst resp = $json;\nconst summary = (resp?.content?.[0]?.text || '').trim();\nconst isNoChange = summary === '' || summary === 'NO_CHANGE' || /^NO_CHANGE\\b/i.test(summary);\n\nreturn [{\n  json: {\n    page_id: page.page_id,\n    competitor_name: page.competitor_name,\n    page_type: page.page_type,\n    url: page.url,\n    new_hash: page.new_hash,\n    new_text: page.new_text,\n    summary,\n    is_material: !isNoChange,\n    summarized_at: new Date().toISOString(),\n    input_tokens: resp?.usage?.input_tokens || null,\n    output_tokens: resp?.usage?.output_tokens || null\n  }\n}];"
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000009",
      "name": "Parse Claude Response",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [2000, 200]
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "INSERT INTO competitor_change_log (\n  page_id, competitor_name, page_type, url,\n  content_hash, summary, is_material, detected_at\n) VALUES ($1, $2, $3, $4, $5, $6, $7, now())\nRETURNING id;\n\nUPDATE competitor_tracked_pages\nSET\n  last_content_hash = $5,\n  last_content_text = $8,\n  last_seen_at = now()\nWHERE page_id = $1;",
        "options": {
          "queryReplacement": "={{ $json.page_id }},{{ $json.competitor_name }},{{ $json.page_type }},{{ $json.url }},{{ $json.new_hash }},{{ JSON.stringify($json.summary) }},{{ $json.is_material }},{{ JSON.stringify($json.new_text) }}"
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-00000000000a",
      "name": "Persist Change + Update Snapshot",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [2220, 200],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — competitive-intel"
        }
      },
      "notesInFlow": true,
      "notes": "Two statements: append to the change log (audit trail), then advance the snapshot. is_material flag drives the weekly digest filter."
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "UPDATE competitor_tracked_pages\nSET\n  last_content_hash = COALESCE($2, last_content_hash),\n  last_content_text = COALESCE($3, last_content_text),\n  last_seen_at = now()\nWHERE page_id = $1;",
        "options": {
          "queryReplacement": "={{ $json.page_id }},{{ $json.fetch_ok ? $json.new_hash : null }},{{ $json.fetch_ok ? JSON.stringify($json.new_text) : null }}"
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-00000000000b",
      "name": "Touch Snapshot (No Material Change)",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [1780, 400],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — competitive-intel"
        }
      },
      "notesInFlow": true,
      "notes": "False branch: still advances the stored hash so the next run compares against the latest content, but does NOT spend a Claude call or write to the change log."
    },
    {
      "parameters": {
        "rule": {
          "interval": [
            {
              "field": "cronExpression",
              "expression": "30 14 * * 1"
            }
          ]
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-00000000000c",
      "name": "Weekly Digest Cron — Mon 14:30",
      "type": "n8n-nodes-base.scheduleTrigger",
      "typeVersion": 1,
      "position": [240, 700],
      "notesInFlow": true,
      "notes": "Independent trigger. Mondays at 14:30 in the workflow timezone — Tuesday morning for APAC, mid-morning for EU, breakfast for the US east coast."
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "SELECT\n  competitor_name,\n  json_agg(\n    json_build_object(\n      'page_type', page_type,\n      'url', url,\n      'summary', summary,\n      'detected_at', detected_at\n    ) ORDER BY detected_at DESC\n  ) AS changes\nFROM competitor_change_log\nWHERE is_material = true\n  AND detected_at >= now() - interval '7 days'\nGROUP BY competitor_name\nORDER BY competitor_name;",
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-00000000000d",
      "name": "Aggregate Last 7 Days Of Material Changes",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [460, 700],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — competitive-intel"
        }
      }
    },
    {
      "parameters": {
        "conditions": {
          "options": {
            "caseSensitive": true,
            "leftValue": "",
            "typeValidation": "strict"
          },
          "conditions": [
            {
              "id": "have-changes",
              "leftValue": "={{ $json.competitor_name }}",
              "rightValue": "",
              "operator": { "type": "string", "operation": "notEmpty" }
            }
          ],
          "combinator": "and"
        },
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-00000000000e",
      "name": "Anything To Report?",
      "type": "n8n-nodes-base.if",
      "typeVersion": 2.2,
      "position": [680, 700],
      "notesInFlow": true,
      "notes": "Silent weeks stay silent — no 'no updates this week' filler messages. The channel never fires unless there is something actually worth reading."
    },
    {
      "parameters": {
        "jsCode": "// Render one Slack Block Kit payload per competitor with material changes this week.\nconst c = $json;\nconst changes = c.changes || [];\nconst blocks = [\n  {\n    type: 'header',\n    text: { type: 'plain_text', text: `Competitor update — ${c.competitor_name}`, emoji: false }\n  },\n  {\n    type: 'context',\n    elements: [\n      { type: 'mrkdwn', text: `${changes.length} material change${changes.length === 1 ? '' : 's'} in the last 7 days` }\n    ]\n  },\n  { type: 'divider' }\n];\nfor (const ch of changes) {\n  blocks.push({\n    type: 'section',\n    text: {\n      type: 'mrkdwn',\n      text: `*${ch.page_type}* — <${ch.url}|view page>\\n${ch.summary}`\n    }\n  });\n}\nreturn [{\n  json: {\n    competitor_name: c.competitor_name,\n    blocks,\n    fallback_text: `Competitor update — ${c.competitor_name} (${changes.length} material change${changes.length === 1 ? '' : 's'} this week)`\n  }\n}];"
      },
      "id": "2d2d2d2d-0002-0000-0000-00000000000f",
      "name": "Compose Slack Blocks",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [900, 700]
    },
    {
      "parameters": {
        "method": "POST",
        "url": "https://slack.com/api/chat.postMessage",
        "authentication": "predefinedCredentialType",
        "nodeCredentialType": "httpHeaderAuth",
        "sendHeaders": true,
        "headerParameters": {
          "parameters": [
            { "name": "content-type", "value": "application/json; charset=utf-8" }
          ]
        },
        "sendBody": true,
        "specifyBody": "json",
        "jsonBody": "={\n  \"channel\": \"#competitive-intel\",\n  \"text\": {{ JSON.stringify($json.fallback_text) }},\n  \"blocks\": {{ JSON.stringify($json.blocks) }},\n  \"unfurl_links\": false,\n  \"unfurl_media\": false\n}",
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000010",
      "name": "Slack — Post Weekly Digest",
      "type": "n8n-nodes-base.httpRequest",
      "typeVersion": 4.2,
      "position": [1120, 700],
      "credentials": {
        "httpHeaderAuth": {
          "id": "PLACEHOLDER_SLACK_CRED_ID",
          "name": "Slack — bot token"
        }
      },
      "notesInFlow": true,
      "notes": "One message per competitor, not one mega-post — sales reps mute long unbroken digests. Update channel name to your team's actual channel."
    },
    {
      "parameters": {
        "httpMethod": "POST",
        "path": "intel-on-demand",
        "responseMode": "responseNode",
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000011",
      "name": "On-Demand Webhook (Slack Slash Command)",
      "type": "n8n-nodes-base.webhook",
      "typeVersion": 2,
      "position": [240, 1100],
      "notesInFlow": true,
      "notes": "Wire a Slack slash command (e.g. /whatsnew acme) to this URL. Slack POSTs form-encoded body with text=<competitor query>."
    },
    {
      "parameters": {
        "jsCode": "// Parse Slack slash command payload, normalize the competitor name.\nconst body = $json.body || $json;\nconst raw = (body.text || '').trim();\nif (!raw) {\n  return [{ json: { error: 'Usage: /whatsnew <competitor>', _respond_immediately: true } }];\n}\nreturn [{ json: { query: raw.toLowerCase(), response_url: body.response_url || null } }];"
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000012",
      "name": "Parse Slash Command",
      "type": "n8n-nodes-base.code",
      "typeVersion": 2,
      "position": [460, 1100]
    },
    {
      "parameters": {
        "operation": "executeQuery",
        "query": "SELECT\n  competitor_name,\n  page_type,\n  url,\n  summary,\n  detected_at\nFROM competitor_change_log\nWHERE is_material = true\n  AND lower(competitor_name) LIKE '%' || $1 || '%'\n  AND detected_at >= now() - interval '90 days'\nORDER BY detected_at DESC\nLIMIT 10;",
        "options": {
          "queryReplacement": "={{ $json.query }}"
        }
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000013",
      "name": "Fetch On-Demand History",
      "type": "n8n-nodes-base.postgres",
      "typeVersion": 2.4,
      "position": [680, 1100],
      "credentials": {
        "postgres": {
          "id": "PLACEHOLDER_POSTGRES_CRED_ID",
          "name": "Postgres — competitive-intel"
        }
      }
    },
    {
      "parameters": {
        "respondWith": "json",
        "responseBody": "={\n  \"response_type\": \"ephemeral\",\n  \"text\": {{ JSON.stringify(($input.all().length === 0 ? 'No material changes recorded in the last 90 days.' : 'Last ' + $input.all().length + ' material changes:')) }},\n  \"blocks\": {{ JSON.stringify($input.all().map(i => ({ type: 'section', text: { type: 'mrkdwn', text: '*' + i.json.competitor_name + ' — ' + i.json.page_type + '* (' + new Date(i.json.detected_at).toISOString().slice(0,10) + ')\\n' + i.json.summary + '\\n<' + i.json.url + '|view page>' } }))) }}\n}",
        "options": {}
      },
      "id": "2d2d2d2d-0002-0000-0000-000000000014",
      "name": "Respond To Slack",
      "type": "n8n-nodes-base.respondToWebhook",
      "typeVersion": 1.1,
      "position": [900, 1100]
    }
  ],
  "connections": {
    "Daily Cron — 5am UTC": {
      "main": [
        [{ "node": "Pull Tracked Pages", "type": "main", "index": 0 }]
      ]
    },
    "Pull Tracked Pages": {
      "main": [
        [{ "node": "Iterate One Page At A Time", "type": "main", "index": 0 }]
      ]
    },
    "Iterate One Page At A Time": {
      "main": [
        [{ "node": "Throttle — 4s Between Fetches", "type": "main", "index": 0 }]
      ]
    },
    "Throttle — 4s Between Fetches": {
      "main": [
        [{ "node": "Fetch Page HTML", "type": "main", "index": 0 }]
      ]
    },
    "Fetch Page HTML": {
      "main": [
        [{ "node": "Normalize + Hash", "type": "main", "index": 0 }]
      ]
    },
    "Normalize + Hash": {
      "main": [
        [{ "node": "Material Change?", "type": "main", "index": 0 }]
      ]
    },
    "Material Change?": {
      "main": [
        [{ "node": "Claude — Diff + Summarize", "type": "main", "index": 0 }],
        [{ "node": "Touch Snapshot (No Material Change)", "type": "main", "index": 0 }]
      ]
    },
    "Claude — Diff + Summarize": {
      "main": [
        [{ "node": "Parse Claude Response", "type": "main", "index": 0 }]
      ]
    },
    "Parse Claude Response": {
      "main": [
        [{ "node": "Persist Change + Update Snapshot", "type": "main", "index": 0 }]
      ]
    },
    "Persist Change + Update Snapshot": {
      "main": [
        [{ "node": "Iterate One Page At A Time", "type": "main", "index": 0 }]
      ]
    },
    "Touch Snapshot (No Material Change)": {
      "main": [
        [{ "node": "Iterate One Page At A Time", "type": "main", "index": 0 }]
      ]
    },
    "Weekly Digest Cron — Mon 14:30": {
      "main": [
        [{ "node": "Aggregate Last 7 Days Of Material Changes", "type": "main", "index": 0 }]
      ]
    },
    "Aggregate Last 7 Days Of Material Changes": {
      "main": [
        [{ "node": "Anything To Report?", "type": "main", "index": 0 }]
      ]
    },
    "Anything To Report?": {
      "main": [
        [{ "node": "Compose Slack Blocks", "type": "main", "index": 0 }],
        []
      ]
    },
    "Compose Slack Blocks": {
      "main": [
        [{ "node": "Slack — Post Weekly Digest", "type": "main", "index": 0 }]
      ]
    },
    "On-Demand Webhook (Slack Slash Command)": {
      "main": [
        [{ "node": "Parse Slash Command", "type": "main", "index": 0 }]
      ]
    },
    "Parse Slash Command": {
      "main": [
        [{ "node": "Fetch On-Demand History", "type": "main", "index": 0 }]
      ]
    },
    "Fetch On-Demand History": {
      "main": [
        [{ "node": "Respond To Slack", "type": "main", "index": 0 }]
      ]
    }
  },
  "active": false,
  "settings": {
    "executionOrder": "v1",
    "timezone": "Europe/London",
    "saveDataErrorExecution": "all",
    "saveDataSuccessExecution": "all",
    "saveManualExecutions": true
  },
  "versionId": "2d2d2d2d-0002-0000-0000-0000000000ff",
  "meta": {
    "templateCreatedBy": "ooligo",
    "instanceId": "ooligo-pilot"
  },
  "id": "competitive-intel-tracker",
  "tags": [
    { "name": "revops" },
    { "name": "competitive-intel" },
    { "name": "sales-enablement" }
  ]
}