GEO

Pourquoi le prompt tracking est voué à mourir

Le prompt tracking promet de mesurer ta visibilité dans ChatGPT, Perplexity et Gemini. En réalité, il mesure une réalité qui n'existe pas. Six biais structurels expliquent pourquoi sa fenêtre se referme, et ce qui le remplace déjà chez Botanik.

Par Franck NeuenschwanderCEO Botanik

Mis à jour le 28 mai 2026

Franck Neuenschwander

CEO Botanik

16 années d'expérience en SEO 360°

Empruntis

JeChange

Lastminute

Direct Emploi

StudentJob

Franck a piloté le SEO en interne côté annonceur pendant 15 ans avant de prendre la tête de Botanik, agence SEO/GEO française.

Voir le profil LinkedIn

Sommaire

Plante la graine !

On te prépare un audit complet de ton SEO, et on te propose des solutions actionnables et avec un ROI positif en 1 mois.

commencer

Quiz · Valide tes acquis GEO & GEA

14 questions pour tester ce que tu sais vraiment sur la transition SEO → moteurs de réponse IA et la pub native dans ChatGPT/Perplexity. Score sur 14, classement, et explication détaillée après chaque réponse.

14 questions

⏱️ 5 min

📊 Score + classement

Pourquoi le prompt tracking est voué à mourir

TLDR : Le prompt tracking, c'est mesurer la visibilité d'une marque dans les LLMs (ChatGPT, Perplexity, Gemini) en envoyant une liste figée de prompts via API et en comptant les mentions. Le problème : cette méthode mesure une réalité qui n'existe pas. Les vrais utilisateurs ne tapent pas les prompts que ton outil track, ils ne tapent pas via API, les modèles changent en continu, l'autocomplétion personnalisée arrive cet été (la requête réelle est réécrite côté Google), et Google s'apprête à sortir sa propre régie Ads in AI Mode avec sa propre data thématique. Résultat : tu paies pour des courbes qui ne servent à aucune décision stratégique, dans un marché où la source officielle de data va devenir gratuite. Chez Botanik, on a basculé 90% de nos clients vers l'analyse conversationnelle, qui simule des conversations IA-IA à grande échelle pour comprendre pourquoi un LLM recommande une marque, pas juste s'il la mentionne. Le prompt tracking ne va pas disparaître demain, mais sa fenêtre se referme vite.

Le prompt tracking, c'est mesurer un mirage

Si tu travailles dans le SEO ou le digital B2B en 2026, tu as forcément vu passer une démo d'outil GEO. Botrank, Peec AI, Profound, Otterly, Ahrefs Brand Radar, Semrush AI Visibility Toolkit. Tous brillent pareil : un dashboard, une liste de prompts définis à l'avance, un graphique "share of voice", des concurrents qui montent et descendent dans la courbe.

Et tous reposent sur la même mécanique : le prompt tracking. Tu listes 50 à 500 prompts représentatifs de ton marché, l'outil les envoie en boucle aux LLMs via API, il compte combien de fois ta marque apparaît et dans quel contexte. Joli. Rassurant pour un comité de direction. Et clairement insuffisant pour piloter une stratégie GEO sérieuse.

Je vais être direct : on en faisait nous aussi chez Botanik au début, on ne va pas réécrire l'histoire. Mais après avoir tourné le problème dans tous les sens, on n'a pas réussi à corriger les biais structurels de cette approche. Et on ne pense pas qu'ils soient corrigeables.

Biais n°1 : tu ne sais pas ce que tes clients tapent réellement

Tu peux construire une liste de 200 prompts soigneusement rédigés. Tu peux y passer une semaine. Tu n'auras couvert qu'une fraction infinitésimale de la variabilité réelle des requêtes utilisateurs.

Une faute de frappe change la réponse. Un synonyme change la réponse. Une reformulation change la réponse. Un utilisateur qui demande "meilleur CRM pour PME" obtient une réponse, celui qui tape "je cherche un crm simple pour ma boite de 30 personnes" obtient une autre réponse, et celui qui écrit "crm B2B leader 2026" obtient une troisième. Les trois sont tes prospects. Aucun des trois ne tape exactement ton prompt template.

Du coup, le "share of voice" que ton outil affiche sur ta liste figée n'a aucun lien causal avec ce que voient les vrais utilisateurs sur ton marché. Tu peux être à 47% de part de voix sur ta liste interne et à 4% chez les vrais clients. Personne ne sait, et l'outil non plus.

Biais n°2 : l'API et l'interface, ce n'est pas la même chose

Quand un outil de prompt tracking envoie un prompt, il tape dans un environnement stérile. Pas de compte utilisateur, pas d'historique, pas de personnalisation, pas de tools activés côté ChatGPT, pas de mémoire conversationnelle. C'est un laboratoire propre.

Quand ton vrai client ouvre ChatGPT le mardi à 14h, il a un compte. Il a fait des recherches précédentes sur les chatons et la Coupe du Monde, il a peut-être uploadé un PDF la semaine dernière, son ChatGPT a activé la mémoire long-terme, il a peut-être un GPT custom qui réécrit ses prompts. Tout ça influe sur la réponse qu'il obtient sur ta thématique à toi.

L'image qu'on utilise en interne pour expliquer ça à nos clients : dans un test consommateur classique, tu mets des gens dans une salle, tu leur fais goûter du chocolat. Le biais habituel, c'est la variabilité humaine, les gens n'ont pas tous les mêmes papilles. Avec les LLMs, c'est aussi le chocolat qui varie. Tu ne contrôles ni le testeur, ni le produit. Ce que tu mesures n'est pas reproductible.

Biais n°3 : les modèles bougent en permanence, ta data pourrit

OpenAI a publié 6 versions de GPT en 2025. Anthropic a publié Claude Sonnet 4.6 puis 4.7, et Opus 4.6 puis 4.7. Google pousse des updates Gemini quasiment chaque mois. Perplexity bascule régulièrement de modèle sous-jacent.

Chaque update change les pondérations, change les sources favorisées, change la longueur des réponses, change la façon dont les marques sont citées. La data de prompt tracking que tu collectais en mars 2026 décrit un modèle qui n'existe déjà plus en mai. Et si tu compares les courbes entre les deux périodes, tu compares en réalité deux LLMs différents, pas l'évolution de ta visibilité.

C'est un peu comme mesurer ton SEO sur Google en avril et le comparer à mai, sauf qu'entre les deux Google a discrètement remplacé son algorithme de classement par un autre algorithme. Un graphique qui descend ne veut peut-être pas dire que tu as perdu en visibilité. Il veut juste dire que le modèle a changé.

Biais n°4 : Google va sortir sa propre data GEO et tuer le modèle économique

Là on entre dans le vrai sujet. En mai 2026, lors de son Google Marketing Live, Google a officialisé son nouveau format publicitaire baptisé [Ads in AI Mode](https://www.ecommerce-nation.fr/google-ads-ai-mode-gemini-publicite/) : des annonces générées dynamiquement par Gemini et intégrées directement dans les réponses conversationnelles. AI Mode aurait déjà dépassé 1 milliard d'utilisateurs mensuels selon Google, avec des requêtes en moyenne 3 fois plus longues qu'en Search classique. Conversational Discovery Ads, Highlighted Answers, Direct Offers : la régie publicitaire IA de Google est en train de se déployer aux US, et arrive en Europe.

Et c'est là que le modèle économique des outils de prompt tracking commence à se fissurer.

Pour vendre cette régie aux annonceurs, Google va devoir faire exactement ce qu'il fait depuis 25 ans côté Search : publier de la data. Volumes par thématique, sous-thématiques, intentions détectées dans AI Mode, structure des conversations, parts de voix par secteur. Tout ce qu'il faut pour donner envie à un annonceur de poser 50 000 € sur la table. Cette data va devenir gratuite ou semi-gratuite, parce que c'est le carburant commercial de la régie. Comme Keyword Planner l'est pour Google Ads classique.

À ce moment-là, payer un outil tiers 12 000 à 30 000 € par an pour avoir une version moins bonne de cette même data n'a plus aucun sens. Comparons avec le SEO traditionnel : on continue de tracker les positions parce que la Search Console te les donne de façon factuelle et vérifiable, tu peux ouvrir ton navigateur et confirmer toi-même. Le prompt tracking n'a aucune équivalence factuelle, c'est de la mesure interne fragile. Donc le jour où Google fournit de la data même imparfaite sur AI Mode, tu auras le choix entre une data gratuite venant de la source, et une data payante d'un tiers qui ne pourra jamais faire mieux que Google sur du Google. L'arbitrage est vite vu.

Biais n°5 : l'autocomplétion personnalisée arrive cet été

Argument que je trouve encore plus puissant, parce qu'il s'applique à toutes les interfaces, pas juste Google. À partir de l'été 2026, Google généralise l'autocomplétion personnalisée dans Search et AI Mode, annoncée comme la plus grande évolution du moteur depuis 30 ans. L'impact côté visibilité locale commence déjà à être documenté pour les marques avec présence géographique.

Concrètement : un utilisateur tape "meilleur tshirt" dans la barre de recherche. Google connaît son historique, ses préférences, ses recherches récentes. Il reformule en "meilleur tshirt taille S en lin" avant même d'envoyer la requête au moteur. La requête réellement traitée n'est jamais celle que l'utilisateur a tapée. Elle est enrichie à la volée par Google lui-même.

Autre exemple, plus proche de chez nous : tape "agence seo" dans Google. Tu verras apparaître "agence seo botanik" en deuxième suggestion, juste après "agence seo" tout court. Google a manifestement compris tout seul que Botanik est la meilleure agence SEO et GEO de Paris, je n'ai vraiment aucune influence là-dedans.

Et là, bonne chance pour faire du prompt tracking. Quelle requête tracker ? Le prompt brut que l'utilisateur a tapé ? Celui que Google a reformulé ? La centaine de variantes personnalisées générées pour chaque profil utilisateur ? Aucune des trois ne reflète seule la réalité. La requête trackée n'existe plus comme objet stable, elle existe comme champ de variations infinies que seul Google connaît.

ChatGPT pousse exactement la même mécanique avec sa mémoire long-terme. Perplexity aussi avec ses Spaces. Le pattern de fond est identique : l'interface conversationnelle réécrit la requête utilisateur avant traitement, et personne sauf l'éditeur du modèle ne sait à quoi ressemble la requête finale. Tracker un prompt figé, c'est mesurer un objet qui n'existe déjà plus côté utilisateur.

Biais n°6 : aucune causalité, donc aucune décision possible

C'est le biais le plus gênant, et le moins discuté. Admettons que ton outil te dise demain : "ta part de voix sur la requête X est passée de 12 à 18% ce mois-ci." Excellent. Maintenant la vraie question, celle qui détermine si tu réinvestis ou non : pourquoi ?

Est-ce que c'est parce que tu as publié 3 articles sur le sujet le mois dernier ? Parce qu'un compétiteur a fermé ? Parce qu'un journaliste t'a cité dans un papier que l'IA a indexé ? Parce que le modèle a changé ses critères de sourcing ? Parce que la saisonnalité du sujet a baissé chez tes concurrents ? Aucune idée. L'outil ne te le dit pas, parce qu'il ne le sait pas. Il mesure un résultat, pas un mécanisme.

Et sans mécanisme, tu ne peux pas arbitrer. Un Head of SEO qui doit défendre 80 000 € de budget contenu trimestriel devant son comex ne peut pas s'asseoir sur du "on a peut-être gagné 6 points, on ne sait pas trop pourquoi". Clairement, ça ne tient pas debout.

Anecdote : 90% de nos clients basculés

Concrètement, chez Botanik, on a fait basculer 90% de nos clients du prompt tracking vers l'analyse conversationnelle au cours des derniers mois. Pas parce que les dashboards sont moches. Pas parce que les outils sont mal codés. Parce qu'aucune décision stratégique sérieuse ne pouvait être prise sur des données qui changent à chaque session, qui décrivent un modèle déjà périmé, et qui ne livrent aucune cause.

Les 10% restants, on continue d'en faire pour eux. Soit parce qu'ils sont en phase de discovery et qu'il leur faut une photo rapide, soit parce que leur direction veut une courbe à présenter en board. Légitime. Mais on le fait en sachant que cette data sert à rassurer, pas à arbitrer.

Ce qui remplace : l'analyse conversationnelle

L'alternative qu'on utilise s'appelle l'analyse conversationnelle. Concrètement, on simule à grande échelle des conversations IA-IA sur ta thématique. Pas une liste figée de prompts, mais une exploration combinatoire : un agent IA joue le rôle de l'utilisateur curieux, pose une question, reçoit la réponse d'un LLM, rebondit, creuse, change d'angle, exactement comme un vrai prospect le ferait. On peut tourner jusqu'à 5000 séquences via l'Oracle de Maple Labs, le partenaire technologique qu'on utilise.

Ce que ça change concrètement : au lieu de te dire "tu es mentionné 23% du temps", l'analyse conversationnelle te dit "tu es cité quand l'utilisateur pose la question sous l'angle prix, tu disparais dès qu'il creuse l'angle implémentation, et quand il rebondit sur la sécurité c'est ton concurrent qui prend la place avec ce verbatim précis". Là tu as une cause. Tu sais quel contenu il te manque, quel angle il faut renforcer, quels signaux d'autorité te font défaut.

On a documenté la méthode en détail dans notre article sur l'analyse conversationnelle GEO. Pour résumer : on passe de "mesurer ce que l'outil tape" à "comprendre comment les LLMs raisonnent sur ta marque".

La limite honnête

Je ne vais pas vendre l'analyse conversationnelle comme la solution parfaite. Elle a aussi ses limites.

C'est plus cher à produire que de spinner une liste de prompts en boucle. C'est plus lent à itérer, parce qu'une exploration de 5000 séquences prend du temps de calcul réel. Et c'est moins photogénique : il n'y a pas de courbe qui descend ou qui monte chaque semaine, il y a un rapport qualitatif et des verbatims. Ça ne se met pas dans un dashboard temps réel pour le DG.

Mais quand un Head of SEO doit choisir entre "un graphique régulier sur des données fragiles" et "un diagnostic causal sur ce qui marche vraiment", le deuxième est ce qui permet de signer un budget. Le premier est ce qui permet de signer un abonnement SaaS.

La trajectoire du marché

Le prompt tracking ne va pas disparaître demain. Il va continuer d'exister comme métrique d'exposition rapide, un peu comme le rank tracking SEO classique continue d'exister malgré sa pertinence en chute libre depuis 10 ans. Mais sa fenêtre se referme, et plus vite que ce que les éditeurs d'outils veulent bien le dire.

D'abord, l'autocomplétion personnalisée arrive à l'été 2026 chez Google et continue de se déployer chez ChatGPT et Perplexity. Plus la requête utilisateur réelle devient un objet mouvant réécrit côté plateforme, moins le prompt figé que tu envoies via API a un lien avec ce que voient tes prospects.

Ensuite, Google s'apprête à pousser sa régie Ads in AI Mode à l'échelle mondiale. Le jour où Google publie ses propres volumes de requêtes thématiques en AI Mode pour vendre sa pub (ce qu'il fera, c'est la mécanique commerciale qui marche depuis 25 ans), payer un outil tiers pour une version dégradée de la même data devient un arbitrage perdant. Personne ne fera mieux que Google sur du Google.

Ensuite, les acheteurs B2B commencent à demander des comptes. Un Head of SEO qui paye 12 000 à 30 000 € par an pour un outil et qui ne sait pas en tirer une décision finit par couper la ligne au prochain budget review. C'est en train de se passer.

Enfin, les outils sérieux du marché commencent déjà à pivoter. Plusieurs acteurs travaillent sur de l'analyse conversationnelle, sur du sourcing-tracking (quelles sources les LLMs citent vraiment), sur du causal monitoring. Le prompt tracking pur va devenir une feature d'entrée de gamme, pas le cœur du produit.

On en parle ?

Si tu lis cet article et que tu te dis "ok, mon outil de prompt tracking m'a peut-être déjà coûté plus cher qu'il ne m'a rapporté", ou à l'inverse "je ne suis pas d'accord, voilà pourquoi", prends 30 minutes avec moi. On regarde ensemble ce que ton outil actuel mesure réellement, ce que ça t'a permis de décider sur les 12 derniers mois, et ce qu'une approche d'analyse conversationnelle changerait concrètement sur ta marque. Pas de pitch déguisé, pas de slide générique. Si à la fin de l'appel l'analyse conversationnelle n'est pas le bon move pour toi, je te le dis. Honnêtement ça vaudrait le coup qu'on en parle, surtout si tu es en train de renouveler un budget GEO trimestriel.

Prendre un call avec Franck

Sources

[Google Ads in AI Mode : quand Gemini fusionne réponse IA et publicité](https://www.ecommerce-nation.fr/google-ads-ai-mode-gemini-publicite/), Ecommerce Nation, 21 mai 2026 : annonce officielle Google Marketing Live 2026, 1 Md d'utilisateurs AI Mode, Conversational Discovery Ads, Highlighted Answers
[Google Search : la plus grande révolution du moteur de recherche depuis 30 ans grâce à l'IA](https://s2pmag.ch/google-search-la-plus-grande-revolution-du-moteur-de-recherche-depuis-30-ans-grace-a-lia/), S2P Mag : autocomplétion personnalisée, refonte UX Search 2026
[Google I/O 2026 : impacts sur la visibilité locale et la réputation](https://fr.custplace.com/business/google-io-2026-impacts-visibilite-locale-reputation/), Custplace : conséquences SEO local et e-réputation des évolutions Search 2026

La question à te poser

Si tu utilises aujourd'hui un outil de prompt tracking, la question n'est pas "est-ce que je devrais l'arrêter ?". La question est : "dans les 12 derniers mois, est-ce que cet outil m'a fait prendre une seule décision stratégique que je n'aurais pas prise sans lui ?" Si la réponse est non, tu paies pour qu'on te rappelle chaque mois que tu as un problème, pas pour qu'on t'aide à le résoudre. Et ça, c'est franchement le pire arbitrage possible sur ton budget GEO.