GEO

L'analyse conversationnelle : pourquoi le prompt tracking est devenu marginal dans notre approche GEO

Prompt tracking ou analyse conversationnelle ? Botanik explique pourquoi il a fait basculer son approche GEO vers la méthode Oracle de Maple Labs — et les deux biais irréductibles qui l'ont convaincu.

Par Franck NeuenschwanderCEO Botanik

Mis à jour le 26 mai 2026

Franck Neuenschwander

CEO Botanik

16 années d'expérience en SEO 360°

Empruntis

JeChange

Lastminute

Direct Emploi

StudentJob

Franck a piloté le SEO en interne côté annonceur pendant 15 ans avant de prendre la tête de Botanik, agence SEO/GEO française.

Voir le profil LinkedIn

Sommaire

Plante la graine !

On te prépare un audit complet de ton SEO, et on te propose des solutions actionnables et avec un ROI positif en 1 mois.

commencer

Quiz · Valide tes acquis GEO & GEA

14 questions pour tester ce que tu sais vraiment sur la transition SEO → moteurs de réponse IA et la pub native dans ChatGPT/Perplexity. Score sur 14, classement, et explication détaillée après chaque réponse.

14 questions

⏱️ 5 min

📊 Score + classement

TLDR : Botanik a adopté une méthode d'audit GEO appelée "analyse conversationnelle", développée par notre partenaire Maple Labs via l'outil Oracle. Elle repose sur la simulation de conversations IA-IA (jusqu'à 5000 prompts) pour comprendre pourquoi un LLM recommande une marque, pas juste si il la mentionne. Le prompt tracking reste utilisé à la marge pour certains clients, mais il souffre de deux biais irréductibles que cette approche contourne.

Le marché GEO a un problème qu'il refuse d'admettre : il mesure ce qu'il ne peut pas contrôler, avec un outil qui introduit deux biais qu'il ne peut pas corriger.

Ce problème s'appelle le prompt tracking. C'est ce que font à peu près tous les outils GEO vendus aujourd'hui. Et c'est encore ce qu'on faisait chez Botanik au début — on ne va pas réécrire l'histoire.

Pourquoi le prompt tracking est devenu marginal chez nous

On ne dit pas que le prompt tracking ne sert à rien. Pour certains clients, dans certains contextes, on l'utilise encore. Mais de plus en plus à la marge. Parce qu'il a deux biais qu'on n'a pas réussi à corriger, et qu'on ne pense pas qu'ils soient corrigeables.

Biais 1 : tu ne sais pas ce que tes clients vont taper. La moindre micro-variation de prompt, et la réponse du LLM change. Une faute de frappe, une reformulation, un synonyme. Tu peux construire une liste de 200 prompts soigneusement rédigés : tu n'auras couvert qu'une fraction infinitésimale de la variabilité réelle des requêtes de tes utilisateurs.

Biais 2 : l'API et l'interface, c'est pas la même chose. Quand tu envoies un prompt via API, tu tapes dans un environnement vierge, standardisé, sans historique. Quand un vrai utilisateur ouvre ChatGPT, il a un compte, il a fait des recherches précédentes sur des sujets complètement différents. Comme on l'a formulé en interne : "Le gars il a un compte où il a déjà fait des recherches sur les chatons et la Coupe du Monde, tu ne sais pas à quel point ça peut influer la réponse de l'IA sur ton sujet à toi."

Il y a une image encore plus précise pour comprendre le problème. Dans un test consommateur classique, tu mets des gens dans une salle, tu leur fais goûter du chocolat. Le biais, c'est la variabilité humaine. Avec les LLMs : "La différence c'est que là le chocolat varie, c'est pas seulement les gens, il y a aussi le chocolat qui varie."

Autrement dit : tu ne contrôles ni le testeur ni le produit. Ce que tu mesures n'est pas reproductible de façon fiable.

L'analyse conversationnelle - la méthode alternative

La méthode alternative s'appelle l'analyse conversationnelle. Elle est implémentée dans Oracle, un outil développé par notre partenaire Maple Labs. Botanik intègre Oracle dans ses missions GEO.

La différence fondamentale avec le prompt tracking tient en une phrase : "Ce qu'on ressort c'est comment le modèle a réfléchi sur un sujet donné. C'est pas comment ça ressort, c'est pourquoi ça ressort."

Si tu sais juste si tu ressors, ton seul levier c'est de produire plus de contenu en espérant que ça change quelque chose. Si tu sais pourquoi ton concurrent ressort et pas toi, tu peux travailler les critères précis sur lesquels le modèle évalue ta thématique.

Comment ça fonctionne techniquement (côté Oracle / Maple Labs)

Oracle ne lance pas des prompts, il lance des conversations. Des conversations entre IA, pas entre un humain et une IA. Jusqu'à 5000 prompts par audit, organisés en 3 axes : leadership, tendances, avis.

L'outil identifie automatiquement les concurrents à partir de la thématique (zéro input concurrent nécessaire) — sur tous les audits réalisés à ce jour, les concurrents trouvés correspondaient aux vrais concurrents marché du client.

La base technique, c'est le prompt lui-même. Pas des prompts de 3 lignes : des prompts de plusieurs méga-octets, littéralement plusieurs centaines de milliers de lignes, qui permettent de "set up des environnements de conversation" — des contextes dans lesquels l'IA raisonne sur une thématique plutôt que de répondre à une question.

Sur la question des multi-LLM : sur une thématique précise, les biais de réflexion entre Gemini, Claude et ChatGPT sont faibles. Ce qui varie, c'est le style de réponse, pas les critères thématiques sur lesquels ils évaluent une marque. Du coup Oracle fait le gros de l'audit sur un seul modèle, vérifie sur les autres pour assurer la cohérence.

Ce que ça change pour le plan d'action

Un audit de prompt tracking te dit : "Tu ressors 3 fois sur 20 prompts testés." Plan d'action : produire plus de contenu.

Un audit par analyse conversationnelle te dit : "Sur ta thématique, les LLMs valorisent 4 critères dans cet ordre de priorité. Tu es fort sur le critère 1, absent sur les critères 2 et 4, faible sur le 3. Voilà les sources que le modèle cite comme autorités, voilà comment tes concurrents sont positionnés sur chacun."

Le plan d'action est actionnable parce qu'il porte sur ce que le modèle comprend de ton marché.

La limite honnête

L'analyse conversationnelle donne un diagnostic de ce que les LLMs pensent de ta marque aujourd'hui. Les modèles évoluent. Un audit GEO ne peut pas être un one-shot — c'est un monitoring longitudinal.

Et on refuse les missions sans data partagée : sans accès à la situation réelle du client (trafic, conversion, positionnement), les résultats de l'audit n'ont pas de contexte business pour être interprétés correctement.

La bonne question à poser, ce n'est pas "est-ce que je ressors dans les LLMs". C'est "pourquoi je ne ressors pas". C'est à partir de là qu'un plan d'action tient debout.