L’Effet fan-out : comment ChatGPT choisit (vraiment) ses sources — et pourquoi votre score d’autorité ne sert à rien
Author: Killian Lemoal — · Updated:
Short summary: La boîte noire de la citation IA Depuis deux décennies, le SEO a reposé sur une règle d’or immuable : plaire à l’algorithme […]
Quick overview
- Site
- Peak Ace
- Canonical URL
- https://peakace.fr/blog/seo/leffet-fan-out-comment-chatgpt-choisit-vraiment-ses-sources-et-pourquoi-votre-score-dautorite-ne-sert-a-rien/
- LLM HTML version
- https://peakace.fr/blog/seo/leffet-fan-out-comment-chatgpt-choisit-vraiment-ses-sources-et-pourquoi-votre-score-dautorite-ne-sert-a-rien/llm
- LLM JSON version
- https://peakace.fr/blog/seo/leffet-fan-out-comment-chatgpt-choisit-vraiment-ses-sources-et-pourquoi-votre-score-dautorite-ne-sert-a-rien/llm.json
- Manifest
- https://peakace.fr/llm-endpoints-manifest.json
- Estimated reading time
- 7 minutes (408 seconds)
- Word count
- 1357
Key points
- La boîte noire de la citation IA Depuis deux décennies, le SEO a reposé sur une règle d’or immuable : plaire à l’algorithme de Google pour figurer parmi les dix liens bleus.
- Mais l’avènement de ChatGPT a brisé ce miroir.
- Dans ce nouveau paradigme, être « indexé » ne suffit plus ; il faut être cité.
- Jusqu’ici, le processus décisionnel de l’IA pour sélectionner ses sources restait une énigme, une « boîte noire » technique où se mélangeaient intuition algorithmique et pertinence perçue. Une étude monumentale menée par AirOps et Kevin Indig, analysant 16 851 requêtes et 353 799 pages web, vient de décoder ce mystère.
Primary visual
Structured content
La boîte noire de la citation IA
Depuis deux décennies, le SEO a reposé sur une règle d'or immuable : plaire à l'algorithme de Google pour figurer parmi les dix liens bleus. Mais l'avènement de ChatGPT a brisé ce miroir. Dans ce nouveau paradigme, être "indexé" ne suffit plus ; il faut être cité. Jusqu'ici, le processus décisionnel de l'IA pour sélectionner ses sources restait une énigme, une "boîte noire" technique où se mélangeaient intuition algorithmique et pertinence perçue.
Une étude monumentale menée par AirOps et Kevin Indig, analysant 16 851 requêtes et 353 799 pages web, vient de décoder ce mystère. Au cœur de cette mécanique se trouve l'effet "Fan-Out". Lorsqu'un utilisateur pose une question complexe, ChatGPT ne se contente pas d'une recherche unique. Il décompose la requête en plusieurs sous-recherches internes (sub-queries) pour collecter des données spécifiques. Cette analyse révèle que la visibilité ne dépend pas de qui vous êtes, mais de la manière dont votre contenu s'insère dans ce pipeline de récupération fragmenté.
La dictature du xlassement : la position 1 ou rien
La première réalité de l'AEO (Answer Engine Optimization) est brutale : nous sommes dans une économie du "gagnant rafle tout". L'étude révèle une distribution bimodale frappante : 58 % des pages ne sont jamais citées, tandis que 25 % le sont systématiquement. Il n'y a quasiment pas de juste milieu.
Le signal dominant, surpassant tous les autres, est le rang de récupération (retrieval rank). Si vous n'apparaissez pas dans les tout premiers résultats de la recherche interne de ChatGPT (souvent via Bing), votre probabilité de citation s'effondre, indépendamment de la qualité de votre contenu.
| Position de recherche (Rank) | Taux de citation |
| Position 1 (Premier résultat) | 58,4 % |
| Position 2 | 54,4 % |
| Position 3 | 35,5 % |
| Position 10 | 14,2 % |
L'écart est sans appel : un résultat en position 1 est quatre fois plus susceptible d'être cité qu'un résultat en position 10.
"Great SEO is your advantage in AI search."
Même avec une pertinence sémantique parfaite, une page reléguée au-delà de la 10ème position voit son taux de citation plafonner à 21,5 %, alors qu'un contenu médiocre en première position atteint 56 %. La "retrouvabilité" technique est le premier verrou de la visibilité IA.
La fin du « guide ultime » : pourquoi la précision bat l'exhaustivité
La fin du « guide ultime » : pourquoi la précision bat l'exhaustivité
Le "guide ultime" de 5 000 mots, pilier du SEO traditionnel, est une stratégie obsolète pour ChatGPT. L'IA applique une règle technique stricte : une page n'est citée qu'une seule fois par réponse, peu importe le volume d'informations pertinentes qu'elle contient.
L'effet Fan-Out génère des sous-requêtes ultra-spécifiques. Pour y répondre, ChatGPT privilégie les pages "spécialistes". Les données montrent que couvrir 100 % des sous-thématiques d'une requête nuit à la citation : les pages couvrants seulement 26 à 50 % du sujet surperforment les guides exhaustifs.
Le levier le plus puissant ici est la correspondance directe des titres (H1-H4). Une page dont les titres s'alignent précisément sur la requête initiale affiche un taux de citation de 41 %, contre 29 % pour les structures floues. En voulant tout traiter, vous diluez votre signal de pertinence. L'IA cherche une réponse chirurgicale, pas une encyclopédie.
Le mythe de l'autorité : la mort du DA (Domain Authority)
Le mythe de l'autorité : la mort du DA (Domain Authority)
C'est ici que l'analyse devient visionnaire : l'IA est agnostique vis-à-vis de l'autorité de domaine. Il existe même une corrélation inverse entre le profil de liens traditionnels et la citation par ChatGPT.
Les pages "jamais citées" possèdent en moyenne trois fois plus de backlinks (3,2 millions) que les pages "toujours citées" (1,1 million).
Le Domain Authority (DA) moyen des sources systématiquement citées est de 53, alors qu'il est de 56 pour les pages ignorées. ChatGPT évalue le contenu "à nu", sur sa structure et sa réponse directe à la sous-requête, sans se laisser impressionner par la réputation héritée du domaine. Pour une marque, cela signifie que la puissance du contenu sur la page l'emporte désormais sur la puissance du nom de domaine.
La formule magique du formatage : structure et lisibilité
La formule magique du formatage : structure et lisibilité
Pour optimiser vos chances, vous devez aligner votre contenu sur les préférences structurelles du pipeline de l'IA. Voici les caractéristiques des pages gagnantes :
- Longueur : Le "sweet spot" se situe entre 500 et 2 000 mots. Au-delà de 5 000 mots, la performance chute drastiquement.
- Structure : Visez entre 7 et 20 sous-titres (H2-H4). Pour l'IA, cette fragmentation facilite l'extraction de données.
- Données structurées (JSON-LD) : Elles offrent un bonus net de +6,5 points de citation. Les types MedicalWebPage (47 %), BreadcrumbList (46,2 %) et FAQPage (45,6 %) sont les plus performants.
Niveau de langue : L'algorithme privilégie le niveau "College" (Flesch-Kincaid 16-17) avec un taux de citation de 35,9 %. Pourquoi ? Parce que l'IA associe un vocabulaire sophistiqué et une structure de phrase complexe à une autorité d'expert.
L'exception Wikipedia et les citations "mémoire"
L'exception Wikipedia et les citations "mémoire"
Wikipedia reste une anomalie avec 59 % de citation malgré un rang de récupération médiocre (médiane à 24). Sa force ? Une densité extrême (4 300 mots, 31 listes, 6,6 tableaux par page) que peu de marques peuvent ou doivent reproduire.
Plus intéressant encore : les citations "mémoire". Environ 6 300 citations de l'étude proviennent non pas d'une recherche web en temps réel, mais des données d'entraînement de ChatGPT. Reddit et Wikipedia dominent cet espace de "haute confiance". Ces sources sont citées très tôt dans la réponse (position 3,3 en moyenne), prouvant que l'IA les considère comme des références pré-validées.
Le facteur temps : Le "Sweet Spot" de la fraîcheur
Le facteur temps : Le "Sweet Spot" de la fraîcheur
La fraîcheur est un amplificateur de pertinence, mais son impact varie selon votre secteur d'activité. Le taux de citation global culmine pour les contenus âgés de 30 à 89 jours (32,8 %). Les contenus trop frais (< 30 jours) sont souvent sous-représentés, le temps que les signaux de récupération se stabilisent.
- Finance & Voyage : La fraîcheur est critique. On observe un écart de 15 à 19 points de pourcentage entre un contenu récent et un contenu de plus de 2 ans.
- E-commerce : La fraîcheur est négligeable ; un contenu de 5 ans peut être aussi performant qu'un contenu de 3 mois si le produit est "evergreen".
- Santé : Le contenu établi (1-2 ans) surperforme le contenu très récent, l'IA privilégiant probablement la stabilité de l'information médicale.
De l'autorité à la pertinence
De l'autorité à la pertinence
L'effet Fan-Out nous impose de repenser radicalement notre stratégie de visibilité. ChatGPT n'est pas un moteur de recherche, c'est un moteur de synthèse. Il ne cherche pas des leaders d'opinion, mais des unités d'information parfaitement structurées, techniquement accessibles et sémantiquement précises.
Dans ce nouveau monde, le score d'autorité devient un indicateur de vanité. La véritable question pour les créateurs n'est plus "Comment puis-je obtenir plus de liens ?", mais "Comment puis-je devenir la réponse la plus immédiate à l'une des sous-requêtes générées par l'IA ?".
Si vous continuez à produire des guides exhaustifs pour des domaines à fort DA, vous travaillez pour un algorithme qui n'existe déjà plus. Êtes-vous prêt à troquer votre autorité contre la précision ?
Topics and keywords
Themes: GEO, IA, SEO
Keywords: ChatGPT, Fan-out
License & attribution
License: CC BY-ND 4.0.
Attribution required: yes.
Manifest: https://peakace.fr/llm-endpoints-manifest.json
LLM Endpoints plugin version 1.1.2.