Le schema Dataset (variant 'llm-facts') déclare des faits chiffrés citables dans un format que les LLMs préfèrent. Voici pourquoi c'est le 2e signal GEO le plus puissant et comment l'implémenter.
Pourquoi un schema Dataset pour des faits ?
Schema.org Dataset est traditionnellement pour les jeux de données scientifiques. Mais en 2025, la communauté GEO (notamment Mistral et Anthropic) a popularisé l'usage 'llm-facts' · un Dataset qui liste 3-5 faits chiffrés clés d'un article. Cela permet aux LLMs de citer un fait précis sans avoir à parser tout l'article.
Exemple · si votre article contient « 40 % du trafic recherche passe par les IA en 2026 », c'est ce fait que ChatGPT cite. Avec un schema Dataset llm-facts, vous le servez explicitement.
Format JSON-LD
Voici la structure correcte :
{
"@type": "Dataset",
"@id": "https://exemple.fr/article#llm-facts",
"name": "llm-facts: Titre de l'article",
"description": "Faits clés machine-lisibles pour citation par LLMs.",
"variableMeasured": [
{
"@type": "PropertyValue",
"name": "fact",
"value": "40 % du trafic recherche passe par les IA en 2026"
},
... 2-4 autres faits
]
}Bonnes pratiques pour les faits
Critères qui maximisent la citabilité :
- Faits chiffrés · pourcentages, dates, montants (les LLMs adorent)
- Sourçables · vérifiables via une étude / rapport (renforce la confiance)
- Concis · ≤ 100 chars par fait, autonomes (citables sans contexte)
- 3-5 par article · au-delà = dilution · en dessous = signal faible
- Inclus dans le contenu visible · le fait doit apparaître dans le HTML, pas seulement dans le schema
Implémentation WordPress
Génération automatique via IA RANK GEO Pro · à partir de votre contenu, Mistral extrait 3-5 faits chiffrés candidats, vous validez/éditez, le plugin injecte le Dataset dans le schema @graph. Les plugins SEO classiques ne supportent pas Dataset.
À la main · ajouter le <script type="application/ld+json"> dans le <head> via wp_head action. Maintenance lourde si beaucoup d'articles.
Questions fréquentes
Schema Dataset · supporté par Google ?+
Oui · Google reconnaît Dataset depuis 2018. L'usage 'llm-facts' est une convention communautaire · Google ne pénalise pas (ce n'est pas un usage interdit) et les LLMs le récompensent.
Faut-il sourcer chaque fait ?+
Idéalement oui. Vous pouvez ajouter citation ou isBasedOn dans le PropertyValue, qui pointe vers l'étude/rapport source. Renforce E-E-A-T.
Combien de Dataset par page ?+
Un seul, avec 3-5 PropertyValue dedans. Plusieurs Dataset = confusion pour les crawlers.
Différence Dataset vs FAQPage ?+
FAQPage · paires Q/R conversationnelles. Dataset · faits autonomes courts. Vous pouvez avoir les deux sur la même page · ils ne se concurrencent pas.
Les LLMs lisent-ils vraiment Dataset ?+
Oui · documenté côté Anthropic et Mistral. Perplexity en confirme l'usage. ChatGPT moins explicite mais des audits montrent qu'il consomme variableMeasured.