IA RANK GEOIA RANK GEO
Technique

Dataset llm-facts : pourquoi et comment ajouter des faits structurés citables

Par Thomas Kolbé5 min de lecture

Le schema Dataset (variant 'llm-facts') déclare des faits chiffrés citables dans un format que les LLMs préfèrent. Voici pourquoi c'est le 2e signal GEO le plus puissant et comment l'implémenter.

Pourquoi un schema Dataset pour des faits ?

Schema.org Dataset est traditionnellement pour les jeux de données scientifiques. Mais en 2025, la communauté GEO (notamment Mistral et Anthropic) a popularisé l'usage 'llm-facts' · un Dataset qui liste 3-5 faits chiffrés clés d'un article. Cela permet aux LLMs de citer un fait précis sans avoir à parser tout l'article.

Exemple · si votre article contient « 40 % du trafic recherche passe par les IA en 2026 », c'est ce fait que ChatGPT cite. Avec un schema Dataset llm-facts, vous le servez explicitement.

Format JSON-LD

Voici la structure correcte :

{
  "@type": "Dataset",
  "@id": "https://exemple.fr/article#llm-facts",
  "name": "llm-facts: Titre de l'article",
  "description": "Faits clés machine-lisibles pour citation par LLMs.",
  "variableMeasured": [
    {
      "@type": "PropertyValue",
      "name": "fact",
      "value": "40 % du trafic recherche passe par les IA en 2026"
    },
    ... 2-4 autres faits
  ]
}

Bonnes pratiques pour les faits

Critères qui maximisent la citabilité :

  • Faits chiffrés · pourcentages, dates, montants (les LLMs adorent)
  • Sourçables · vérifiables via une étude / rapport (renforce la confiance)
  • Concis · ≤ 100 chars par fait, autonomes (citables sans contexte)
  • 3-5 par article · au-delà = dilution · en dessous = signal faible
  • Inclus dans le contenu visible · le fait doit apparaître dans le HTML, pas seulement dans le schema

Implémentation WordPress

Génération automatique via IA RANK GEO Pro · à partir de votre contenu, Mistral extrait 3-5 faits chiffrés candidats, vous validez/éditez, le plugin injecte le Dataset dans le schema @graph. Les plugins SEO classiques ne supportent pas Dataset.

À la main · ajouter le <script type="application/ld+json"> dans le <head> via wp_head action. Maintenance lourde si beaucoup d'articles.

Questions fréquentes

Schema Dataset · supporté par Google ?+

Oui · Google reconnaît Dataset depuis 2018. L'usage 'llm-facts' est une convention communautaire · Google ne pénalise pas (ce n'est pas un usage interdit) et les LLMs le récompensent.

Faut-il sourcer chaque fait ?+

Idéalement oui. Vous pouvez ajouter citation ou isBasedOn dans le PropertyValue, qui pointe vers l'étude/rapport source. Renforce E-E-A-T.

Combien de Dataset par page ?+

Un seul, avec 3-5 PropertyValue dedans. Plusieurs Dataset = confusion pour les crawlers.

Différence Dataset vs FAQPage ?+

FAQPage · paires Q/R conversationnelles. Dataset · faits autonomes courts. Vous pouvez avoir les deux sur la même page · ils ne se concurrencent pas.

Les LLMs lisent-ils vraiment Dataset ?+

Oui · documenté côté Anthropic et Mistral. Perplexity en confirme l'usage. ChatGPT moins explicite mais des audits montrent qu'il consomme variableMeasured.

Sources et lectures complémentaires

Vous voulez l'appliquer à votre site ?

IA RANK GEO Pro fait tout cela automatiquement sur votre site WordPress.

Plugin installé en 2 min. Score GEO temps réel sur tous vos articles. Génération auto via Mistral · meta + FAQ + Quick Answer + Topic Clusters. Suivi quotidien des citations sur ChatGPT, Claude, Perplexity, Gemini. Lite gratuit à vie. Pro à partir de 19 €/mois.

  • Score GEO 80+ par défaut · 14 critères auto-évalués sur chaque article
  • Génération Mistral incluse · meta, FAQ, Quick Answer, Answer-Ready Blocks · pas de clé API à gérer
  • Suivi citations IA quotidien · ChatGPT, Claude, Perplexity, Gemini, AI Overviews · alertes concurrents
  • RGPD by design · génération en France via Mistral · zéro fuite vers OpenAI ou Anthropic

Sans engagement · annulable en 1 clic depuis le portail Stripe · résiliation transparente