Prospection B2B : utilisez le MCP data.gouv.fr pour trouver vos cibles
Guide pratique : connecter le serveur MCP de data.gouv.fr (Claude, Cursor, ChatGPT) pour prospecter avec les données SIRENE et le catalogue open data. Étapes, outils exposés et bonnes pratiques.
Vous voulez identifier des cibles B2B (secteur, zone, taille) sans tout coder à la main ? Le serveur MCP de data.gouv.fr permet à votre assistant IA (Claude, Cursor, ChatGPT, etc.) d’interroger le catalogue des données ouvertes françaises en langage naturel. Idéal pour découvrir les jeux de données utiles à la prospection, explorer les métadonnées et interroger des ressources — le tout depuis une conversation. Ce guide vous explique comment l’installer et comment l’utiliser concrètement pour la prospection.
Qu’est-ce que le MCP data.gouv.fr ?
MCP (Model Context Protocol) est un protocole ouvert qui relie des assistants IA à des sources de données ou à des services. Le serveur MCP de data.gouv.fr est une expérimentation officielle de l’équipe data.gouv.fr : il expose le catalogue et les données de la plateforme française d’open data via des tools standardisés.
En pratique, votre chatbot peut :
- Rechercher des jeux de données par mots-clés
- Consulter les métadonnées d’un jeu ou d’une ressource
- Lister les ressources (fichiers CSV, etc.) d’un jeu
- Interroger certaines ressources (données tabulaires)
- Télécharger et parser une ressource pour l’analyser
- Accéder à des indicateurs d’usage (métriques)
Aucune clé API n’est requise pour l’instance publique. Une instance hébergée est disponible à l’adresse : https://mcp.data.gouv.fr/mcp.
Le serveur est en lecture seule et expérimental. Les réponses des modèles peuvent être incomplètes ou approximatives : vérifiez toujours les résultats avant de les utiliser en prospection ou en automatisation.
Pourquoi utiliser le MCP data.gouv pour la prospection ?
La prospection B2B s’appuie souvent sur des données publiques : base SIRENE (entreprises, établissements, code NAF/APE), annuaires, réutilisations. Sur data.gouv.fr, ces jeux existent mais sont nombreux et hétérogènes. Le MCP permet de :
- Gagner du temps : « Quels jeux contiennent des données d’entreprises par secteur d’activité ? » au lieu de parcourir le catalogue à la main.
- Explorer en langage naturel : formuler des questions en français et laisser l’assistant appeler les bons tools (recherche, métadonnées, requêtes).
- Prototyper une chaîne de prospection (identification des jeux → exploration des ressources → extraction de critères) sans tout développer contre l’API.
Pour des automatisations robustes et rejouables, l’API de data.gouv.fr reste recommandée ; le MCP sert surtout à découvrir, tester et guider jusqu’à ce que vous figiez votre process.
Prérequis
- Un client compatible MCP : Claude (Desktop ou Code), Cursor, ChatGPT, ou un autre outil listé dans le dépôt officiel.
- Aucun compte data.gouv.fr ni clé API pour l’instance publique https://mcp.data.gouv.fr/mcp.
Étape 1 : Connecter le MCP data.gouv à votre assistant
La configuration dépend du client MCP que vous utilisez. Voici les trois cas les plus courants, présentés comme un tutoriel fluide.
A. Connexion avec Cursor
Objectif : permettre à Cursor d’appeler le serveur MCP de data.gouv.fr pour que votre agent puisse chercher et explorer des jeux de données directement depuis l’éditeur (Windows, macOS, Linux).
-
Ouvrir la configuration MCP de Cursor
Dans Cursor, allez dans les Settings (⚙️) puis dans la section MCP ou Model Context Protocol. -
Ajouter un nouveau serveur MCP
Cliquez sur “Add server” / “New MCP server” puis choisissez le type HTTP (transport HTTP). -
Renseigner l’URL officielle data.gouv
Utilisez l’instance publique :
{
"mcpServers": {
"datagouv": {
"url": "https://mcp.data.gouv.fr/mcp"
}
}
}
-
Sauvegarder puis recharger les MCP
Validez la configuration, puis redémarrez Cursor ou utilisez l’action de reload des MCP si elle est disponible. L’agent doit maintenant voir un serveur nommé par exemple datagouv. -
Vérifier que les tools sont visibles
Ouvrez une nouvelle conversation avec votre agent dans Cursor et demandez par exemple :
« Peux-tu utiliser le serveur MCP data.gouv pour chercher des jeux de données sur les entreprises françaises ? »
S’il est bien configuré, vous verrez des appels de tools du typesearch_datasets,get_dataset_info, etc.
Astuce : notez le nom exact du serveur MCP dans la config Cursor (ex. datagouv), il vous servira si vous voulez demander explicitement « utilise le serveur datagouv pour… ».
B. Connexion avec Claude Desktop
Objectif : ajouter le serveur MCP data.gouv dans le fichier de configuration de Claude Desktop pour pouvoir l’appeler depuis vos chats.
-
Localiser le fichier de configuration
Selon votre OS, Claude Desktop utilise un fichier du typeclaude_desktop_config.json(l’emplacement exact est indiqué dans la documentation officielle de Claude). -
Ouvrir le fichier dans un éditeur
Ouvrez ce fichier dans votre éditeur (VS Code, Cursor…) et repérez la section"mcpServers"si elle existe déjà. -
Ajouter l’entrée pour data.gouv
Ajoutez (ou complétez) une entrée de ce type :
{
"mcpServers": {
"datagouv": {
"url": "https://mcp.data.gouv.fr/mcp"
}
}
}
-
Sauvegarder et redémarrer Claude Desktop
Enregistrez le fichier puis redémarrez l’application. Claude doit charger la nouvelle configuration MCP. -
Tester l’accès aux tools data.gouv
Dans une nouvelle conversation, demandez par exemple :
« Utilise le serveur MCP data.gouv pour lister des jeux de données sur les entreprises françaises (SIRENE, SIRET). »
Si tout est en place, Claude utilisera des tools commesearch_datasetsouget_dataset_info.
Gardez en tête que la structure exacte du fichier de config peut évoluer : référez-vous toujours à la documentation la plus récente de Claude.
C. Connexion avec Claude en ligne de commande
Objectif : déclarer le serveur MCP data.gouv pour le client Claude en CLI, afin de l’utiliser dans vos sessions terminal (pratique pour macOS / Linux, mais aussi Windows avec un terminal adapté).
-
Ouvrir un terminal
Utilisez votre terminal habituel (macOS, Linux, WSL, etc.). -
Ajouter le serveur MCP data.gouv
En vous appuyant sur la doc de votre client Claude CLI, exécutez une commande du type :
claude mcp add --transport http datagouv https://mcp.data.gouv.fr/mcp
-
Vérifier l’enregistrement
Utilisez la commande de liste (par ex.claude mcp list, à adapter selon la doc) pour vérifier que le serveurdatagouvapparaît bien. -
Tester dans une session Claude
Lancez une session Claude en CLI et demandez-lui d’utiliser le serveurdatagouvpour rechercher des jeux de données sur les entreprises ou les établissements.
Comme le projet Claude CLI évolue rapidement, référez-vous au README officiel pour la syntaxe exacte des commandes MCP.
Étape 2 : Découvrir les jeux de données utiles à la prospection
Une fois le MCP connecté, vous pouvez tenir ce type de dialogue avec votre assistant.
Exemples de requêtes en langage naturel :
- « Recherche les jeux de données sur data.gouv qui contiennent des entreprises ou des établissements français (SIRENE, SIRET, NAF). »
- « Quels jeux de données permettent de filtrer les entreprises par secteur d’activité ou par région ? »
- « Liste les ressources du jeu de données “Base Sirene des entreprises et de leurs établissements”. »
L’assistant utilisera en arrière-plan des tools comme :
- search_datasets : pour trouver les jeux par mots-clés
- get_dataset_info : pour obtenir les métadonnées d’un jeu
- list_dataset_resources : pour voir les fichiers (CSV, etc.) disponibles
Vous obtenez ainsi une short-list de jeux et de ressources pertinents pour la prospection (SIRENE, annuaires, réutilisations B2B, etc.), sans parcourir le site à la main.
Étape 3 : Explorer une ressource et préparer vos critères
Pour un jeu donné, demandez par exemple :
- « Quelles sont les colonnes (champs) de la ressource [nom de la ressource] ? »
- « Donne-moi un extrait des données pour comprendre la structure. »
L’assistant peut s’appuyer sur :
- get_resource_info : métadonnées de la ressource
- query_resource_data : interroger des données tabulaires
- download_and_parse_resource : télécharger et parser un fichier pour l’analyser
Vous en déduisez les critères de prospection exploitables : code NAF/APE, code postal, région, tranche d’effectif, dénomination, etc. — selon ce que le jeu contient réellement.
Étape 4 : Construire votre process de prospection
Avec les jeux et champs identifiés, vous pouvez :
- Définir vos cibles : secteur (NAF), zone géographique, taille (si disponible).
- Noter les identifiants des jeux et ressources utiles sur data.gouv.fr pour les réutiliser ensuite (scripts, API, exports).
- Pour des volumes importants ou des pipelines stables : passer par l’API data.gouv.fr et/ou l’API Sirene (api.insee.fr) pour automatiser les requêtes et respecter les conditions d’usage et les limites.
Le MCP reste un outil de découverte et de prototypage ; il ne remplace pas une intégration API pour un process de prospection industrialisé.
Bonnes pratiques et limites
- Vérifier les sources : les réponses du LLM peuvent être incomplètes ou erronées. Toujours vérifier sur data.gouv.fr les jeux et ressources recommandés.
- Prospection et légalité : pour la base SIRENE et les données à caractère personnel, respectez le droit (ex. article A123-96 du code de commerce, opposition à la prospection). Utilisez uniquement les données diffusibles et les usages autorisés.
- Serveur officiel : privilégiez l’instance https://mcp.data.gouv.fr/mcp et la doc du dépôt datagouv/datagouv-mcp. D’autres serveurs MCP peuvent se réclamer de data.gouv sans être officiels.
- Métriques : le tool get_metrics peut aider à voir quels jeux sont les plus utilisés, utile pour prioriser vos explorations.
Résumé : enchaînement type pour la prospection
- Connecter le MCP data.gouv à votre client (Cursor, Claude, etc.) avec l’URL
https://mcp.data.gouv.fr/mcp. - Rechercher les jeux (SIRENE, entreprises, NAF, secteurs, régions) via des questions en langage naturel.
- Explorer les métadonnées et les ressources des jeux retenus pour comprendre la structure des données.
- Interroger un échantillon de données (query_resource_data / download_and_parse_resource) pour valider les critères de prospection.
- Documenter les jeux et ressources utilisés, puis automatiser si besoin avec l’API data.gouv.fr et l’API Sirene.
En suivant ce how-to, vous pouvez utiliser le MCP data.gouv.fr comme levier pour identifier et préparer vos sources de prospection B2B, tout en restant aligné avec les données ouvertes et les bonnes pratiques. Pour aller plus loin sur l’automatisation ou la stratégie data, découvrez nos services ou contactez-nous.
Prêt à transformer votre entreprise ?
Découvrez comment nos solutions d'automatisation et d'IA peuvent propulser votre croissance.