Outils & IA9 min de lecture

ChatGPT, Claude ou Gemini en entreprise : confidentialité et conformité

ChatGPT Team, Claude Enterprise et Gemini for Workspace n'entraînent pas sur vos contenus par défaut. Comparaison B2B : DPA, BAA, rétention, certifications.

Par Pierre de ONYRI

Pour une entreprise, la vraie question n'est pas « ChatGPT, Claude ou Gemini ? » mais « quel palier ? ». Sur les comptes grand public, vos contenus peuvent alimenter l'entraînement des modèles ; sur les offres professionnelles — ChatGPT Team/Enterprise, Claude Team/Enterprise, Gemini for Workspace — l'entraînement par défaut sur vos contenus n'a pas lieu, et un DPA, des certifications et (selon les cas) un BAA HIPAA deviennent disponibles. C'est la bascule décisive du risque côté fournisseur. Mais aucune de ces offres ne rend le risque nul : la donnée quitte malgré tout votre environnement. La seule garantie au niveau du contenu reste de retirer le sensible avant l'envoi.

La vraie ligne de partage : le palier, pas la marque

Comparer ChatGPT, Claude et Gemini « en général » mène à de fausses conclusions, parce que le même fournisseur applique des règles radicalement différentes selon le palier. Sur un compte grand public ou gratuit, les contenus peuvent servir à entraîner les modèles — c'est précisément le terrain du « Shadow AI », quand les employés utilisent leurs comptes personnels faute de plan d'entreprise. Sur les offres professionnelles, l'entraînement par défaut disparaît : OpenAI indique que les données métier de ChatGPT Team, ChatGPT Enterprise et de l'API ne servent pas par défaut à entraîner ses modèles (le partage pour l'entraînement via l'API est un opt-in explicite, désactivé par défaut). Anthropic affirme que, par défaut, elle n'utilise ni les entrées ni les sorties de ses produits commerciaux (Claude for Work/Team, API, Claude Gov) pour entraîner ses modèles — la seule exception étant un opt-in volontaire (par ex. cliquer un pouce haut/bas), auquel cas la conversation peut être conservée jusqu'à 5 ans après dissociation des identifiants. Google précise que dans Workspace, les prompts sont des données client couvertes par le Cloud Data Processing Addendum, non utilisées pour entraîner ses modèles sans permission, ni relues par des humains hors de votre domaine.

DPA, BAA et certifications : ce qui couvre la conformité

Trois leviers contractuels comptent pour une DSI ou un DPO. Le DPA (Data Processing Addendum) d'abord, exigé par le RGPD dès qu'on traite des données de résidents UE : les trois fournisseurs en proposent un pour leurs services professionnels. OpenAI signe un DPA et supporte les Clauses Contractuelles Types ; Anthropic incorpore automatiquement son DPA (avec CCT) dans ses Commercial Terms ; chez Google, Gemini dans Workspace bénéficie automatiquement du Cloud Data Processing Addendum car classé comme service Core. Nous détaillons cette obligation dans « Faut-il un DPA pour utiliser l'IA au travail ? ».

Le BAA (Business Associate Agreement) ensuite, indispensable pour traiter des données de santé soumises à HIPAA aux États-Unis — et dont la couverture varie fortement d'une brique à l'autre. OpenAI propose un BAA pour ChatGPT for Healthcare, l'API et, sur compte géré par les ventes, ChatGPT Enterprise/Edu, mais pas pour ChatGPT Business. Anthropic propose un BAA couvrant l'API first-party et les plans Enterprise (configuration HIPAA-ready activable en self-service, BAA en click-to-accept), mais pas Free/Pro/Max/Team ni le Workbench/Console. Côté Google, Vertex AI et Gemini Enterprise proposent un BAA HIPAA, mais certaines briques (NotebookLM, Gemini dans Chrome) n'en bénéficient pas. La règle pratique : vérifier la couverture exacte du produit, pas seulement celle du fournisseur.

Les certifications enfin, signal d'audit indépendant. OpenAI déclare un examen SOC 2 Type 2 et des certifications ISO/IEC 27001:2022, 27017, 27018, 27701 ainsi qu'ISO/IEC 42001:2023 (management de l'IA) pour l'API, ChatGPT Enterprise et Edu. Anthropic détient ISO/IEC 27001:2022, ISO 42001 et SOC 2 Type I & II. Google annonce pour Gemini SOC 1/2/3, ISO 9001, ISO/IEC 27001, 27701, 27017, 27018 et 42001, plus FedRAMP High. Les trois jouent dans la même cour ; les écarts se lisent au cas par cas, pas en hiérarchie de marque.

Rétention, zéro rétention et résidence des données

Sur l'API d'OpenAI comme sur celle d'Anthropic, les entrées/sorties sont par défaut supprimées sous environ 30 jours (conservation bornée pour la surveillance des abus et le débogage). La « zéro rétention de données » (ZDR) existe, mais reste conditionnée à une approbation et limitée à certains points d'accès éligibles : ce n'est pas un simple interrupteur, et beaucoup d'organisations restent donc sur la rétention par défaut. Côté résidence, OpenAI propose le stockage au repos du contenu client dans plusieurs régions (UE, Royaume-Uni, États-Unis, Japon, Canada, etc.) pour les clients éligibles. Google a ouvert (à partir du 9 juin 2025) le support des data regions pour les fonctions Gemini de Workspace — traitement UE, US ou les deux, contrôlable jusqu'au niveau de l'unité organisationnelle, réservé aux éditions Enterprise Plus et add-ons Assured Controls ; le stockage au repos peut être régionalisé même si l'inférence peut impliquer l'infrastructure mondiale de Google. Vertex AI propose aussi des contrôles de résidence régionaux.

Voici les principales dimensions entreprise, une offre par ligne. Ce comparatif décrit les offres professionnelles ; les comptes grand public diffèrent, et nous les comparons dans « Quel chatbot IA respecte le plus la vie privée ? ».

Offre proEntraînement par défautDPABAA (santé US)Rétention API / ZDR
ChatGPT Team / Enterprise / API (OpenAI)Non par défaut (opt-in API explicite)Oui (signé, + CCT)Healthcare, API, Enterprise/Edu (pas Business)~30 j par défaut ; ZDR sur approbation
Claude Team / Enterprise / API (Anthropic)Non par défaut (exception : opt-in feedback)Oui (auto dans Commercial Terms, + CCT)API + Enterprise (pas Free/Pro/Max/Team)~30 j par défaut ; ZDR sur approbation
Gemini for Workspace / Vertex AI (Google)Non sans permission (prompts sous DPA)Oui (Cloud DPA, auto pour service Core)Vertex AI + Gemini Enterprise (pas NotebookLM, Gemini dans Chrome)Contrôles selon édition ; résidence régionale
Offres professionnelles. D'après le Privacy Center d'Anthropic, le Privacy Hub de Google Workspace et le guide Usercentrics. Les comptes grand public diffèrent. Vérifiez toujours la couverture exacte du produit visé.
Schéma : en haut, un prompt contenant des données sensibles (ambre) atteint trois offres pro d'IA (cartes sombres) qui reçoivent la donnée exposée ; en bas, le même prompt anonymisé ne laisse passer que des jetons (cobalt) vers ces mêmes offres, avec une coche de validation.
D'après le Privacy Center d'Anthropic, le Privacy Hub de Google Workspace et le guide Usercentrics. Les contrôles pro réduisent le risque côté fournisseur ; l'anonymisation du contenu, elle, reste constante quelle que soit l'offre.

La limite commune — et la garantie au niveau du contenu

Aucune de ces offres pro ne rend le risque nul. Les contrôles — pas d'entraînement par défaut, DPA, BAA, rétention bornée, certifications, résidence — réduisent le risque côté fournisseur, mais le contenu sensible quitte malgré tout votre environnement et transite chez un tiers, souvent avec une rétention d'environ 30 jours. Anonymiser ou tokeniser les données sensibles en amont garantit le contenu indépendamment du palier choisi — et permet même d'utiliser des comptes grand public sans exposer le sensible, puisque l'outil ne reçoit que des jetons.

  1. 1Bannir le Shadow AI : aucun usage pro sur des comptes personnels gratuits — c'est là que les contenus alimentent l'entraînement.
  2. 2Choisir le palier adapté (Team/Enterprise/API/Workspace/Vertex) et vérifier au niveau du produit le DPA, le BAA si santé, et les certifications.
  3. 3Cadrer la rétention : demander la ZDR sur les points d'accès éligibles, sinon prévoir une rétention par défaut d'environ 30 jours.
  4. 4Anonymiser le sensible en amont — la seule mesure qui tient quel que soit l'outil, le palier ou la décision de justice.
  • Le palier pèse plus que la marque : pro = pas d'entraînement par défaut ; grand public = potentiellement si.
  • Le BAA et la résidence se vérifient par produit, pas par fournisseur — la couverture varie d'une brique à l'autre.
  • La donnée quitte votre environnement dans tous les cas : seul un contenu déjà anonymisé est réellement à l'abri.

C'est exactement le rôle d'ONYRI Sanitize : le moteur remplace les données sensibles par des jetons réversibles avant l'envoi ; la détection et le mapping jeton↔valeur restent dans votre navigateur, et seul un texte anonymisé atteint le modèle. Que vous passiez par ChatGPT Team, Claude Enterprise, Gemini for Workspace ou même un compte grand public, l'outil n'y trouve que des jetons — pas vos informations réelles. Pour aller plus loin : « Un plan IA entreprise garde-t-il vos données privées ? » et « Faut-il un DPA pour utiliser l'IA au travail ? ».

Questions fréquentes

ChatGPT, Claude ou Gemini : lequel pour une entreprise sur la confidentialité ?
Aucun n'est intrinsèquement « le plus sûr » — l'écart décisif est le palier, pas la marque. Sur les offres pro (ChatGPT Team/Enterprise, Claude Team/Enterprise, Gemini for Workspace), aucun n'entraîne ses modèles sur vos contenus par défaut, et tous proposent un DPA et des certifications (SOC 2, ISO 27001/42001). Comparez plutôt au cas par cas le BAA si vous traitez des données de santé, la rétention API et la résidence. Mais la donnée quitte votre environnement dans tous les cas : anonymiser le sensible avant l'envoi reste la garantie au niveau du contenu.
Les offres pro d'IA s'entraînent-elles sur nos données métier ?
Non par défaut. OpenAI indique que les données de ChatGPT Team, Enterprise et de l'API ne servent pas par défaut à l'entraînement (opt-in API explicite). Anthropic n'utilise pas par défaut les entrées/sorties de ses produits commerciaux, sauf opt-in volontaire (un feedback pouce haut/bas). Google n'utilise pas les prompts Workspace pour entraîner ses modèles sans permission. C'est l'inverse des comptes grand public, où l'entraînement peut être actif par défaut.
Qui propose un BAA HIPAA pour les données de santé ?
Les trois, mais la couverture varie par produit. OpenAI propose un BAA pour ChatGPT for Healthcare, l'API et ChatGPT Enterprise/Edu (compte géré par les ventes), mais pas pour ChatGPT Business. Anthropic couvre l'API first-party et les plans Enterprise (HIPAA-ready en self-service), mais pas Free/Pro/Max/Team ni le Workbench. Côté Google, Vertex AI et Gemini Enterprise proposent un BAA, mais NotebookLM et Gemini dans Chrome non. Vérifiez toujours la brique exacte avant de traiter des données de santé.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi