Guide7 min de lecture

Comment rédiger des prompts IA sans divulguer de données sensibles

Pour utiliser ChatGPT sans divulguer de données personnelles, gardez le sensible hors du prompt : généralisez, collez l'essentiel, vérifiez avant l'envoi.

Par Pierre de ONYRI

Pour utiliser ChatGPT ou un autre assistant sans divulguer de données personnelles, la règle tient en une phrase : ne mettez pas la partie sensible dans le prompt. La CNIL le dit clairement — un utilisateur ne doit jamais saisir d'information confidentielle (données personnelles, données couvertes par un secret) dans un service d'IA grand public. Concrètement, vous pouvez presque toujours reformuler la demande pour qu'elle reste utile sans contenir un seul nom, numéro ou secret : généralisez les identités, ne collez que l'extrait nécessaire, séparez la donnée de la tâche, et relisez le prompt avant de l'envoyer.

Pourquoi « je colle tout » est le mauvais réflexe

Coller le document entier paraît plus simple, mais une fois le texte envoyé, vous n'en contrôlez plus rien. Sur un compte grand public, le contenu est traité sur des serveurs distants, peut être conservé par le fournisseur, relu par des humains pour faire respecter les règles ou améliorer le service, et — sauf opt-out dans les contrôles de données — utilisé pour l'entraînement. « Je le supprimerai après » n'est pas une parade fiable : la rétention n'est pas toujours sous votre contrôle. En 2025, une ordonnance de préservation dans le litige New York Times c. OpenAI a contraint OpenAI à conserver des logs ChatGPT qui auraient normalement été effacés. La seule protection durable est de ne jamais exposer la valeur sensible au départ.

Le principe : minimiser ce qui sort de chez vous

Le RGPD pose le principe de minimisation (article 5(1)(c)) : les données personnelles doivent être « adéquates, pertinentes et limitées à ce qui est nécessaire ». L'ICO britannique formule la même idée — ne traiter que le minimum de données nécessaire à chaque finalité — et en tire un bénéfice très concret : moins vous détenez ou exposez de données, moins il y a à perdre en cas de fuite. Appliqué à un prompt, cela donne une règle directe : n'incluez pas une donnée personnelle « au cas où ». Ne collez que l'extrait strictement utile à la tâche, pas le document complet.

Quand vous avez besoin que le modèle garde une cohérence (« le client », « le fournisseur », « le projet ») sans connaître les identités réelles, remplacez chaque identifiant direct par un marqueur cohérent — par exemple « Jean Dupont, 06 12 34 56 78 » devient « un client » ou « CLIENT_1 ». C'est la logique de la pseudonymisation, reconnue par le RGPD comme mesure technique au service de la minimisation : on remplace les identifiants directs par des marqueurs, en gardant la correspondance de côté, stockée séparément et de façon sécurisée. Le modèle reçoit assez de structure pour faire le travail, jamais l'identité réelle.

Six habitudes pour un prompt utile et sûr

Ces techniques se transforment en réflexes de rédaction. Avant chaque envoi :

  • Généralisez : remplacez les identités et détails précis par des termes vagues — un secteur plutôt qu'une société nommée, une ville plutôt qu'une adresse complète (un conseil que reprend la Mozilla Foundation).
  • Utilisez des placeholders cohérents et réversibles : CLIENT_1, FOURNISSEUR_A, MONTANT_X, en gardant la correspondance hors du prompt pour réinjecter les vraies valeurs dans la réponse.
  • Séparez la donnée de la tâche : décrivez ce que vous voulez (« reformule ce courrier de relance ») sans y coller les coordonnées du destinataire.
  • Minimisez l'extrait : ne collez que le passage nécessaire, pas le fichier entier — et ne téléversez pas le document brut « pour gagner du temps ».
  • N'introduisez pas les données d'autrui : évitez de saisir les informations personnelles de tiers (collègues, clients) que vous n'êtes pas autorisé à partager.
  • Vérifiez avant d'envoyer : relisez le prompt et confirmez qu'il ne reste ni nom, ni numéro, ni e-mail, ni adresse, ni secret en clair.

Ces habitudes ne sont pas qu'individuelles. La CNIL recommande de fournir des modèles de saisie ou des pré-prompts qui orientent l'utilisateur vers des tâches bien identifiées, et de responsabiliser les équipes par la formation pour qu'elles sachent quelles catégories de données sont à proscrire avant même d'ouvrir l'outil. Une structure partagée bat toujours le « chacun colle ce qu'il veut ».

Avant / après : le même besoin, sans la fuite

Le tableau ci-dessous oppose un prompt risqué (« je colle tout ») à sa version sûre, pour des tâches courantes. La réponse du modèle reste tout aussi exploitable :

Prompt risquéPrompt sûr
« Rédige une relance pour Jean Dupont, jean.dupont@acme.fr, 06 12 34 56 78, qui doit 4 200 € depuis le 12 mai. »« Rédige une relance pour CLIENT_1 qui doit MONTANT_X depuis ÉCHÉANCE_Y. » (correspondance gardée hors du prompt)
Coller le contrat PDF entier pour faire résumer une seule clause.Coller uniquement la clause concernée, identités remplacées par « la Partie A » / « la Partie B ».
« Corrige ce bout de code » avec la clé API et l'URL interne en clair.« Corrige ce bout de code » avec la clé remplacée par CLE_API et l'URL par SERVICE_INTERNE.
« Résume ce compte rendu de réunion » en collant le transcript nominatif complet.Résumer l'extrait utile, participants notés « R1, R2 », sujets sensibles laissés de côté.
Même tâche, réponse aussi utile, zéro identité en clair. Inspiré du principe de minimisation (RGPD, ICO) et des conseils de la CNIL et de la Mozilla Foundation.
Schéma : en haut, un prompt « tout collé » contient des données personnelles en clair (ambre) et l'IA les reçoit telles quelles ; en bas, le même prompt généralisé ne laisse passer que des jetons cohérents (cobalt) avec une coche de vérification avant l'envoi.
D'après le principe de minimisation (RGPD art. 5(1)(c), ICO), les recommandations de la CNIL et de la Mozilla Foundation, et l'incident Samsung rapporté en 2023.

La routine en 5 étapes (et sa limite)

Pour ancrer le réflexe, suivez toujours le même ordre avant d'envoyer un prompt :

  1. 1Séparez la donnée sensible de la tâche : posez d'abord la consigne, puis regardez ce qui doit vraiment l'accompagner.
  2. 2Généralisez les identités et détails précis (noms, coordonnées, adresses).
  3. 3Remplacez ce qui doit rester traçable par des placeholders cohérents, correspondance gardée hors du prompt.
  4. 4Réduisez à l'extrait minimal nécessaire, sans téléverser le document brut.
  5. 5Relisez une dernière fois : aucun nom, numéro, e-mail, adresse ou secret ne doit subsister avant l'envoi.

Ces habitudes réduisent fortement l'exposition, mais elles ont une limite : elles reposent sur votre vigilance, à chaque prompt, sous pression de temps. Un identifiant oublié dans un long extrait suffit à rouvrir la brèche. L'automatisation — détecter puis tokeniser systématiquement — supprime ce risque à l'échelle, y compris les cas qu'un relecteur humain manquerait. C'est la différence entre une bonne habitude et une garantie. Pour la méthode complète et l'outillage, voyez notre guide « Comment anonymiser ses données avant d'utiliser l'IA » ; et pour comprendre pourquoi même des personnes prudentes finissent par coller des données, « Pourquoi les gens prudents collent quand même leurs données dans l'IA ».

C'est précisément le rôle d'ONYRI Sanitize : le moteur repère les noms, numéros, adresses et secrets, et les remplace par des jetons cohérents et réversibles avant l'envoi ; la détection et le mapping jeton↔valeur restent dans votre navigateur, et seul un texte anonymisé atteint l'IA. Vos habitudes de rédaction restent utiles — l'outil les rend systématiques, jusqu'à l'identifiant que l'œil aurait laissé passer.

Questions fréquentes

Comment utiliser ChatGPT sans partager de données personnelles ?
Ne mettez pas la donnée personnelle dans le prompt. Généralisez les identités (« un client » au lieu d'un nom), remplacez ce qui doit rester cohérent par des placeholders réversibles, ne collez que l'extrait nécessaire plutôt que le document entier, et relisez le prompt avant l'envoi. La CNIL recommande de ne jamais saisir d'information confidentielle dans un service d'IA grand public.
Est-ce risqué de coller tout un document dans un prompt ?
Oui. Une fois le texte envoyé, vous n'en contrôlez plus le traitement : il peut être conservé, relu par des humains et, sauf opt-out, utilisé pour l'entraînement. Le principe de minimisation (RGPD, ICO) impose de ne fournir que le strict nécessaire — collez la clause ou le passage utile, jamais le fichier brut entier.
Un placeholder comme CLIENT_1 suffit-il à protéger mes données ?
Remplacer un identifiant direct par un placeholder cohérent relève de la pseudonymisation, reconnue par le RGPD comme mesure de minimisation : le modèle reçoit la structure sans l'identité réelle, à condition de garder la correspondance hors du prompt. Fait à la main, le risque est d'en oublier un ; un moteur de détection automatique couvre aussi les cas qu'on manquerait.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi