Guide6 min de lecture

Voici les 6 habitudes simples pour utiliser l'IA sans fuiter vos données

La plus efficace : anonymiser les données sensibles avant l'envoi. Voici les 6 habitudes simples pour utiliser l'IA sans fuiter vos données, par impact réel.

Par Pierre de ONYRI

La façon la plus sûre d'utiliser l'IA sans fuiter vos données est simple. Prenez une habitude avant tout : anonymisez les données sensibles avant de les envoyer. C'est la seule des six habitudes qui protège le contenu lui-même. Les cinq autres réduisent l'exposition ou limitent la conservation. Elles aident, mais elles n'effacent pas le texte que vous tapez. Voici les six habitudes, classées par impact réel.

Le classement en un coup d'œil

Un rappel d'abord. Une requête envoyée à un LLM public est visible par l'entreprise qui le fournit. Pour ChatGPT, c'est OpenAI. Ces requêtes sont stockées. Le NCSC britannique précise qu'elles serviront presque à coup sûr, un jour, à développer le modèle. Vos habitudes doivent donc agir avant l'envoi.

Voici le classement, du plus fort au plus faible impact :

  1. 1Anonymiser les données sensibles avant l'envoi (la méthode d'ONYRI Sanitize). Seule habitude qui protège le contenu lui-même.
  2. 2Ne coller que l'extrait nécessaire. La minimisation réduit ce qui part vers le modèle.
  3. 3Couper l'entraînement dans les réglages. Vos futurs échanges cessent de nourrir le modèle.
  4. 4Utiliser le chat temporaire. Hors historique, hors entraînement, mais gardé jusqu'à 30 jours.
  5. 5Ne jamais téléverser un fichier sensible brut. Son contenu devient une requête stockée et visible.
  6. 6Relire avant d'envoyer. Rien qui vous gênerait si c'était rendu public.
RangÉlémentPourquoi
1Anonymiser avant l'envoi (ONYRI)Protège le contenu lui-même, quel que soit le modèle ou le réglage
2Ne coller que l'extrait utileMoins de données envoyées, moins d'exposition (minimisation RGPD)
3Couper l'entraînementStoppe l'usage d'entraînement futur, sur tout le compte
4Chat temporaireHors historique et entraînement, mais gardé jusqu'à 30 jours
5Pas de fichier sensible brutLe contenu du fichier devient une requête stockée et visible
6Relire avant d'envoyerUn filtre final contre la donnée de trop
Classé par impact réel. D'après le NCSC britannique, l'ICO et le RGPD (article 5). Une seule habitude protège le contenu lui-même.

En tête : les habitudes qui protègent ce qui part

Habitude n°1 : anonymiser les données sensibles avant l'envoi. C'est le geste d'ONYRI Sanitize. Vous remplacez chaque donnée sensible par un jeton réversible, dans le navigateur. Seul un texte anonymisé part vers le modèle. C'est la seule habitude qui protège le contenu lui-même, pas seulement son stockage. Nous détaillons la marche à suivre dans notre guide pour anonymiser vos données avant d'utiliser l'IA.

Habitude n°2 : ne coller que l'extrait nécessaire. Le RGPD appelle ça la minimisation des données (article 5). Le principe est simple. N'utilisez que la donnée « adéquate, pertinente et limitée » au besoin. L'ICO britannique dit la même chose : gardez le minimum, pas plus. Donc ne collez pas un dossier entier quand trois lignes suffisent. Nous l'expliquons dans notre guide pour écrire des prompts sans fuiter vos données.

Les réglages et réflexes qui limitent l'exposition

Habitude n°3 : couper l'entraînement dans les réglages. Dans ChatGPT, allez dans Réglages, puis Contrôles des données. Désactivez « Improve the model for everyone ». Vos nouvelles conversations cessent alors d'entraîner les modèles d'OpenAI, sur tout le compte. Attention : le réglage ne vaut que pour l'avenir. Vos anciens échanges restent dans l'historique.

Habitude n°4 : utiliser le chat temporaire. Une conversation en chat temporaire n'apparaît pas dans l'historique. Elle ne crée pas de mémoire et ne sert pas à l'entraînement. OpenAI indique toutefois pouvoir la garder jusqu'à 30 jours, pour la sécurité, avant de l'effacer. Autre différence : le chat temporaire se réactive à chaque nouvelle conversation. Le réglage d'entraînement, lui, se fait une fois.

Habitude n°5 : ne jamais téléverser un fichier sensible brut. Le NCSC est clair là-dessus. Le contenu d'un fichier envoyé devient une requête stockée, visible par le fournisseur. Un tableur RH ou un contrat entier expose donc bien plus que nécessaire. Extrayez le passage utile. Anonymisez-le. Puis envoyez ce texte, pas le fichier.

Habitude n°6 : relire avant d'envoyer. Prenez trois secondes. Posez-vous la question du NCSC : « Est-ce que ce message me gênerait s'il devenait public ? » Si oui, retirez la donnée en trop. Le NCSC conseille aussi de lire les conditions et la politique de confidentialité du service avant d'y confier du sensible.

Schéma en deux temps : en haut, une check-list d'habitudes non suivies (croix ambre) laisse partir un prompt sensible en clair vers le modèle (document ambre lisible) ; en bas, la check-list suivie (coches cobalt) n'envoie que des jetons cobalt, avec une coche.
D'après le NCSC britannique, la guidance de l'ICO sur la minimisation et le RGPD (article 5). Les cinq dernières habitudes réduisent l'exposition ; seule l'anonymisation protège le contenu.

Comment vous en servir

Ces six habitudes se cumulent. Empilez-les dans le bon ordre :

  • Anonymisez les données sensibles avant l'envoi — la seule garantie au niveau du contenu.
  • Ne collez que l'extrait utile, jamais le dossier complet.
  • Coupez l'entraînement dans les Contrôles des données.
  • Ouvrez un chat temporaire pour les échanges ponctuels.
  • Ne téléversez jamais un fichier sensible brut ; extrayez et anonymisez d'abord.
  • Relisez chaque prompt : rien qui vous gênerait s'il devenait public.

C'est le rôle d'ONYRI Sanitize. Le moteur remplace les données sensibles par des jetons réversibles avant l'envoi. La détection et le mapping jeton↔valeur restent dans votre navigateur. Seul un texte anonymisé atteint l'outil. Quel que soit le modèle, il n'y trouve que des jetons — pas vos informations réelles.

Questions fréquentes

Comment utiliser l'IA sans fuiter vos données ?
Prenez six habitudes simples. La plus forte : anonymisez les données sensibles avant l'envoi, la seule qui protège le contenu. Ensuite, ne collez que l'extrait utile, coupez l'entraînement, utilisez le chat temporaire, ne téléversez jamais un fichier sensible brut, et relisez chaque prompt avant de l'envoyer.
Couper l'entraînement suffit-il à protéger mes données ?
Non. Le réglage « Improve the model for everyone » arrête l'usage d'entraînement futur, sur tout le compte. Mais il ne vaut que pour l'avenir. Il n'efface ni le texte déjà envoyé, ni sa conservation. Seule l'anonymisation avant l'envoi protège le contenu lui-même.
Puis-je téléverser un fichier sensible dans ChatGPT ?
Mieux vaut l'éviter. Le NCSC rappelle que le contenu d'un fichier envoyé devient une requête stockée, visible par le fournisseur. Extrayez seulement le passage utile, anonymisez-le, puis envoyez ce texte — pas le fichier brut.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi