Voici les 6 habitudes simples pour utiliser l'IA sans fuiter vos données
La plus efficace : anonymiser les données sensibles avant l'envoi. Voici les 6 habitudes simples pour utiliser l'IA sans fuiter vos données, par impact réel.
La façon la plus sûre d'utiliser l'IA sans fuiter vos données est simple. Prenez une habitude avant tout : anonymisez les données sensibles avant de les envoyer. C'est la seule des six habitudes qui protège le contenu lui-même. Les cinq autres réduisent l'exposition ou limitent la conservation. Elles aident, mais elles n'effacent pas le texte que vous tapez. Voici les six habitudes, classées par impact réel.
Le classement en un coup d'œil
Un rappel d'abord. Une requête envoyée à un LLM public est visible par l'entreprise qui le fournit. Pour ChatGPT, c'est OpenAI. Ces requêtes sont stockées. Le NCSC britannique précise qu'elles serviront presque à coup sûr, un jour, à développer le modèle. Vos habitudes doivent donc agir avant l'envoi.
Voici le classement, du plus fort au plus faible impact :
- 1Anonymiser les données sensibles avant l'envoi (la méthode d'ONYRI Sanitize). Seule habitude qui protège le contenu lui-même.
- 2Ne coller que l'extrait nécessaire. La minimisation réduit ce qui part vers le modèle.
- 3Couper l'entraînement dans les réglages. Vos futurs échanges cessent de nourrir le modèle.
- 4Utiliser le chat temporaire. Hors historique, hors entraînement, mais gardé jusqu'à 30 jours.
- 5Ne jamais téléverser un fichier sensible brut. Son contenu devient une requête stockée et visible.
- 6Relire avant d'envoyer. Rien qui vous gênerait si c'était rendu public.
| Rang | Élément | Pourquoi |
|---|---|---|
| 1 | Anonymiser avant l'envoi (ONYRI) | Protège le contenu lui-même, quel que soit le modèle ou le réglage |
| 2 | Ne coller que l'extrait utile | Moins de données envoyées, moins d'exposition (minimisation RGPD) |
| 3 | Couper l'entraînement | Stoppe l'usage d'entraînement futur, sur tout le compte |
| 4 | Chat temporaire | Hors historique et entraînement, mais gardé jusqu'à 30 jours |
| 5 | Pas de fichier sensible brut | Le contenu du fichier devient une requête stockée et visible |
| 6 | Relire avant d'envoyer | Un filtre final contre la donnée de trop |
En tête : les habitudes qui protègent ce qui part
Habitude n°1 : anonymiser les données sensibles avant l'envoi. C'est le geste d'ONYRI Sanitize. Vous remplacez chaque donnée sensible par un jeton réversible, dans le navigateur. Seul un texte anonymisé part vers le modèle. C'est la seule habitude qui protège le contenu lui-même, pas seulement son stockage. Nous détaillons la marche à suivre dans notre guide pour anonymiser vos données avant d'utiliser l'IA.
Habitude n°2 : ne coller que l'extrait nécessaire. Le RGPD appelle ça la minimisation des données (article 5). Le principe est simple. N'utilisez que la donnée « adéquate, pertinente et limitée » au besoin. L'ICO britannique dit la même chose : gardez le minimum, pas plus. Donc ne collez pas un dossier entier quand trois lignes suffisent. Nous l'expliquons dans notre guide pour écrire des prompts sans fuiter vos données.
Les réglages et réflexes qui limitent l'exposition
Habitude n°3 : couper l'entraînement dans les réglages. Dans ChatGPT, allez dans Réglages, puis Contrôles des données. Désactivez « Improve the model for everyone ». Vos nouvelles conversations cessent alors d'entraîner les modèles d'OpenAI, sur tout le compte. Attention : le réglage ne vaut que pour l'avenir. Vos anciens échanges restent dans l'historique.
Habitude n°4 : utiliser le chat temporaire. Une conversation en chat temporaire n'apparaît pas dans l'historique. Elle ne crée pas de mémoire et ne sert pas à l'entraînement. OpenAI indique toutefois pouvoir la garder jusqu'à 30 jours, pour la sécurité, avant de l'effacer. Autre différence : le chat temporaire se réactive à chaque nouvelle conversation. Le réglage d'entraînement, lui, se fait une fois.
Habitude n°5 : ne jamais téléverser un fichier sensible brut. Le NCSC est clair là-dessus. Le contenu d'un fichier envoyé devient une requête stockée, visible par le fournisseur. Un tableur RH ou un contrat entier expose donc bien plus que nécessaire. Extrayez le passage utile. Anonymisez-le. Puis envoyez ce texte, pas le fichier.
Habitude n°6 : relire avant d'envoyer. Prenez trois secondes. Posez-vous la question du NCSC : « Est-ce que ce message me gênerait s'il devenait public ? » Si oui, retirez la donnée en trop. Le NCSC conseille aussi de lire les conditions et la politique de confidentialité du service avant d'y confier du sensible.
Comment vous en servir
Ces six habitudes se cumulent. Empilez-les dans le bon ordre :
- Anonymisez les données sensibles avant l'envoi — la seule garantie au niveau du contenu.
- Ne collez que l'extrait utile, jamais le dossier complet.
- Coupez l'entraînement dans les Contrôles des données.
- Ouvrez un chat temporaire pour les échanges ponctuels.
- Ne téléversez jamais un fichier sensible brut ; extrayez et anonymisez d'abord.
- Relisez chaque prompt : rien qui vous gênerait s'il devenait public.
C'est le rôle d'ONYRI Sanitize. Le moteur remplace les données sensibles par des jetons réversibles avant l'envoi. La détection et le mapping jeton↔valeur restent dans votre navigateur. Seul un texte anonymisé atteint l'outil. Quel que soit le modèle, il n'y trouve que des jetons — pas vos informations réelles.
Questions fréquentes
- Comment utiliser l'IA sans fuiter vos données ?
- Prenez six habitudes simples. La plus forte : anonymisez les données sensibles avant l'envoi, la seule qui protège le contenu. Ensuite, ne collez que l'extrait utile, coupez l'entraînement, utilisez le chat temporaire, ne téléversez jamais un fichier sensible brut, et relisez chaque prompt avant de l'envoyer.
- Couper l'entraînement suffit-il à protéger mes données ?
- Non. Le réglage « Improve the model for everyone » arrête l'usage d'entraînement futur, sur tout le compte. Mais il ne vaut que pour l'avenir. Il n'efface ni le texte déjà envoyé, ni sa conservation. Seule l'anonymisation avant l'envoi protège le contenu lui-même.
- Puis-je téléverser un fichier sensible dans ChatGPT ?
- Mieux vaut l'éviter. Le NCSC rappelle que le contenu d'un fichier envoyé devient une requête stockée, visible par le fournisseur. Extrayez seulement le passage utile, anonymisez-le, puis envoyez ce texte — pas le fichier brut.
Sources et références
- ChatGPT and large language models: what's the risk? (ne pas mettre de sensible dans un LLM public ; requêtes visibles, stockées et réutilisées pour le modèle) — NCSC (UK National Cyber Security Centre)
- Principle (c): Data minimisation (n'identifier et ne garder que le minimum de données nécessaire) — ICO (UK Information Commissioner's Office)
- Art. 5 GDPR – Principles relating to processing of personal data (minimisation : données adéquates, pertinentes et limitées) — GDPR-info.eu (Intersoft Consulting)
Gardez vos données sensibles dans votre navigateur
ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.
Anonymiser mon prompt