La leçon Samsung : coller des données internes dans l'IA
En 2023, des ingénieurs Samsung ont collé du code source et des notes de réunion confidentiels dans ChatGPT. Trois fuites en trois semaines. Ce que l'incident apprend à toute équipe.
En 2023, des ingénieurs de Samsung ont collé du code source confidentiel et des notes de réunion internes dans ChatGPT pour gagner du temps. En l'espace de quelques semaines, plusieurs fuites de ce type ont été repérées, et l'entreprise a réagi en restreignant les outils d'IA générative sur ses appareils et réseaux. La leçon n'est pas « l'IA est dangereuse » : c'est que coller un contenu sensible dans un outil externe le fait sortir de votre périmètre de contrôle — et qu'une fois parti, on ne peut plus le rappeler.
Ce qui s'est passé
Peu après avoir autorisé ChatGPT dans une division, Samsung a constaté, d'après les comptes rendus de presse, trois épisodes distincts de fuite de données confidentielles via l'outil :
- 1un ingénieur colle du code source propriétaire dans ChatGPT pour y traquer une erreur ;
- 2un autre soumet du code lié à des équipements pour obtenir des optimisations ;
- 3un troisième fait résumer le compte rendu d'une réunion interne enregistrée.
Dans chaque cas, le contenu sensible a quitté l'entreprise pour les serveurs d'un tiers. Selon la presse, Samsung a ensuite restreint l'usage des IA génératives externes sur ses appareils, en pointant un problème central : une fois la donnée transmise, il est difficile de la « récupérer et de la supprimer », et elle pourrait être exposée à d'autres.
Pourquoi le copier-coller est le maillon faible
Un copier-coller est instantané, invisible et irréversible. Il ne déclenche aucune alerte, ne laisse pas l'utilisateur relire ce qu'il expose, et transmet le texte exact — identités, identifiants, secrets compris. C'est précisément pour ça qu'une grande entreprise a pu fuiter trois fois en quelques semaines : non par malveillance, mais parce que l'outil pratique et le geste risqué sont le même geste.
La bonne leçon (pas « interdire l'IA »)
Bannir l'IA prive les équipes d'un gain réel et pousse à l'IA fantôme — les gens l'utilisent quand même, sur leur téléphone perso, hors de tout cadre. La bonne réponse est de garder l'outil et de neutraliser le geste : faire en sorte que le contenu sensible ne parte jamais en clair.
- Anonymiser avant l'envoi : remplacer noms, code, identifiants et secrets par des jetons réversibles.
- Garder la correspondance jeton↔valeur côté utilisateur, jamais sur le serveur du modèle.
- Restaurer la réponse en local, pour garder un texte exploitable sans avoir exposé l'original.
| Réflexe risqué | Réflexe sûr |
|---|---|
| Coller le code source brut pour le déboguer | Coller le code avec secrets et identifiants remplacés par des jetons |
| Soumettre un compte rendu nominatif | Soumettre le compte rendu avec noms et clients tokenisés |
| Espérer que le fournisseur ne conserve rien | Ne jamais envoyer la donnée réelle |
C'est l'approche d'ONYRI Sanitize : le moteur détecte les données sensibles dans votre texte et les remplace par des jetons réversibles avant l'envoi à l'IA ; la détection et le mapping restent dans votre navigateur, et seule une version anonymisée est transmise. Vos équipes gardent la vitesse de l'IA, sans rejouer la leçon Samsung.
Questions fréquentes
- Que s'est-il vraiment passé chez Samsung avec ChatGPT ?
- Selon la presse (2023), des employés ont collé du code source propriétaire et des notes de réunion internes dans ChatGPT lors d'épisodes distincts. L'entreprise a ensuite restreint l'usage des IA génératives externes sur ses appareils et réseaux.
- Faut-il interdire ChatGPT au travail ?
- Interdire pousse surtout à l'usage clandestin, hors de tout cadre. Il est plus efficace de garder l'outil mais d'anonymiser le contenu sensible avant l'envoi, pour qu'aucune donnée réelle ne quitte votre contrôle.
- Comment éviter ce type de fuite dans mon équipe ?
- En neutralisant le geste de copier-coller : un moteur d'anonymisation détecte noms, code, identifiants et secrets et les remplace par des jetons réversibles avant l'envoi, la correspondance restant côté utilisateur.
Sources et références
Gardez vos données sensibles dans votre navigateur
ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.
Anonymiser mon prompt