Tous les articles
Guide5 min de lecture

La leçon Samsung : coller des données internes dans l'IA

En 2023, des ingénieurs Samsung ont collé du code source et des notes de réunion confidentiels dans ChatGPT. Trois fuites en trois semaines. Ce que l'incident apprend à toute équipe.

Par Pierre de ONYRI

En 2023, des ingénieurs de Samsung ont collé du code source confidentiel et des notes de réunion internes dans ChatGPT pour gagner du temps. En l'espace de quelques semaines, plusieurs fuites de ce type ont été repérées, et l'entreprise a réagi en restreignant les outils d'IA générative sur ses appareils et réseaux. La leçon n'est pas « l'IA est dangereuse » : c'est que coller un contenu sensible dans un outil externe le fait sortir de votre périmètre de contrôle — et qu'une fois parti, on ne peut plus le rappeler.

Ce qui s'est passé

Peu après avoir autorisé ChatGPT dans une division, Samsung a constaté, d'après les comptes rendus de presse, trois épisodes distincts de fuite de données confidentielles via l'outil :

  1. 1un ingénieur colle du code source propriétaire dans ChatGPT pour y traquer une erreur ;
  2. 2un autre soumet du code lié à des équipements pour obtenir des optimisations ;
  3. 3un troisième fait résumer le compte rendu d'une réunion interne enregistrée.

Dans chaque cas, le contenu sensible a quitté l'entreprise pour les serveurs d'un tiers. Selon la presse, Samsung a ensuite restreint l'usage des IA génératives externes sur ses appareils, en pointant un problème central : une fois la donnée transmise, il est difficile de la « récupérer et de la supprimer », et elle pourrait être exposée à d'autres.

Schéma : un document confidentiel (ambre) sort d'un bâtiment d'entreprise par une flèche vers un nuage externe (sombre) ; la flèche de retour est barrée — on ne peut pas rappeler la donnée. Trois points marquent trois incidents.
D'après les comptes rendus de TechCrunch, CNBC et Fortune (mai 2023) sur l'incident Samsung.

Pourquoi le copier-coller est le maillon faible

Un copier-coller est instantané, invisible et irréversible. Il ne déclenche aucune alerte, ne laisse pas l'utilisateur relire ce qu'il expose, et transmet le texte exact — identités, identifiants, secrets compris. C'est précisément pour ça qu'une grande entreprise a pu fuiter trois fois en quelques semaines : non par malveillance, mais parce que l'outil pratique et le geste risqué sont le même geste.

La bonne leçon (pas « interdire l'IA »)

Bannir l'IA prive les équipes d'un gain réel et pousse à l'IA fantôme — les gens l'utilisent quand même, sur leur téléphone perso, hors de tout cadre. La bonne réponse est de garder l'outil et de neutraliser le geste : faire en sorte que le contenu sensible ne parte jamais en clair.

  • Anonymiser avant l'envoi : remplacer noms, code, identifiants et secrets par des jetons réversibles.
  • Garder la correspondance jeton↔valeur côté utilisateur, jamais sur le serveur du modèle.
  • Restaurer la réponse en local, pour garder un texte exploitable sans avoir exposé l'original.
Réflexe risquéRéflexe sûr
Coller le code source brut pour le déboguerColler le code avec secrets et identifiants remplacés par des jetons
Soumettre un compte rendu nominatifSoumettre le compte rendu avec noms et clients tokenisés
Espérer que le fournisseur ne conserve rienNe jamais envoyer la donnée réelle
Même outil, même tâche — mais le contenu sensible ne quitte pas votre contrôle.

C'est l'approche d'ONYRI Sanitize : le moteur détecte les données sensibles dans votre texte et les remplace par des jetons réversibles avant l'envoi à l'IA ; la détection et le mapping restent dans votre navigateur, et seule une version anonymisée est transmise. Vos équipes gardent la vitesse de l'IA, sans rejouer la leçon Samsung.

Questions fréquentes

Que s'est-il vraiment passé chez Samsung avec ChatGPT ?
Selon la presse (2023), des employés ont collé du code source propriétaire et des notes de réunion internes dans ChatGPT lors d'épisodes distincts. L'entreprise a ensuite restreint l'usage des IA génératives externes sur ses appareils et réseaux.
Faut-il interdire ChatGPT au travail ?
Interdire pousse surtout à l'usage clandestin, hors de tout cadre. Il est plus efficace de garder l'outil mais d'anonymiser le contenu sensible avant l'envoi, pour qu'aucune donnée réelle ne quitte votre contrôle.
Comment éviter ce type de fuite dans mon équipe ?
En neutralisant le geste de copier-coller : un moteur d'anonymisation détecte noms, code, identifiants et secrets et les remplace par des jetons réversibles avant l'envoi, la correspondance restant côté utilisateur.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi