Tous les articles
Guide6 min de lecture

Un faux nom suffit-il à protéger vos données dans l'IA ?

Remplacer le nom par un pseudo avant ChatGPT paraît malin, mais ça protège rarement. Pourquoi le faux nom manuel échoue, et ce qui marche vraiment.

Par Pierre de ONYRI

Remplacer un nom par un pseudonyme avant de coller un texte dans ChatGPT, Claude ou Gemini ne protège que rarement, pour deux raisons : on finit par arrêter de le faire pour gagner du temps, et le reste du texte (date de naissance, adresse, montant, pathologie rare) suffit souvent à ré-identifier la personne. La protection fiable consiste à remplacer automatiquement tous les identifiants par des jetons réversibles côté navigateur — pas à changer un nom à la main.

Pourquoi le faux nom paraît suffisant

L'intuition est logique : si le nom n'apparaît plus, la donnée ne pointe plus vers personne. Sur un thread où un professionnel s'inquiétait de voir des collègues coller des données patients dans une IA, un commentaire résumait l'idée : « tant qu'ils mettent un nom fictif, rien ne relie au vrai patient, ça devrait aller ». L'erreur est de croire que l'identité tient dans le seul nom.

Schéma : une identité masquée à la main par une étiquette qui glisse et laisse fuir une donnée, opposée à un jeton verrouillé et complet.
Le faux nom posé à la main glisse et laisse fuir le reste ; le jeton couvre tout et reste réversible côté navigateur.

La ré-identification ne s'arrête pas au nom

Une personne se ré-identifie par recoupement. Retirer le nom mais laisser le reste, c'est laisser une empreinte : il suffit souvent de quelques attributs pour retomber sur un individu unique.

  • Date de naissance + code postal + sexe : ce trio identifie une part importante d'une population.
  • Une pathologie rare, une date d'hospitalisation, un employeur précis : autant de pointeurs uniques.
  • Numéros qui « ne sont pas un nom » mais identifient : sécurité sociale, dossier, IBAN, plaque.
  • Le contexte lui-même : un cas décrit en détail peut ne correspondre qu'à une seule personne.

Le vrai problème : c'est manuel, donc on arrête

Même en s'y tenant, le masquage manuel a une faille humaine. Le même thread la pointe sans détour : « certains le font au début, puis pour gagner du temps, ils arrêtent ». Un réflexe qui dépend de la discipline de chacun, à chaque message, n'est pas une protection — c'est une intention. La donnée la plus sensible part le jour où l'on est pressé.

Ce qui marche : tokeniser tous les identifiants, automatiquement

  1. 1Détection : un moteur repère tous les identifiants — nom, mais aussi date, adresse, numéros, montants.
  2. 2Tokenisation : chacun est remplacé par un jeton neutre et cohérent, conservé en mémoire locale.
  3. 3Envoi : seul le texte tokenisé part vers l'IA — plus rien ne pointe vers une personne réelle.
  4. 4Restauration : la réponse est détokenisée dans votre navigateur, rattachée aux bonnes valeurs.

ONYRI Sanitize fait exactement cela : il détecte l'ensemble des identifiants (pas seulement le nom), les remplace par des jetons réversibles et garde le mapping côté navigateur. Le faux nom posé à la main devient inutile — la protection ne dépend plus de votre vigilance à chaque prompt.

Questions fréquentes

Un faux nom rend-il mes données anonymes au sens du RGPD ?
Non. Changer le nom produit une donnée « pseudonymisée » : tant que la personne reste ré-identifiable (par recoupement ou via une table de correspondance), c'est une donnée personnelle protégée par le RGPD. L'anonymisation au sens légal exige que la ré-identification soit devenue déraisonnablement difficile.
Il suffit de changer le nom ET la date de naissance, non ?
Toujours pas de façon fiable. La ré-identification vient des recoupements : adresse, code postal, pathologie rare, numéros, contexte. Retirer deux champs laisse souvent assez d'indices. Mieux vaut un moteur qui détecte et masque l'ensemble des identifiants.
Avec des jetons, l'IA peut-elle encore m'aider ?
Oui. Les jetons sont cohérents : la même valeur reçoit toujours le même jeton, donc le modèle suit le raisonnement et la structure. Après restauration côté navigateur, vous récupérez une réponse complète, rattachée aux vraies valeurs.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi