Conformité7 min de lecture

Peut-on confier des données patients du NHS à une IA sans risque ?

Non : coller des données patients identifiables du NHS dans un ChatGPT grand public n'est pas approuvé et expose à l'ICO et au manquement Caldicott.

Par Pierre de ONYRI

Non. Coller des données patients identifiables du NHS dans un outil d'IA grand public comme ChatGPT n'est pas approuvé, et vous expose à une violation. Ces données de santé sont des « special category data » sous le UK GDPR : la loi britannique sur la protection des données. Elles sont aussi couvertes par la Common Law Duty of Confidentiality et les principes Caldicott. Un outil grand public n'a pas été évalué ni contractualisé pour cet usage. La seule parade sûre : dé-identifier la donnée avant tout usage IA, ou passer par un outil approuvé.

Pourquoi les données patients du NHS sont si protégées

Les données de santé sont des données personnelles sensibles. Sous le UK GDPR, elles font partie des « special category data ». On y trouve aussi l'origine raciale, les données génétiques et les données biométriques d'identification. L'ICO, l'autorité britannique de contrôle, précise pourquoi cette protection est renforcée. Ces données peuvent porter atteinte aux droits fondamentaux ou mener à une discrimination.

La protection ne s'arrête pas là. Le NHS number entre en jeu. C'est un identifiant unique à 10 chiffres attribué à chaque patient en Angleterre, au pays de Galles et sur l'île de Man. Il ne change jamais. C'est donc le moyen le plus fiable d'identifier un patient dans les systèmes électroniques. Le laisser dans un texte envoyé à une IA rend la donnée directement identifiable.

Traiter des données de santé exige deux feux verts, pas un seul. Il faut une base légale au titre de l'article 6 du UK GDPR. Il faut en plus une condition distincte au titre de l'article 9. L'ICO liste dix conditions à l'article 9(2). La santé et le social relèvent de l'article 9(2)(h). Et l'article 9(3) ajoute une garantie : le traitement doit être fait par un professionnel tenu au secret.

Common Law et principes Caldicott : la double serrure

Au-delà du UK GDPR, une seconde règle protège le patient : la Common Law Duty of Confidentiality. Le principe est simple. Quand un patient confie une information à un clinicien, elle est partagée en confiance. On ne peut pas la divulguer sans base légale. Cette base peut être le consentement, une obligation légale, un intérêt public prépondérant, ou une autorité statutaire comme le « section 251 support ». Cette base est distincte de celle du UK GDPR et s'ajoute à elle.

Viennent ensuite les principes Caldicott. Ce sont huit principes publiés par le National Data Guardian sur gov.uk. Ils garantissent que les informations des personnes restent confidentielles et bien utilisées. Ils s'appliquent à toute donnée de santé et de social où le patient est identifiable. Trois d'entre eux comptent ici :

  • Principe 3 : utiliser le minimum d'informations confidentielles nécessaires. Coller un dossier entier dans une IA va à l'encontre de cette règle.
  • Principe 6 : se conformer à la loi. Un outil non approuvé n'offre pas cette garantie.
  • Pour tout jugement nouveau ou difficile, il est recommandé d'impliquer un Caldicott Guardian.
Schéma en deux temps. En haut, un dossier patient NHS avec numéro NHS et nom en clair (ambre) est collé dans un ChatGPT qui reçoit la donnée réelle. En bas, le même dossier dé-identifié ne laisse à l'IA que des jetons (cobalt), avec une coche.
D'après l'ICO (special category data), les principes Caldicott (National Data Guardian / GOV.UK) et NHS England (NHS number).

Un outil grand public n'a pas passé les contrôles NHS

Pour être adopté dans le NHS, un outil numérique doit passer une évaluation. Elle s'appelle le Digital Technology Assessment Criteria (DTAC), porté par la NHS England Transformation Directorate. C'est le cadre d'assurance introduit en 2021. Il couvre même l'IA administrative non classée dispositif médical. Le DTAC évalue cinq domaines :

  1. 1La sécurité clinique.
  2. 2La protection des données.
  3. 3La sécurité technique.
  4. 4L'interopérabilité.
  5. 5L'utilisabilité et l'accessibilité.

Un ChatGPT grand public n'a passé aucune de ces cinq portes. Il n'est ni évalué ni contractualisé pour un usage patient. Il ne satisfait donc pas les critères. Les cadres cités par le NHS le disent aussi. On peut citer la NHS England Confidentiality policy. On peut citer la définition de la Confidential Patient Information (CPI) de NHS England Digital. Et le NHS AI and Digital Regulations Service traite la Common law duty of confidentiality.

Vous pensezLa réalité
« C'est juste un outil, comme une recherche Google »ChatGPT grand public n'est pas approuvé pour des données patients (DTAC non passé)
« Les données de santé sont des données normales »Ce sont des « special category data » sous le UK GDPR
« Le UK GDPR suffit à couvrir le sujet »La Common Law et Caldicott s'ajoutent au UK GDPR
« Je retire le nom, donc c'est anonyme »Zone locale + maladie rare + âge peuvent ré-identifier le patient
Les idées reçues sur les données patients du NHS et l'IA, face aux règles réelles.

La parade : dé-identifier ou passer par un outil approuvé

Deux voies sûres existent. La première : ne jamais saisir d'information personnelle ou sensible dans une IA publique. La seconde : dé-identifier la donnée avant tout usage. Cela veut dire retirer le NHS number, le nom, l'adresse et la date de naissance. Mais attention à un piège. La politique NHS citée avertit qu'une combinaison de détails peut ré-identifier un patient. Une zone géographique locale, plus une maladie rare, plus un âge très jeune : cela suffit parfois, même sans les identifiants habituels. La donnée doit alors être traitée comme personnelle.

L'enjeu n'est pas théorique. Une violation de la confidentialité des données patients peut coûter cher. Elle peut entraîner une action réglementaire, dont celle de l'ICO. Elle peut mener à une action en justice. Elle peut aussi déclencher des procédures disciplinaires internes. Le devoir de confidentialité est inscrit dans les contrats de travail NHS et les codes de conduite professionnels.

C'est précisément le rôle d'ONYRI Sanitize. Le moteur détecte les données sensibles et les remplace par des jetons réversibles avant l'envoi. La détection et le mapping restent dans votre navigateur. Seul un texte anonymisé atteint l'IA. Le NHS number et le nom du patient ne quittent jamais votre poste — l'outil externe ne voit que des jetons.

Questions fréquentes

Peut-on mettre des données patients du NHS dans une IA comme ChatGPT ?
Non, pas des données patients identifiables dans un outil grand public : ce n'est pas approuvé et cela expose à une violation. Ces données de santé sont des « special category data » sous le UK GDPR, aussi protégées par la Common Law Duty of Confidentiality et les principes Caldicott. Dé-identifiez la donnée ou passez par un outil évalué (DTAC).
Le NHS number rend-il un texte identifiable ?
Oui. Le NHS number est un identifiant unique à 10 chiffres qui ne change jamais. C'est le moyen le plus fiable d'identifier un patient dans les systèmes électroniques. Le laisser dans un texte envoyé à une IA rend la donnée directement identifiable — il doit être retiré avant tout usage.
Suffit-il de retirer le nom pour anonymiser un dossier patient ?
Non, pas toujours. Retirez le NHS number, le nom, l'adresse et la date de naissance. Mais une combinaison de détails — zone locale, maladie rare, âge très jeune — peut ré-identifier un patient même sans identifiants directs. Dans ce cas, la donnée reste personnelle et doit être traitée comme telle.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi