Tous les articles
Guide6 min de lecture

Anonymiser un Excel ou CSV avant de l'analyser avec l'IA

Un tableur d'export RH, clients ou finance contient des dizaines de données personnelles par ligne. Comment l'analyser avec l'IA sans tout exposer.

Par Alexis de ONYRI

Pour analyser un fichier Excel ou CSV avec l'IA sans exposer de données sensibles, anonymisez les colonnes identifiantes avant l'envoi : chaque valeur (nom, e-mail, téléphone, IBAN…) est remplacée par un jeton cohérent, l'IA produit son analyse sur les jetons, et vous restaurez les vraies valeurs côté navigateur. L'analyse reste exacte ; les personnes derrière les lignes ne sont jamais exposées.

Pourquoi un tableur est un cas à risque

Un export RH, client ou comptable concentre des données personnelles par colonnes entières et par centaines de lignes. Le coller tel quel dans un assistant, c'est transmettre un fichier directement réutilisable pour ré-identifier des personnes — exactement ce que le principe de minimisation cherche à éviter.

  • Colonnes identité : nom, prénom, e-mail, téléphone, adresse.
  • Colonnes financières : IBAN, salaire, identifiant fiscal.
  • Colonnes RH : matricule, statut, données de santé éventuelles.
  • Recoupements : même anonymisées en surface, des colonnes croisées ré-identifient.

La méthode, colonne par colonne

  1. 1Repérez les colonnes identifiantes (directes et indirectes).
  2. 2Tokenisez : une même valeur reçoit toujours le même jeton (les agrégats restent justes).
  3. 3Lancez votre analyse (résumé, tendance, catégorisation) sur le texte tokenisé.
  4. 4Restaurez la sortie côté navigateur pour relier les résultats aux vraies lignes.

Garder l'analyse exacte

Le but n'est pas de dégrader la donnée mais de retirer l'identifiant. Les montants, dates et catégories peuvent rester (selon votre besoin), tandis que les identités deviennent des jetons. Vous obtenez une analyse fidèle sans transmettre qui est qui.

La Section Tableaux d'ONYRI Sanitize applique ce flux à grande échelle (traitement par Web Worker au-delà de 1000 lignes), avec une détection adaptée au pays et la possibilité d'ajouter vos propres colonnes sensibles.

Questions fréquentes

L'anonymisation fausse-t-elle mes statistiques ?
Non, si les jetons sont cohérents : une même valeur garde le même jeton, donc comptages, moyennes par groupe et regroupements restent corrects. Seules les identités sont remplacées.
Faut-il anonymiser tout le fichier ?
Seulement les colonnes identifiantes (directes et indirectes). Les colonnes purement numériques non identifiantes peuvent souvent rester, selon votre analyse et votre politique interne.
Et les gros fichiers ?
Un traitement côté navigateur en arrière-plan (Web Worker) permet d'anonymiser des milliers de lignes sans bloquer l'interface — et sans que le fichier quitte votre poste.

Sources et références

Gardez vos données sensibles dans votre navigateur

ONYRI Sanitize détecte et masque vos données sensibles avant l'envoi à l'IA, puis restaure la réponse — du nom à la clé API.

Anonymiser mon prompt

À lire aussi