Anonymisation du registre en vie réelle avec anonym.plus

Nettoyez un fichier issu du DPI sur votre propre machine avant toute analyse ou partage.

L'anonymisation en vie réelle consiste à retirer les identifiants patient des données extraites des soins courants. Elle soutient les garanties de recherche du RGPD Art. 89. anonym.plus fonctionne hors ligne et garde exploitables les signaux cliniques.

Quand cela s’applique

Une équipe extrait une cohorte des dossiers électroniques pour étudier les résultats. L'extraction porte encore noms, dates de naissance complètes et codes de clinique.

Comment anonym.plus s’en charge

  1. Chargez l'extraction (CSV, XLSX ou DOCX) dans anonym.plus.
  2. L'outil analyse les champs structurés et les notes en texte libre.
  3. L'OCR local lit toute page de dossier scannée que vous joignez.
  4. Confirmez les noms, dates et identifiants de clinique marqués.
  5. Remplacez chacun par un pseudonyme stable sur le fichier.
  6. Enregistrez la cohorte nettoyée localement, sans envoi.

Ce que vous devez fournir

Types d'entités de données de santé détectés

CatégorieType d’entité anonym.plusExemple
NomsPERSONHanna Vasseur → [PATIENT_5]
Date de naissanceDATE_TIMEné(e) 19/02/1947 → [ANNEE_NAISSANCE]
CliniqueORGANIZATIONCabinet médical des Halles → [PRESTATAIRE]
LieuLOCATIONParis 1er → [REGION]
NIRFR_NIR2 47 02 75 101 088 21 → [NIR]
ContactPHONE_NUMBER+33 1 79 46 01 51 → [TELEPHONE]

Conformité atteinte

Anonymisez jeux de données en vie réelle hors ligne — voir les offres & commencer gratuitement →

Limites & précautions

Les extractions de soins courants sont riches, donc les quasi-identifiants s'accumulent vite. L'outil retire les identifiants directs et signale les dates de naissance rares. Un diagnostic rare avec une petite région peut encore ré-identifier quelqu'un, donc testez les combinaisons avant de partager.

Questions fréquentes

Qu'est-ce que les données de vie réelle ?

Ce sont des preuves sur les soins et les résultats issues de sources courantes comme les dossiers électroniques ou les remboursements, pas d'un essai contrôlé. Ces extractions portent des données personnelles riches à nettoyer sous les garanties du RGPD Art. 89.

Pourquoi ces fichiers sont-ils plus à risque ?

Ils portent beaucoup de champs par personne, donc les quasi-identifiants se combinent facilement. Retirer les noms ne suffit pas ; vous devez juger les combinaisons de valeurs rares.

Le signal clinique survit-il ?

Oui. Diagnostics, médicaments et résultats restent. Seuls les identifiants directs sont remplacés, et vous généralisez les valeurs rares au besoin.