La dé-identification par lot consiste à retirer les identifiants patient de nombreux fichiers d'un coup. Le RGPD Art. 9 et la Loi n° 78-17 régissent les données de santé. anonym.plus tourne sur votre appareil. Chaque fichier garde son sens, mais aucun ne nomme une personne.
Quand cela s’applique
Vous préparez une cohorte de recherche de centaines d'examens. Les constats peuvent rester, mais chaque nom, date et identifiant du jeu d'abord cachés.
Comment anonym.plus s’en charge
- Pointez anonym.plus vers un dossier sur votre propre machine.
- L'OCR local lit toute page numérisée ou image marquée.
- L'outil repère noms, dates et identifiants dans tout le jeu.
- Relisez les repères une fois et définissez votre règle.
- Appliquez cette règle à chaque fichier en une passe.
- Enregistrez le dossier propre. Le jeu source reste chez vous.
Ce que vous devez fournir
- Un dossier de fichiers (DICOM, PDF, image ou mixte).
- Un opérateur : Remplacer, Caviarder ou Masquer (partiel).
- Optionnel : une table de correspondance partagée pour toute la cohorte.
Types d'entités de données de santé détectés
| Catégorie | Type d’entité anonym.plus | Exemple |
|---|---|---|
| Noms | PERSON | Patients divers → [PATIENT_n] |
| Dates | DATE_TIME | Toutes les dates d'examen → [DATE] |
| Identifiants dossier | MEDICAL_RECORD_NUMBER | Liste d'IPP → [IPP] |
| NIR | FR_NIR | Liste de NIR → [NIR] |
| Établissement | ORGANIZATION | CHU sources → [SITE] |
| Contact | PHONE_NUMBER | Lignes de contact → [TEL] |
Conformité atteinte
- Anonymisation sous RGPD Art. 9 & Loi n° 78-17.
- Une fois vraiment anonyme, chaque fichier sort du champ du RGPD selon le Considérant 26.
- Le secret médical (Art. L1110-4 CSP) encadre l'usage des examens.
- Les fichiers de travail sont protégés par AES-256-GCM.
Anonymisez jeux de données d'imagerie hors ligne — voir les offres & commencer gratuitement →
Limites & précautions
Un traitement par lot applique une règle à de nombreux fichiers. Échantillonnez la sortie pour confirmer que la règle convient à chaque mise en page. Les modèles inhabituels peuvent exiger une seconde passe.
Questions fréquentes
Une seule table de correspondance peut-elle couvrir toute la cohorte ?
Oui. Une table partagée donne à chaque patient un jeton stable sur chaque fichier. La cohorte reste reliable sans vrai nom affiché.
Le lot gère-t-il les types de fichiers mixtes ?
Oui. Un dossier peut contenir des fichiers d'en-tête, des pages exportées et des images. L'OCR local lit les scans, chaque type est couvert en une seule passe.
Comment faire confiance à un grand traitement ?
Échantillonnez la sortie. Ouvrez quelques fichiers et confirmez que les identifiants ont disparu. Un contrôle ponctuel détecte toute mise en page manquée par la règle.