La revue assistée par la technologie (TAR) s'appuie sur un échantillon que des relecteurs qualifient pour entraîner le classement. Ces documents, soumis aux règles de communication du Code de procédure civile, regorgent de données personnelles. anonym.plus anonymise l'échantillon sur votre poste sans dégrader les signaux utiles au modèle.
Quand cela s’applique
Avant de confier le jeu d'apprentissage à une équipe externe de relecteurs, vous devez voiler les identités tout en gardant le contenu utile à la classification.
Comment anonym.plus s’en charge
- Chargez l'échantillon de revue (PDF, courriels, documents) dans l'application locale.
- Le lecteur optique traite aussi les pièces numérisées de l'échantillon.
- Noms, coordonnées et identifiants nationaux sont signalés sans toucher au contenu thématique.
- Vérifiez les marqueurs et préservez le vocabulaire métier qui guide le classement.
- Remplacez chaque identifiant par un jeton constant pour ne pas biaiser le modèle.
- Exportez l'échantillon anonymisé sans aucune sortie réseau.
Ce que vous devez fournir
- L'échantillon d'apprentissage (PDF, EML, DOCX).
- Une opération : Remplacer pour conserver les signaux, Caviarder pour effacer.
- Facultatif : une liste blanche de termes métier à protéger du filtrage.
Types d'entités PII détectés
| Catégorie | Type d’entité anonym.plus | Exemple |
|---|---|---|
| Personne | PERSON | Julien Faivre → [PERSONNE_1] |
| Courriel | EMAIL_ADDRESS | j.faivre@groupe.fr → [EMAIL] |
| Identité nationale | NATIONAL_ID | ID 88 04 123 456 → [ID] |
| Date | DATE_TIME | qualifié le 13/03/2026 → [DATE] |
| Lieu | LOCATION | site de Grenoble → [LIEU] |
| Ligne téléphonique | PHONE_NUMBER | +33 4 76 88 99 00 → [TEL] |
Conformité atteinte
- Inscrit l'échantillon dans la communication régie par le Code de procédure civile.
- Voile les identités & préserve les signaux thématiques utiles au classement.
- Fonctionne hors ligne : le jeu d'apprentissage ne quitte pas votre infrastructure.
- Les fichiers de travail sont protégés par AES-256-GCM.
Anonymisez jeux de revue TAR hors ligne — voir les offres & commencer gratuitement →
Limites & précautions
Un caviardage trop agressif efface des termes qui guident le modèle et dégrade ses performances. Le remplacement par jeton constant est préférable. Mesurez l'impact sur un sous-ensemble avant de traiter l'échantillon complet.
Questions fréquentes
Qu'est-ce qu'un jeu de revue TAR ?
C'est l'échantillon de documents qualifiés par des relecteurs pour entraîner un classement automatique dans une revue assistée par la technologie.
L'anonymisation nuit-elle à l'apprentissage du modèle ?
Pas si l'on emploie des jetons constants : les signaux thématiques subsistent et le modèle reste fiable.
L'échantillon part-il chez un prestataire externe ?
Non. Le traitement reste sur votre poste ; vous ne transmettez qu'une version anonymisée.