Questions Fréquentes

Tout ce que vous devez savoir sur l'anonymisation de documents hors ligne avec anonym.plus.

Sécurité et confidentialité

Oui. Les documents sont traités entièrement localement. Le moteur de détection de PII s'exécute sur votre machine. Les clés de chiffrement ne quittent jamais votre coffre-fort (architecture à connaissance zéro — le frontend ne référence les clés que par ID, les valeurs réelles restent dans le backend Rust). Tout le stockage est chiffré avec AES-256-GCM.
Non. Le moteur local Presidio gère la détection de PII hors ligne. Internet n'est nécessaire que pour la synchronisation du compte, le téléchargement de modèles et les mises à jour de l'application. Toute l'anonymisation et la désanonymisation principales fonctionnent entièrement hors ligne.
Votre coffre-fort est chiffré. Sans votre PIN ou phrase de récupération, les données ne sont pas accessibles. Si vous avez un compte cloud, les modèles et métadonnées des clés de chiffrement sont synchronisés entre les appareils.
Lors de la configuration, une phrase de récupération de 24 mots (style BIP39) est générée. C'est le SEUL moyen de récupérer votre coffre-fort si vous oubliez votre PIN. Notez-la et conservez-la en lieu sûr — elle n'est affichée qu'une fois lors de la configuration et peut être consultée ultérieurement dans Paramètres → Sécurité uniquement lorsque le coffre-fort est déverrouillé.
Utilisez votre phrase de récupération de 24 mots pour déverrouiller le coffre-fort. Après 3 tentatives de PIN échouées, l'application suggère d'utiliser la phrase de récupération. Si vous avez perdu à la fois le PIN et la phrase de récupération, les données de votre coffre-fort ne peuvent pas être récupérées.
Oui. Le coffre-fort se verrouille automatiquement après 15 minutes d'inactivité (aucun événement de souris, clavier ou défilement). Vous pouvez aussi le verrouiller manuellement depuis l'en-tête. En mode démo, le verrouillage automatique est désactivé car l'utilisateur démo ne définit pas de PIN.
Oui. Allez dans Paramètres → Sécurité → Changer le répertoire de données pour déplacer vos bases de données de coffre-fort vers un autre emplacement (par exemple, un volume chiffré VeraCrypt ou BitLocker). L'application nécessite un redémarrage après le déplacement.
Allez dans Paramètres → Sécurité → Sauvegarde et restauration. 'Exporter les données' crée un ZIP de vos bases de données de coffre-fort. 'Importer les données' remplace les données existantes (max. 100 Mo). L'importation nécessite un redémarrage de l'application et vous avertit qu'elle écrasera toutes les données actuelles.
Paramètres → Sécurité → Supprimer toutes les données locales. Vous devez taper 'DELETE ALL LOCAL DATA' pour confirmer. Cela supprime le coffre-fort chiffré, l'historique, la phrase de récupération, tous les paramètres locaux et les identifiants API en cache. Cela N'affecte PAS votre compte en ligne ni les données synchronisées dans le cloud. L'application se ferme après la suppression.

Anonymisation

Cinq opérateurs : Replace (remplace par <ENTITY_TYPE> ou texte personnalisé), Redact (supprime entièrement), Mask (remplace par des caractères *, nombre configurable), Hash (SHA-256, SHA-512 ou MD5 — irréversible) et Encrypt (chiffrement AES réversible utilisant une clé stockée — seul celui-ci peut être déchiffré ultérieurement).
Entrée : PDF, DOCX, XLSX/XLS, TXT, CSV, JSON, XML et images (PNG, JPG, BMP, TIFF). Sortie : PDF, DOCX, TXT ou identique à l'entrée. Note : les fichiers .txt nécessitent au minimum une licence Basic ; tous les autres formats de documents nécessitent une licence Pro.
PDF : 50 Mo, TXT : 50 Mo, DOCX : 30 Mo, CSV : 30 Mo, JSON : 30 Mo, XML : 30 Mo, XLSX : 20 Mo ou 100 000 lignes. Images : 10 Mo et 25 mégapixels. Les documents doivent contenir au moins 10 caractères de texte pour être analysés.
Par défaut : {baseName}_anonymized_{timestamp}.{ext}. En mode par lots, vous pouvez personnaliser le modèle de nommage à l'aide de variables de modèle. Vous pouvez également choisir de remplacer le fichier original.
Plusieurs causes possibles : 1) Le seuil de confiance de votre modèle est peut-être trop élevé — abaissez-le pour plus de détections. 2) Le type d'entité est peut-être désactivé globalement dans Paramètres → Entités. 3) Pour les entités personnalisées, vérifiez que l'expression regex correspond à vos données à l'aide du testeur de motifs intégré. 4) La reconnaissance d'entités nommées utilise le modèle NER anglais — la détection de noms de personnes fonctionne mieux avec les noms anglais/latins, tandis que les entités basées sur des motifs (téléphones, IBANs, e-mails) fonctionnent dans toutes les langues.
L'application revient automatiquement à l'opérateur 'replace' avec des marqueurs <ENTITY_TYPE> pour éviter la perte de données. L'entité sera anonymisée mais pas chiffrée. Créez une clé dans Paramètres → Clés de chiffrement pour utiliser le chiffrement.

Désanonymisation

Passez en mode Désanonymiser. Vous avez trois options : déposer un fichier, coller du texte directement ou sélectionner dans l'historique de traitement. L'application compare automatiquement avec votre historique pour trouver les bonnes clés de chiffrement. Cliquez sur Désanonymiser pour restaurer les valeurs PII originales.
Lorsque vous collez ou déposez du texte, l'application recherche dans votre historique à l'aide de deux stratégies : 1) Correspondance exacte — si le texte correspond exactement à une sortie précédente. 2) Correspondance approximative — vérifie si au moins 50 % des blocs chiffrés d'une entrée de l'historique apparaissent dans votre texte. Cela signifie que vous pouvez déchiffrer des documents même après qu'ils ont été modifiés par des collaborateurs.
Oui. L'application utilise la correspondance approximative pour trouver les blocs chiffrés dans le texte modifié. Tant que les blocs chiffrés eux-mêmes sont intacts (pas partiellement coupés ou modifiés), ils peuvent être déchiffrés. Le texte environnant peut être librement ajouté, supprimé ou réorganisé.
1) Anonymisez un document avec l'opérateur 'encrypt'. 2) Partagez le document anonymisé avec des collaborateurs. 3) Ils modifient autour des blocs chiffrés. 4) Vous le récupérez et le déposez dans Désanonymiser → Déposer un fichier. 5) L'application détecte automatiquement les blocs chiffrés, charge les clés depuis l'historique et déchiffre. Cela permet une collaboration sécurisée où vous seul pouvez voir les PII originaux.
L'application déchiffre tous les blocs chiffrés intacts et ignore ceux qui manquent ou sont endommagés. Vous verrez un compteur de blocs manquants et un avertissement, mais le reste du document est entièrement restauré (récupération partielle).
Non. L'application stocke l'association des clés dans l'historique de votre coffre-fort. Lorsque vous déposez un document pour la désanonymisation, elle sélectionne automatiquement la bonne clé pour chaque type d'entité.
Le texte collé ne contient pas de marqueurs d'entités (<PERSON>, etc.) ou de blocs chiffrés reconnaissables. Si vous avez utilisé l'opérateur encrypt, sélectionnez l'entrée depuis l'onglet 'Depuis l'historique' — les positions des entités chiffrées y sont stockées. Note : l'historique ne stocke que les 10 000 premiers caractères, les documents très longs peuvent donc être tronqués.

Clés de chiffrement

Les valeurs des clés de chiffrement ne quittent jamais le backend Rust. Le frontend ne stocke que les métadonnées de clé (nom, ID, type d'entité, compteur d'utilisation). Lors du chiffrement, le frontend envoie un ID de clé (pas la valeur) au backend Rust, qui résout le matériel de clé réel. Cela signifie que même si quelqu'un accédait à la mémoire du frontend, il ne pourrait pas extraire vos clés de chiffrement.
128 bits (16 octets), 192 bits (24 octets) et 256 bits (32 octets). 256 bits est recommandé et est la valeur par défaut pour les nouvelles clés.
Oui. Lors de la création d'une clé, vous pouvez l'assigner à un type d'entité spécifique (par exemple, uniquement pour PERSON, uniquement pour US_SSN) ou la définir sur 'ALL' (par défaut). Les clés liées à un type d'entité apparaissent lorsque vous sélectionnez l'opérateur encrypt pour ce type d'entité.
La rotation génère un nouveau matériel de clé. L'ancienne valeur de clé est définitivement remplacée. Les documents chiffrés avec l'ancienne clé auront besoin de l'ancienne valeur pour la désanonymisation — ne faites donc pivoter que si vous avez sauvegardé l'ancienne clé ou n'avez plus besoin de déchiffrer d'anciens documents. Le nouveau hex de clé n'est affiché qu'une fois.
Pour des raisons de sécurité, les valeurs de clé générées et pivotées ne sont affichées qu'une fois avec un compte à rebours de 30 secondes avant masquage automatique. Copiez et stockez la clé en lieu sûr avant de fermer. Cela empêche le matériel de clé de persister dans l'interface.

Traitement par lots

Le mode par lots traite plusieurs fichiers à la fois. Configurez la concurrence (1 à 5 fichiers en parallèle, 2 par défaut), la gestion des erreurs (continuer ou arrêter en cas d'erreur), l'approbation automatique vs. la révision manuelle, le format de sortie et le modèle de nommage. Un seul lot peut s'exécuter à la fois. Nécessite une licence Pro.
Lorsque l'approbation automatique est activée, toutes les entités détectées sont automatiquement acceptées sans révision manuelle. Vous pouvez configurer un opérateur global (Replace/Redact/Mask/Hash/Encrypt) ou des opérateurs par type d'entité. Lorsqu'elle est désactivée, chaque fichier se met en pause à l'étape de révision pour que vous puissiez vérifier et approuver les entités.
Oui. Choisissez entre ZIP (tous les fichiers regroupés), dossier (enregistre dans un sous-dossier horodaté) ou fichiers individuels. Vous pouvez également exporter un résumé de traitement au format JSON, CSV ou les deux.
Cela dépend de votre paramètre de mode d'erreur. 'Continuer' marque le fichier en échec comme erreur et traite le reste. 'Arrêter en cas d'erreur' interrompt tout le lot. Les fichiers en échec peuvent être réessayés individuellement.

Modèles de détection

Plus de 120 modèles intégrés dans 7 catégories : Auto (5), spécifiques par pays (55+), régionaux multi-pays (12), techniques/DevSecOps (14), industrie (13), santé (3) et finance (4). Chaque modèle configure quels types d'entités détecter, le seuil de confiance et les opérateurs optionnels par entité.
Oui. Allez dans Paramètres → Modèles → Créer un modèle personnalisé. Sélectionnez les types d'entités (y compris vos entités personnalisées), définissez un seuil de confiance (50–100 %), configurez les opérateurs par entité et choisissez une langue de détection. Vous pouvez également dupliquer n'importe quel modèle intégré comme point de départ.
Le seuil (50–100 %) contrôle le niveau de confiance requis du moteur de détection avant de signaler une entité. Des seuils plus bas détectent plus d'entités mais peuvent générer des faux positifs. Des seuils plus élevés sont plus précis mais peuvent manquer certaines entités. Les modèles financiers utilisent 0,95, les modèles de développement utilisent 0,70.

Entités personnalisées

Allez dans Paramètres → Entités personnalisées pour définir vos propres types de PII à l'aide d'expressions regex (par exemple, identifiants d'employés, codes internes, numéros de projet). Chaque entité peut avoir jusqu'à 10 motifs, des mots de contexte pour une meilleure correspondance et un score de confiance. Les entités personnalisées sont détectées aux côtés des plus de 200 types intégrés et peuvent utiliser tous les opérateurs y compris le chiffrement.
Maximum 50 entités personnalisées, 10 motifs par entité, 20 mots de contexte par entité. Les expressions regex sont limitées à 500 caractères. Les noms d'entités doivent être au format MAJUSCULES_AVEC_UNDERSCORES (2–64 caractères). Les motifs sont validés contre le ReDoS (retour arrière catastrophique) pour éviter les blocages de l'interface.
Oui. L'exportation enregistre toutes les entités personnalisées sous forme de fichier JSON (l'application vous avertit que les motifs seront en texte clair). L'importation accepte les fichiers JSON jusqu'à 1 Mo, régénère les IDs, valide par rapport aux limites et indique combien ont été importées, ignorées ou en erreur.

Images

PNG, JPG/JPEG, BMP et TIFF. La taille maximale est de 10 Mo et la résolution maximale est de 25 mégapixels.
Processus en deux étapes : 1) Analyse — Tesseract OCR extrait le texte avec des cadres de délimitation au niveau des caractères, puis le moteur PII détecte les entités. 2) Masquage — des rectangles colorés sont dessinés sur les régions de PII détectées. Vous choisissez la couleur de remplissage (noir, blanc, rouge, vert, bleu, gris). La sortie est enregistrée en fichier PNG.
Les photos d'écrans produisent des motifs de moiré, des reflets, des réflexions et un faible contraste qui dégradent considérablement la précision de l'OCR. Utilisez des captures d'écran (Impr Écran, Outil Capture, etc.) ou des exports numériques directs.
Non. Le moteur OCR (Tesseract) est optimisé pour le texte imprimé et dactylographié. Le texte manuscrit ne sera probablement pas détecté ou produira des résultats peu fiables.
Actuellement, l'anonymisation d'images traite une image à la fois. Le mode par lots prend en charge les formats de documents (PDF, DOCX, etc.) mais pas les images.

Modèles et langues

23 modèles linguistiques basés sur spaCy : anglais (intégré), allemand, espagnol, français, italien, portugais, néerlandais, polonais, roumain, danois, grec, finnois, croate, lituanien, macédonien, norvégien, russe, suédois, ukrainien, japonais, chinois, coréen et un modèle multilingue. Les tailles vont de 15 à 54 Mo.
Le téléchargement de modèles nécessite une connexion internet. Une fois téléchargés, les modèles fonctionnent entièrement hors ligne. Vous pouvez également importer des modèles depuis des fichiers .tar.gz, .gz ou .zip si vous les avez localement.
L'interface utilisateur prend en charge 48 langues. Ceci est distinct des modèles NLP — la langue de l'interface concerne les menus et libellés, tandis que les modèles NLP sont pour la détection d'entités PII.

Historique

L'historique est nettoyé automatiquement après 90 jours ou lorsque la limite d'entrées (1 000 entrées) est atteinte. La rétention de base garantit que les 500 entrées les plus récentes sont toujours conservées. La suppression de l'historique est permanente pour des raisons de confidentialité.
Non. Seuls les 10 000 premiers caractères du texte d'entrée et de sortie sont stockés dans l'historique. Les documents très longs seront tronqués. Les positions complètes des entités et les valeurs chiffrées sont stockées pour permettre la désanonymisation.

Licences

La démo vous donne 30 minutes d'accès avec l'anonymisation de base, le chiffrement et la désanonymisation — en mode texte uniquement. Le traitement de fichiers, le mode par lots et l'anonymisation d'images ne sont pas disponibles dans la démo. Aucun compte nécessaire.
Trois moyens : 1) Collez la clé de licence dans Paramètres → Licence. 2) Importez un fichier de licence (.license, .lic, .key, .txt, .json). 3) Cliquez sur le lien d'activation dans votre e-mail — le lien profond anonym-plus:// s'active automatiquement.
Free : mode texte, chiffrement, désanonymisation, 1 machine. Basic : ajoute la prise en charge des fichiers .txt, 3 machines. Pro : ajoute tous les formats de fichiers, traitement par lots, 3 machines. Expert : ajoute l'anonymisation d'images, 5 machines.
Oui. anonym.legal propose le même moteur d'anonymisation en tant que service cloud géré avec une API développeur — pour les flux de travail nécessitant un traitement par lots via REST ou une intégration dans une infrastructure serveur. anonym.plus et anonym.legal font partie de la famille de produits anonymize.solutions.

Mises à jour

L'application vérifie les mises à jour automatiquement toutes les 24 heures. Lorsqu'une mise à jour est disponible, une notification apparaît dans Paramètres → À propos (et un point animé sur le bouton Paramètres). Cliquez sur 'Télécharger et installer' pour mettre à jour (~110 Mo de téléchargement). L'application se ferme et redémarre avec la nouvelle version.
Les mises à jour automatiques ne sont pas prises en charge pour la version portable (.zip). Vous verrez une notification vous invitant à télécharger manuellement la dernière version depuis la page des Releases GitHub.
Lorsqu'une nouvelle version a un numéro de version majeure plus élevé (par exemple, v8 à v9), l'application avertit que votre licence peut ne couvrir que la version majeure actuelle. Les fonctionnalités de base restent disponibles, mais vous devrez peut-être mettre à niveau votre licence pour les fonctionnalités de la nouvelle version.

Dépannage

Allez dans Paramètres → Avancé et cliquez sur 'Redémarrer le moteur PII'. Si le problème persiste, vérifiez l'état du moteur dans Paramètres → À propos. Ouvrez le journal de débogage (Ctrl+Shift+D) pour les messages d'erreur détaillés. Essayez de redémarrer complètement l'application.
Essayez de redémarrer l'application. Si le problème persiste, réinitialisez le coffre-fort dans Paramètres → Sécurité. En dernier recours, utilisez 'Supprimer toutes les données locales' pour une réinitialisation d'usine.
Vérifiez : 1) L'entité est activée dans Paramètres → Entités personnalisées. 2) L'expression regex correspond à vos données de test (utilisez le testeur de motifs intégré). 3) Le motif n'est pas signalé comme dangereux pour le ReDoS — l'application les ignore par sécurité. 4) Lors de l'utilisation de modèles avec des entités personnalisées, l'application détecte automatiquement tous les types d'entités y compris les personnalisées.
La clé de chiffrement ne correspond pas. Vérifiez que la bonne clé est sélectionnée — consultez Paramètres → Clés de chiffrement. Si la clé a été pivotée, vous avez besoin de l'ancienne valeur de clé. Vous pouvez également saisir manuellement une clé hex dans le sélecteur de clés si vous avez une sauvegarde.

58 questions · 13 catégories