Questions Fréquentes

Tout ce que vous devez savoir sur l'anonymisation de documents hors ligne avec anonym.plus.

Sécurité et confidentialité Anonymisation Désanonymisation Clés de chiffrement Traitement par lots Modèles de détection Entités personnalisées Images Modèles et langues Historique Licences Mises à jour Dépannage

Sécurité et confidentialité

Mes données sont-elles en sécurité ?

Oui. Les documents sont traités entièrement localement. Le moteur de détection de PII s'exécute sur votre machine. Les clés de chiffrement ne quittent jamais votre coffre-fort (architecture à connaissance zéro — le frontend ne référence les clés que par ID, les valeurs réelles restent dans le backend Rust). Tout le stockage est chiffré avec AES-256-GCM.

L'application a-t-elle besoin d'une connexion internet ?

Non. Le moteur local Presidio gère la détection de PII hors ligne. Internet n'est nécessaire que pour la synchronisation du compte, le téléchargement de modèles et les mises à jour de l'application. Toute l'anonymisation et la désanonymisation principales fonctionnent entièrement hors ligne.

Que se passe-t-il avec mes données si je perds mon appareil ?

Votre coffre-fort est chiffré. Sans votre PIN ou phrase de récupération, les données ne sont pas accessibles. Si vous avez un compte cloud, les modèles et métadonnées des clés de chiffrement sont synchronisés entre les appareils.

Qu'est-ce que la phrase de récupération et pourquoi est-elle importante ?

Lors de la configuration, une phrase de récupération de 24 mots (style BIP39) est générée. C'est le SEUL moyen de récupérer votre coffre-fort si vous oubliez votre PIN. Notez-la et conservez-la en lieu sûr — elle n'est affichée qu'une fois lors de la configuration et peut être consultée ultérieurement dans Paramètres → Sécurité uniquement lorsque le coffre-fort est déverrouillé.

Que se passe-t-il si j'oublie mon PIN ?

Utilisez votre phrase de récupération de 24 mots pour déverrouiller le coffre-fort. Après 3 tentatives de PIN échouées, l'application suggère d'utiliser la phrase de récupération. Si vous avez perdu à la fois le PIN et la phrase de récupération, les données de votre coffre-fort ne peuvent pas être récupérées.

Le coffre-fort se verrouille-t-il automatiquement ?

Oui. Le coffre-fort se verrouille automatiquement après 15 minutes d'inactivité (aucun événement de souris, clavier ou défilement). Vous pouvez aussi le verrouiller manuellement depuis l'en-tête. En mode démo, le verrouillage automatique est désactivé car l'utilisateur démo ne définit pas de PIN.

Puis-je déplacer les données de mon coffre-fort vers un lecteur chiffré ?

Oui. Allez dans Paramètres → Sécurité → Changer le répertoire de données pour déplacer vos bases de données de coffre-fort vers un autre emplacement (par exemple, un volume chiffré VeraCrypt ou BitLocker). L'application nécessite un redémarrage après le déplacement.

Comment sauvegarder mes données ?

Allez dans Paramètres → Sécurité → Sauvegarde et restauration. 'Exporter les données' crée un ZIP de vos bases de données de coffre-fort. 'Importer les données' remplace les données existantes (max. 100 Mo). L'importation nécessite un redémarrage de l'application et vous avertit qu'elle écrasera toutes les données actuelles.

Comment supprimer toutes les données locales ?

Paramètres → Sécurité → Supprimer toutes les données locales. Vous devez taper 'DELETE ALL LOCAL DATA' pour confirmer. Cela supprime le coffre-fort chiffré, l'historique, la phrase de récupération, tous les paramètres locaux et les identifiants API en cache. Cela N'affecte PAS votre compte en ligne ni les données synchronisées dans le cloud. L'application se ferme après la suppression.

Anonymisation

Quels opérateurs sont disponibles pour l'anonymisation ?

Cinq opérateurs : Replace (remplace par <ENTITY_TYPE> ou texte personnalisé), Redact (supprime entièrement), Mask (remplace par des caractères *, nombre configurable), Hash (SHA-256, SHA-512 ou MD5 — irréversible) et Encrypt (chiffrement AES réversible utilisant une clé stockée — seul celui-ci peut être déchiffré ultérieurement).

Quels formats de fichiers sont pris en charge ?

Entrée : PDF, DOCX, XLSX/XLS, TXT, CSV, JSON, XML et images (PNG, JPG, BMP, TIFF). Sortie : PDF, DOCX, TXT ou identique à l'entrée. Note : les fichiers .txt nécessitent au minimum une licence Basic ; tous les autres formats de documents nécessitent une licence Pro.

Quelles sont les limites de taille de fichier ?

PDF : 50 Mo, TXT : 50 Mo, DOCX : 30 Mo, CSV : 30 Mo, JSON : 30 Mo, XML : 30 Mo, XLSX : 20 Mo ou 100 000 lignes. Images : 10 Mo et 25 mégapixels. Les documents doivent contenir au moins 10 caractères de texte pour être analysés.

Comment les fichiers anonymisés sont-ils nommés ?

Par défaut : {baseName}_anonymized_{timestamp}.{ext}. En mode par lots, vous pouvez personnaliser le modèle de nommage à l'aide de variables de modèle. Vous pouvez également choisir de remplacer le fichier original.

Pourquoi certaines entités ne sont-elles pas détectées ?

Plusieurs causes possibles : 1) Le seuil de confiance de votre modèle est peut-être trop élevé — abaissez-le pour plus de détections. 2) Le type d'entité est peut-être désactivé globalement dans Paramètres → Entités. 3) Pour les entités personnalisées, vérifiez que l'expression regex correspond à vos données à l'aide du testeur de motifs intégré. 4) La reconnaissance d'entités nommées utilise le modèle NER anglais — la détection de noms de personnes fonctionne mieux avec les noms anglais/latins, tandis que les entités basées sur des motifs (téléphones, IBANs, e-mails) fonctionnent dans toutes les langues.

Que se passe-t-il si je sélectionne l'opérateur 'encrypt' sans clé de chiffrement ?

L'application revient automatiquement à l'opérateur 'replace' avec des marqueurs <ENTITY_TYPE> pour éviter la perte de données. L'entité sera anonymisée mais pas chiffrée. Créez une clé dans Paramètres → Clés de chiffrement pour utiliser le chiffrement.

Désanonymisation

Comment déchiffrer un document anonymisé ?

Passez en mode Désanonymiser. Vous avez trois options : déposer un fichier, coller du texte directement ou sélectionner dans l'historique de traitement. L'application compare automatiquement avec votre historique pour trouver les bonnes clés de chiffrement. Cliquez sur Désanonymiser pour restaurer les valeurs PII originales.

Comment fonctionne la correspondance automatique ?

Lorsque vous collez ou déposez du texte, l'application recherche dans votre historique à l'aide de deux stratégies : 1) Correspondance exacte — si le texte correspond exactement à une sortie précédente. 2) Correspondance approximative — vérifie si au moins 50 % des blocs chiffrés d'une entrée de l'historique apparaissent dans votre texte. Cela signifie que vous pouvez déchiffrer des documents même après qu'ils ont été modifiés par des collaborateurs.

Puis-je déchiffrer un document modifié après l'anonymisation ?

Oui. L'application utilise la correspondance approximative pour trouver les blocs chiffrés dans le texte modifié. Tant que les blocs chiffrés eux-mêmes sont intacts (pas partiellement coupés ou modifiés), ils peuvent être déchiffrés. Le texte environnant peut être librement ajouté, supprimé ou réorganisé.

Qu'est-ce que le workflow Chiffrer → Partager → Modifier → Déchiffrer ?

1) Anonymisez un document avec l'opérateur 'encrypt'. 2) Partagez le document anonymisé avec des collaborateurs. 3) Ils modifient autour des blocs chiffrés. 4) Vous le récupérez et le déposez dans Désanonymiser → Déposer un fichier. 5) L'application détecte automatiquement les blocs chiffrés, charge les clés depuis l'historique et déchiffre. Cela permet une collaboration sécurisée où vous seul pouvez voir les PII originaux.

Que se passe-t-il si du texte chiffré a été accidentellement supprimé du document partagé ?

L'application déchiffre tous les blocs chiffrés intacts et ignore ceux qui manquent ou sont endommagés. Vous verrez un compteur de blocs manquants et un avertissement, mais le reste du document est entièrement restauré (récupération partielle).

Dois-je me souvenir de quelle clé de chiffrement j'ai utilisée ?

Non. L'application stocke l'association des clés dans l'historique de votre coffre-fort. Lorsque vous déposez un document pour la désanonymisation, elle sélectionne automatiquement la bonne clé pour chaque type d'entité.

Pourquoi la désanonymisation indique-t-elle 'Aucun marqueur trouvé' ?

Le texte collé ne contient pas de marqueurs d'entités (<PERSON>, etc.) ou de blocs chiffrés reconnaissables. Si vous avez utilisé l'opérateur encrypt, sélectionnez l'entrée depuis l'onglet 'Depuis l'historique' — les positions des entités chiffrées y sont stockées. Note : l'historique ne stocke que les 10 000 premiers caractères, les documents très longs peuvent donc être tronqués.

Clés de chiffrement

Comment fonctionne la gestion de clés à connaissance zéro ?

Les valeurs des clés de chiffrement ne quittent jamais le backend Rust. Le frontend ne stocke que les métadonnées de clé (nom, ID, type d'entité, compteur d'utilisation). Lors du chiffrement, le frontend envoie un ID de clé (pas la valeur) au backend Rust, qui résout le matériel de clé réel. Cela signifie que même si quelqu'un accédait à la mémoire du frontend, il ne pourrait pas extraire vos clés de chiffrement.

Quelles longueurs de clé sont disponibles ?

128 bits (16 octets), 192 bits (24 octets) et 256 bits (32 octets). 256 bits est recommandé et est la valeur par défaut pour les nouvelles clés.

Puis-je limiter les clés de chiffrement à des types d'entités spécifiques ?

Oui. Lors de la création d'une clé, vous pouvez l'assigner à un type d'entité spécifique (par exemple, uniquement pour PERSON, uniquement pour US_SSN) ou la définir sur 'ALL' (par défaut). Les clés liées à un type d'entité apparaissent lorsque vous sélectionnez l'opérateur encrypt pour ce type d'entité.

Que se passe-t-il quand je fais pivoter une clé ?

La rotation génère un nouveau matériel de clé. L'ancienne valeur de clé est définitivement remplacée. Les documents chiffrés avec l'ancienne clé auront besoin de l'ancienne valeur pour la désanonymisation — ne faites donc pivoter que si vous avez sauvegardé l'ancienne clé ou n'avez plus besoin de déchiffrer d'anciens documents. Le nouveau hex de clé n'est affiché qu'une fois.

Pourquoi ne puis-je voir ma clé de chiffrement qu'une seule fois ?

Pour des raisons de sécurité, les valeurs de clé générées et pivotées ne sont affichées qu'une fois avec un compte à rebours de 30 secondes avant masquage automatique. Copiez et stockez la clé en lieu sûr avant de fermer. Cela empêche le matériel de clé de persister dans l'interface.

Traitement par lots

Comment fonctionne le traitement par lots ?

Le mode par lots traite plusieurs fichiers à la fois. Configurez la concurrence (1 à 5 fichiers en parallèle, 2 par défaut), la gestion des erreurs (continuer ou arrêter en cas d'erreur), l'approbation automatique vs. la révision manuelle, le format de sortie et le modèle de nommage. Un seul lot peut s'exécuter à la fois. Nécessite une licence Pro.

Qu'est-ce que le mode d'approbation automatique en lot ?

Lorsque l'approbation automatique est activée, toutes les entités détectées sont automatiquement acceptées sans révision manuelle. Vous pouvez configurer un opérateur global (Replace/Redact/Mask/Hash/Encrypt) ou des opérateurs par type d'entité. Lorsqu'elle est désactivée, chaque fichier se met en pause à l'étape de révision pour que vous puissiez vérifier et approuver les entités.

Puis-je exporter les résultats du lot ?

Oui. Choisissez entre ZIP (tous les fichiers regroupés), dossier (enregistre dans un sous-dossier horodaté) ou fichiers individuels. Vous pouvez également exporter un résumé de traitement au format JSON, CSV ou les deux.

Que se passe-t-il si un fichier échoue pendant le traitement par lots ?

Cela dépend de votre paramètre de mode d'erreur. 'Continuer' marque le fichier en échec comme erreur et traite le reste. 'Arrêter en cas d'erreur' interrompt tout le lot. Les fichiers en échec peuvent être réessayés individuellement.

Modèles de détection

Combien de modèles sont disponibles ?

Plus de 120 modèles intégrés dans 7 catégories : Auto (5), spécifiques par pays (55+), régionaux multi-pays (12), techniques/DevSecOps (14), industrie (13), santé (3) et finance (4). Chaque modèle configure quels types d'entités détecter, le seuil de confiance et les opérateurs optionnels par entité.

Puis-je créer mes propres modèles ?

Oui. Allez dans Paramètres → Modèles → Créer un modèle personnalisé. Sélectionnez les types d'entités (y compris vos entités personnalisées), définissez un seuil de confiance (50–100 %), configurez les opérateurs par entité et choisissez une langue de détection. Vous pouvez également dupliquer n'importe quel modèle intégré comme point de départ.

Que fait le seuil de confiance ?

Le seuil (50–100 %) contrôle le niveau de confiance requis du moteur de détection avant de signaler une entité. Des seuils plus bas détectent plus d'entités mais peuvent générer des faux positifs. Des seuils plus élevés sont plus précis mais peuvent manquer certaines entités. Les modèles financiers utilisent 0,95, les modèles de développement utilisent 0,70.

Entités personnalisées

Comment fonctionnent les entités personnalisées ?

Allez dans Paramètres → Entités personnalisées pour définir vos propres types de PII à l'aide d'expressions regex (par exemple, identifiants d'employés, codes internes, numéros de projet). Chaque entité peut avoir jusqu'à 10 motifs, des mots de contexte pour une meilleure correspondance et un score de confiance. Les entités personnalisées sont détectées aux côtés des plus de 200 types intégrés et peuvent utiliser tous les opérateurs y compris le chiffrement.

Quelles sont les limites pour les entités personnalisées ?

Maximum 50 entités personnalisées, 10 motifs par entité, 20 mots de contexte par entité. Les expressions regex sont limitées à 500 caractères. Les noms d'entités doivent être au format MAJUSCULES_AVEC_UNDERSCORES (2–64 caractères). Les motifs sont validés contre le ReDoS (retour arrière catastrophique) pour éviter les blocages de l'interface.

Puis-je importer/exporter des entités personnalisées ?

Oui. L'exportation enregistre toutes les entités personnalisées sous forme de fichier JSON (l'application vous avertit que les motifs seront en texte clair). L'importation accepte les fichiers JSON jusqu'à 1 Mo, régénère les IDs, valide par rapport aux limites et indique combien ont été importées, ignorées ou en erreur.

Images

Quels formats d'image sont pris en charge ?

PNG, JPG/JPEG, BMP et TIFF. La taille maximale est de 10 Mo et la résolution maximale est de 25 mégapixels.

Comment fonctionne l'anonymisation d'images ?

Processus en deux étapes : 1) Analyse — Tesseract OCR extrait le texte avec des cadres de délimitation au niveau des caractères, puis le moteur PII détecte les entités. 2) Masquage — des rectangles colorés sont dessinés sur les régions de PII détectées. Vous choisissez la couleur de remplissage (noir, blanc, rouge, vert, bleu, gris). La sortie est enregistrée en fichier PNG.

Pourquoi l'anonymisation d'images ne fonctionne-t-elle pas bien sur les photos de mon écran ?

Les photos d'écrans produisent des motifs de moiré, des reflets, des réflexions et un faible contraste qui dégradent considérablement la précision de l'OCR. Utilisez des captures d'écran (Impr Écran, Outil Capture, etc.) ou des exports numériques directs.

L'anonymisation d'images détecte-t-elle le texte manuscrit ?

Non. Le moteur OCR (Tesseract) est optimisé pour le texte imprimé et dactylographié. Le texte manuscrit ne sera probablement pas détecté ou produira des résultats peu fiables.

Puis-je anonymiser des images en mode par lots ?

Actuellement, l'anonymisation d'images traite une image à la fois. Le mode par lots prend en charge les formats de documents (PDF, DOCX, etc.) mais pas les images.

Modèles et langues

Combien de modèles linguistiques sont disponibles ?

23 modèles linguistiques basés sur spaCy : anglais (intégré), allemand, espagnol, français, italien, portugais, néerlandais, polonais, roumain, danois, grec, finnois, croate, lituanien, macédonien, norvégien, russe, suédois, ukrainien, japonais, chinois, coréen et un modèle multilingue. Les tailles vont de 15 à 54 Mo.

Puis-je télécharger des modèles linguistiques supplémentaires hors ligne ?

Le téléchargement de modèles nécessite une connexion internet. Une fois téléchargés, les modèles fonctionnent entièrement hors ligne. Vous pouvez également importer des modèles depuis des fichiers .tar.gz, .gz ou .zip si vous les avez localement.

Combien de langues d'interface sont prises en charge ?

L'interface utilisateur prend en charge 48 langues. Ceci est distinct des modèles NLP — la langue de l'interface concerne les menus et libellés, tandis que les modèles NLP sont pour la détection d'entités PII.

Historique

Combien de temps l'historique de traitement est-il conservé ?

L'historique est nettoyé automatiquement après 90 jours ou lorsque la limite d'entrées (1 000 entrées) est atteinte. La rétention de base garantit que les 500 entrées les plus récentes sont toujours conservées. La suppression de l'historique est permanente pour des raisons de confidentialité.

Le document complet est-il stocké dans l'historique ?

Non. Seuls les 10 000 premiers caractères du texte d'entrée et de sortie sont stockés dans l'historique. Les documents très longs seront tronqués. Les positions complètes des entités et les valeurs chiffrées sont stockées pour permettre la désanonymisation.

Licences

Quelles fonctionnalités sont disponibles dans la démo gratuite ?

La démo vous donne 30 minutes d'accès avec l'anonymisation de base, le chiffrement et la désanonymisation — en mode texte uniquement. Le traitement de fichiers, le mode par lots et l'anonymisation d'images ne sont pas disponibles dans la démo. Aucun compte nécessaire.

Comment activer une licence ?

Trois moyens : 1) Collez la clé de licence dans Paramètres → Licence. 2) Importez un fichier de licence (.license, .lic, .key, .txt, .json). 3) Cliquez sur le lien d'activation dans votre e-mail — le lien profond anonym-plus:// s'active automatiquement.

Quelles fonctionnalités nécessitent quel plan ?

Free : mode texte, chiffrement, désanonymisation, 1 machine. Basic : ajoute la prise en charge des fichiers .txt, 3 machines. Pro : ajoute tous les formats de fichiers, traitement par lots, 3 machines. Expert : ajoute l'anonymisation d'images, 5 machines.

Existe-t-il une version cloud ou API de anonym.plus ?

Oui. anonym.legal propose le même moteur d'anonymisation en tant que service cloud géré avec une API développeur — pour les flux de travail nécessitant un traitement par lots via REST ou une intégration dans une infrastructure serveur. anonym.plus et anonym.legal font partie de la famille de produits anonymize.solutions.

Mises à jour

Comment mettre à jour l'application ?

L'application vérifie les mises à jour automatiquement toutes les 24 heures. Lorsqu'une mise à jour est disponible, une notification apparaît dans Paramètres → À propos (et un point animé sur le bouton Paramètres). Cliquez sur 'Télécharger et installer' pour mettre à jour (~110 Mo de téléchargement). L'application se ferme et redémarre avec la nouvelle version.

Puis-je mettre à jour la version portable ?

Les mises à jour automatiques ne sont pas prises en charge pour la version portable (.zip). Vous verrez une notification vous invitant à télécharger manuellement la dernière version depuis la page des Releases GitHub.

Qu'est-ce qu'un avertissement de mise à jour majeure ?

Lorsqu'une nouvelle version a un numéro de version majeure plus élevé (par exemple, v8 à v9), l'application avertit que votre licence peut ne couvrir que la version majeure actuelle. Les fonctionnalités de base restent disponibles, mais vous devrez peut-être mettre à niveau votre licence pour les fonctionnalités de la nouvelle version.

Dépannage

Le moteur de détection de PII ne fonctionne pas. Que dois-je faire ?

Allez dans Paramètres → Avancé et cliquez sur 'Redémarrer le moteur PII'. Si le problème persiste, vérifiez l'état du moteur dans Paramètres → À propos. Ouvrez le journal de débogage (Ctrl+Shift+D) pour les messages d'erreur détaillés. Essayez de redémarrer complètement l'application.

L'application affiche un écran blanc.

Essayez de redémarrer l'application. Si le problème persiste, réinitialisez le coffre-fort dans Paramètres → Sécurité. En dernier recours, utilisez 'Supprimer toutes les données locales' pour une réinitialisation d'usine.

Mes entités personnalisées ne sont pas détectées.

Vérifiez : 1) L'entité est activée dans Paramètres → Entités personnalisées. 2) L'expression regex correspond à vos données de test (utilisez le testeur de motifs intégré). 3) Le motif n'est pas signalé comme dangereux pour le ReDoS — l'application les ignore par sécurité. 4) Lors de l'utilisation de modèles avec des entités personnalisées, l'application détecte automatiquement tous les types d'entités y compris les personnalisées.

La désanonymisation échoue avec 'Déchiffrement échoué'.

La clé de chiffrement ne correspond pas. Vérifiez que la bonne clé est sélectionnée — consultez Paramètres → Clés de chiffrement. Si la clé a été pivotée, vous avez besoin de l'ancienne valeur de clé. Vous pouvez également saisir manuellement une clé hex dans le sélecteur de clés si vous avez une sauvegarde.

58 questions · 13 catégories

Référence des réglementations vie privée — Données quantifiées sur 24 régimes de confidentialité

EU GDPR — Regulation (EU) 2016/679; adopted 27 Apr 2016; applicable 25 May 2018; 27 member states; 72-hour breach notification; €20M or 4% global turnover.
EU AI Act — Regulation (EU) 2024/1689; adopted 13 Jun 2024; in force 1 Aug 2024; GPAI rules from 2 Aug 2025; high-risk rules from 2 Aug 2027; €35M or 7% turnover.
EU NIS2 — Directive (EU) 2022/2555; in force 16 Jan 2023; transposition deadline 17 Oct 2024; 24-hour early warning + 72-hour notification.
EU DORA — Regulation (EU) 2022/2554; applicable 17 Jan 2025; covers ~22,000 financial entities.
EU Data Act — Regulation (EU) 2023/2854; in force 11 Jan 2024; applicable 12 Sep 2025.
UK GDPR + DPA 2018 — in force 25 May 2018; £17.5M or 4% turnover; 72-hour breach window.
US HIPAA — Pub. L. 104-191, signed 21 Aug 1996; Breach Notification Rule effective 23 Sep 2009; 60-day patient notification.
US HITECH Act — Pub. L. 111-5, signed 17 Feb 2009; tiered penalties up to $1.5M per category per year.
US CCPA — Cal. Civ. Code §1798.100; effective 1 Jan 2020; $7,500 per intentional violation.
US CPRA — Proposition 24, passed 3 Nov 2020; effective 1 Jan 2023; CPPA enforcement from 1 Jul 2023.
Brazil LGPD — Lei nº 13.709/2018; sanctioned 14 Aug 2018; effective 18 Sep 2020; fines up to R$50,000,000 or 2% revenue.
Canada PIPEDA — S.C. 2000, c. 5; mandatory breach reporting since 1 Nov 2018.
Canada Quebec Law 25 — adopted 22 Sep 2021; rolled out 22 Sep 2022, 2023, 2024.
China PIPL — adopted 20 Aug 2021; effective 1 Nov 2021; fines up to ¥50,000,000 or 5% annual turnover.
India DPDP Act — Act No. 22 of 2023; assented 11 Aug 2023; penalties up to ₹2,500,000,000.
Japan APPI — Act No. 57 of 2003; major revision effective 1 Apr 2022.
South Korea PIPA — Act No. 10465 of 2011; revised 5 Feb 2020.
Singapore PDPA — Act No. 26 of 2012; max fine S$1,000,000 or 10% turnover since 1 Oct 2022.
Thailand PDPA — published 27 May 2019; fully effective 1 Jun 2022.
South Africa POPIA — Act 4 of 2013; effective 1 Jul 2021; ZAR 10,000,000 maximum fine.
Australia Privacy Act 1988 — NDB scheme since 22 Feb 2018; civil penalty up to A$50,000,000.
ISO/IEC 27701:2019 — privacy information management; published 6 Aug 2019.
ISO/IEC 27001:2022 — information security; published 25 Oct 2022.
WCAG 2.2 — W3C Recommendation; published 5 Oct 2023; 86 success criteria.