Preguntas Frecuentes

Todo lo que necesita saber sobre la anonimización de documentos sin conexión con anonym.plus.

Seguridad y privacidad

Sí. Los documentos se procesan completamente de forma local. El motor de detección de PII se ejecuta en su máquina. Las claves de cifrado nunca salen de su bóveda (arquitectura de conocimiento cero — el frontend solo referencia claves por ID, los valores reales permanecen en el backend Rust). Todo el almacenamiento está cifrado con AES-256-GCM.
No. El motor local Presidio maneja la detección de PII sin conexión. Internet solo se necesita para sincronización de cuenta, descarga de modelos y actualizaciones de la aplicación. Toda la anonimización y desanonimización principal funciona completamente sin conexión.
Su bóveda está cifrada. Sin su PIN o frase de recuperación, no se puede acceder a los datos. Si tiene una cuenta en la nube, las plantillas y metadatos de claves de cifrado se sincronizan entre dispositivos.
Durante la configuración, se genera una frase de recuperación de 24 palabras (estilo BIP39). Esta es la ÚNICA forma de recuperar su bóveda si olvida su PIN. Escríbala y guárdela de forma segura — se muestra una vez durante la configuración y puede verse después en Configuración → Seguridad solo mientras la bóveda está desbloqueada.
Use su frase de recuperación de 24 palabras para desbloquear la bóveda. Después de 3 intentos fallidos de PIN, la aplicación sugiere usar la frase de recuperación. Si ha perdido tanto el PIN como la frase de recuperación, los datos de su bóveda no pueden recuperarse.
Sí. La bóveda se bloquea automáticamente después de 15 minutos de inactividad (sin eventos de ratón, teclado o desplazamiento). También puede bloquearla manualmente desde el encabezado. En modo demo, el bloqueo automático está desactivado ya que el usuario demo no establece un PIN.
Sí. Vaya a Configuración → Seguridad → Cambiar directorio de datos para mover las bases de datos de su bóveda a una ubicación diferente (por ejemplo, un volumen cifrado con VeraCrypt o BitLocker). La aplicación requiere un reinicio después del traslado.
Vaya a Configuración → Seguridad → Copia de seguridad y restauración. 'Exportar datos' crea un ZIP de las bases de datos de su bóveda. 'Importar datos' reemplaza los datos existentes (máx. 100 MB). La importación requiere un reinicio de la aplicación y le advierte que sobrescribirá todos los datos actuales.
Configuración → Seguridad → Eliminar todos los datos locales. Debe escribir 'DELETE ALL LOCAL DATA' para confirmar. Esto elimina la bóveda cifrada, el historial, la frase de recuperación, todas las configuraciones locales y las credenciales API en caché. NO afecta a su cuenta en línea ni a los datos sincronizados en la nube. La aplicación se cierra después de la eliminación.

Anonimización

Cinco operadores: Replace (sustituye con <ENTITY_TYPE> o texto personalizado), Redact (elimina completamente), Mask (reemplaza con caracteres *, cantidad configurable), Hash (SHA-256, SHA-512 o MD5 — irreversible) y Encrypt (cifrado AES reversible usando una clave almacenada — solo este puede descifrarse después).
Entrada: PDF, DOCX, XLSX/XLS, TXT, CSV, JSON, XML e imágenes (PNG, JPG, BMP, TIFF). Salida: PDF, DOCX, TXT o igual que la entrada. Nota: los archivos .txt requieren al menos una licencia Basic; todos los demás formatos de documento requieren una licencia Pro.
PDF: 50 MB, TXT: 50 MB, DOCX: 30 MB, CSV: 30 MB, JSON: 30 MB, XML: 30 MB, XLSX: 20 MB o 100.000 filas. Imágenes: 10 MB y 25 megapíxeles. Los documentos deben contener al menos 10 caracteres de texto para ser analizados.
Por defecto: {baseName}_anonymized_{timestamp}.{ext}. En modo por lotes, puede personalizar el patrón de nomenclatura usando variables de plantilla. También puede elegir reemplazar el archivo original.
Varias causas posibles: 1) El umbral de confianza en su plantilla puede ser demasiado alto — redúzcalo para más detecciones. 2) El tipo de entidad puede estar desactivado globalmente en Configuración → Entidades. 3) Para entidades personalizadas, verifique que el patrón regex coincida con sus datos usando el probador de patrones integrado. 4) El reconocimiento de entidades nombradas usa el modelo NER en inglés — la detección de nombres de personas funciona mejor con nombres en inglés/latinos, aunque las entidades basadas en patrones (teléfonos, IBANs, correos) funcionan en todos los idiomas.
La aplicación automáticamente recurre al operador 'replace' con marcadores <ENTITY_TYPE> para prevenir pérdida de datos. Verá la entidad anonimizada pero no cifrada. Cree una clave en Configuración → Claves de cifrado para usar cifrado.

Desanonimización

Cambie al modo Desanonimizar. Tiene tres opciones: soltar un archivo, pegar texto directamente o seleccionar del historial de procesamiento. La aplicación compara automáticamente con su historial para encontrar las claves de cifrado correctas. Haga clic en Desanonimizar para restaurar los valores PII originales.
Cuando pega o suelta texto, la aplicación busca en su historial usando dos estrategias: 1) Coincidencia exacta — si el texto coincide exactamente con una salida anterior. 2) Coincidencia difusa — verifica si al menos el 50% de los bloques cifrados de una entrada del historial aparecen en su texto. Esto significa que puede descifrar documentos incluso después de que hayan sido editados por colaboradores.
Sí. La aplicación usa coincidencia difusa para encontrar bloques cifrados en texto modificado. Mientras los bloques cifrados estén intactos (no cortados parcialmente o editados), pueden descifrarse. El texto circundante puede añadirse, eliminarse o reorganizarse libremente.
1) Anonimice un documento con el operador 'encrypt'. 2) Comparta el documento anonimizado con colaboradores. 3) Ellos editan alrededor de los bloques cifrados. 4) Usted lo recibe de vuelta y lo suelta en Desanonimizar → Soltar archivo. 5) La aplicación auto-detecta bloques cifrados, carga claves del historial y descifra. Esto permite colaboración segura donde solo usted puede ver el PII original.
La aplicación descifra todos los bloques cifrados intactos y omite los que faltan o están dañados. Verá un recuento de bloques faltantes y una advertencia, pero el resto del documento se restaura completamente (recuperación parcial).
No. La aplicación almacena la asignación de claves en el historial de su bóveda. Cuando suelta un documento para desanonimización, selecciona automáticamente la clave correcta para cada tipo de entidad.
El texto pegado no contiene marcadores de entidad (<PERSON>, etc.) o bloques cifrados reconocibles. Si usó el operador encrypt, seleccione la entrada desde la pestaña 'Desde historial' — las posiciones de entidades cifradas están almacenadas allí. Nota: el historial almacena solo los primeros 10.000 caracteres, así que documentos muy largos pueden estar truncados.

Claves de cifrado

Los valores de las claves de cifrado nunca salen del backend Rust. El frontend solo almacena metadatos de clave (nombre, ID, tipo de entidad, contador de uso). Al cifrar, el frontend envía un ID de clave (no el valor) al backend Rust, que resuelve el material de clave real. Esto significa que incluso si alguien accediera a la memoria del frontend, no podría extraer sus claves de cifrado.
128 bits (16 bytes), 192 bits (24 bytes) y 256 bits (32 bytes). Se recomienda 256 bits y es el valor predeterminado para nuevas claves.
Sí. Al crear una clave, puede asignarla a un tipo de entidad específico (por ejemplo, solo para PERSON, solo para US_SSN) o establecerla en 'ALL' (predeterminado). Las claves con alcance de entidad aparecen cuando selecciona el operador encrypt para ese tipo de entidad.
La rotación genera nuevo material de clave. El valor de clave anterior se reemplaza permanentemente. Los documentos cifrados con la clave anterior necesitarán el valor de clave anterior para desanonimización — así que solo rote si ha guardado la clave anterior o ya no necesita descifrar documentos antiguos. El nuevo hex de clave se muestra una vez.
Por seguridad, los valores de clave generados y rotados se muestran solo una vez con una cuenta regresiva de 30 segundos para auto-ocultarse. Copie y guarde la clave de forma segura antes de cerrar. Esto evita que el material de clave permanezca en la interfaz.

Procesamiento por lotes

El modo por lotes procesa múltiples archivos a la vez. Configure la concurrencia (1–5 archivos en paralelo, predeterminado 2), manejo de errores (continuar o detener en error), aprobación automática vs. revisión manual, formato de salida y patrón de nomenclatura. Solo puede ejecutarse un lote a la vez. Requiere una licencia Pro.
Cuando la aprobación automática está habilitada, todas las entidades detectadas se aceptan automáticamente sin revisión manual. Puede configurar un operador global (Replace/Redact/Mask/Hash/Encrypt) u operadores por tipo de entidad. Cuando está deshabilitado, cada archivo se pausa en el paso de revisión para que verifique y apruebe las entidades.
Sí. Elija entre ZIP (todos los archivos agrupados), carpeta (guarda en una subcarpeta con fecha) o archivos individuales. También puede exportar un resumen de procesamiento en formato JSON, CSV o ambos.
Depende de su configuración de modo de error. 'Continuar' marca el archivo fallido como error y procesa el resto. 'Detener en error' detiene todo el lote. Los archivos fallidos pueden reintentarse individualmente.

Plantillas

Más de 120 plantillas integradas en 7 categorías: Auto (5), específicas por país (55+), regionales multipaís (12), técnicas/DevSecOps (14), industria (13), salud (3) y finanzas (4). Cada plantilla configura qué tipos de entidades detectar, el umbral de confianza y operadores opcionales por entidad.
Sí. Vaya a Configuración → Plantillas → Crear plantilla personalizada. Seleccione tipos de entidades (incluyendo sus entidades personalizadas), establezca un umbral de confianza (50–100%), configure operadores por entidad y elija un idioma de detección. También puede duplicar cualquier plantilla integrada como punto de partida.
El umbral (50–100%) controla cuán seguro debe estar el motor de detección antes de reportar una entidad. Umbrales más bajos detectan más entidades pero pueden tener falsos positivos. Umbrales más altos son más precisos pero pueden omitir algunas entidades. Las plantillas financieras usan 0,95, las de desarrollo usan 0,70.

Entidades personalizadas

Vaya a Configuración → Entidades personalizadas para definir sus propios tipos de PII usando patrones regex (por ejemplo, IDs de empleados, códigos internos, números de proyecto). Cada entidad puede tener hasta 10 patrones, palabras de contexto para mejor coincidencia y una puntuación de confianza. Las entidades personalizadas se detectan junto con los más de 200 tipos integrados y pueden usar todos los operadores incluyendo cifrado.
Máximo 50 entidades personalizadas, 10 patrones por entidad, 20 palabras de contexto por entidad. Los patrones regex están limitados a 500 caracteres. Los nombres de entidad deben estar en formato MAYÚSCULAS_CON_GUIONES_BAJOS (2–64 caracteres). Los patrones se validan contra ReDoS (retroceso catastrófico) para evitar bloqueos de la interfaz.
Sí. La exportación guarda todas las entidades personalizadas como un archivo JSON (la aplicación le advierte que los patrones estarán en texto plano). La importación acepta archivos JSON de hasta 1 MB, regenera IDs, valida contra límites y reporta cuántas fueron importadas, omitidas o con errores.

Imágenes

PNG, JPG/JPEG, BMP y TIFF. El tamaño máximo de archivo es 10 MB y la resolución máxima es 25 megapíxeles.
Proceso de dos pasos: 1) Análisis — Tesseract OCR extrae texto con cuadros delimitadores a nivel de carácter, luego el motor PII detecta entidades. 2) Redacción — se dibujan rectángulos de color sobre las regiones de PII detectadas. Usted elige el color de relleno (negro, blanco, rojo, verde, azul, gris). La salida se guarda como archivo PNG.
Las fotos de pantallas producen patrones de moiré, brillo, reflejos y bajo contraste que degradan significativamente la precisión del OCR. Use capturas de pantalla (Impr Pant, Recortes, etc.) o exportaciones digitales directas.
No. El motor OCR (Tesseract) está optimizado para texto impreso y mecanografiado. El texto manuscrito probablemente no será detectado o producirá resultados poco fiables.
Actualmente, la anonimización de imágenes procesa una imagen a la vez. El modo por lotes soporta formatos de documento (PDF, DOCX, etc.) pero no imágenes.

Modelos e idiomas

23 modelos de idioma basados en spaCy: inglés (integrado), alemán, español, francés, italiano, portugués, holandés, polaco, rumano, danés, griego, finlandés, croata, lituano, macedonio, noruego, ruso, sueco, ucraniano, japonés, chino, coreano y un modelo multilingüe. Los tamaños van de 15 a 54 MB.
Las descargas de modelos requieren conexión a internet. Una vez descargados, los modelos funcionan completamente sin conexión. También puede importar modelos desde archivos .tar.gz, .gz o .zip si los tiene localmente.
La interfaz de usuario soporta 48 idiomas. Esto es independiente de los modelos NLP — el idioma de la interfaz es para menús y etiquetas, mientras que los modelos NLP son para la detección de entidades PII.

Historial

El historial se limpia automáticamente después de 90 días o cuando se alcanza el límite de entradas (1.000 entradas). La retención base asegura que las 500 entradas más recientes siempre se conserven. La eliminación del historial es permanente por razones de privacidad.
No. Solo los primeros 10.000 caracteres del texto de entrada y salida se almacenan en el historial. Los documentos muy largos se truncarán. Las posiciones completas de entidades y valores cifrados se almacenan para permitir la desanonimización.

Licencias

La demo le da 30 minutos de acceso con anonimización básica, cifrado y desanonimización — solo en modo texto. El procesamiento de archivos, modo por lotes y anonimización de imágenes no están disponibles en la demo. No se necesita cuenta.
Tres formas: 1) Pegue la clave de licencia en Configuración → Licencia. 2) Importe un archivo de licencia (.license, .lic, .key, .txt, .json). 3) Haga clic en el enlace de activación de su correo — el enlace profundo anonym-plus:// se activa automáticamente.
Free: modo texto, cifrado, desanonimización, 1 máquina. Basic: añade soporte de archivos .txt, 3 máquinas. Pro: añade todos los formatos de archivo, procesamiento por lotes, 3 máquinas. Expert: añade anonimización de imágenes, 5 máquinas.
Sí. anonym.legal ofrece el mismo motor de anonimización como servicio gestionado en la nube con una API para desarrolladores — para flujos de trabajo que requieren procesamiento por lotes via REST o integración en infraestructura de servidores. anonym.plus y anonym.legal son parte de la familia de productos anonymize.solutions.

Actualizaciones

La aplicación busca actualizaciones automáticamente cada 24 horas. Cuando está disponible, aparece una notificación en Configuración → Acerca de (y un punto animado en el botón de Configuración). Haga clic en 'Descargar e instalar' para actualizar (~110 MB de descarga). La aplicación se cierra y reinicia con la nueva versión.
Las actualizaciones automáticas no son compatibles con la versión portátil (.zip). Verá una notificación dirigiéndole a descargar la última versión manualmente desde la página de Releases de GitHub.
Cuando una nueva versión tiene un número de versión mayor más alto (por ejemplo, v8 a v9), la aplicación advierte que su licencia puede cubrir solo la versión mayor actual. Las funciones básicas permanecen disponibles, pero puede necesitar actualizar su licencia para las funciones de la nueva versión.

Solución de problemas

Vaya a Configuración → Avanzado y haga clic en 'Reiniciar motor PII'. Si sigue fallando, verifique el estado del motor en Configuración → Acerca de. Abra el registro de depuración (Ctrl+Shift+D) para mensajes de error detallados. Intente reiniciar la aplicación completamente.
Intente reiniciar la aplicación. Si persiste, restablezca la bóveda en Configuración → Seguridad. Como último recurso, use 'Eliminar todos los datos locales' para un restablecimiento de fábrica.
Verifique: 1) La entidad está habilitada en Configuración → Entidades personalizadas. 2) El patrón regex coincide con sus datos de prueba (use el probador de patrones integrado). 3) El patrón no está marcado como peligroso para ReDoS — la aplicación los omite por seguridad. 4) Al usar plantillas con entidades personalizadas, la aplicación detecta automáticamente todos los tipos de entidades incluyendo las personalizadas.
La clave de cifrado no coincide. Verifique que la clave correcta esté seleccionada — revise Configuración → Claves de cifrado. Si la clave fue rotada, necesita el valor de clave anterior. También puede ingresar una clave hex manualmente en el selector de claves si tiene una copia de seguridad.

58 preguntas · 13 categorías