Dos Formas de Anonimizar Texto
Cuando necesitas eliminar información personal del texto, anonym.plus te da dos operadores de anonimización distintos: Reemplazar y Encriptar. Ambos utilizan el mismo motor de detección subyacente — Microsoft Presidio combinado con modelos spaCy NER — para identificar más de 340 tipos de información de identificación personal (PII). La diferencia radica en lo que sucede después de la detección.
Reemplazar sustituye cada entidad detectada con un marcador genérico como <PERSON> o <EMAIL_ADDRESS>. El valor original se ha ido para siempre. Encriptar transforma cada entidad en un token cifrado AES-256-GCM que puede descifrarse más tarde con la clave de encriptación correcta. Ambas operaciones ocurren completamente en tu máquina local — nunca se envía texto a un servidor.
Entender cuándo usar cada enfoque es crítico para flujos de trabajo de cumplimiento, escenarios de colaboración y gobernanza de datos. Esta guía te acompaña a través de ambos métodos paso a paso y proporciona una comparación detallada para ayudarte a elegir.
Cómo Funciona Reemplazar Texto
El operador Reemplazar es el método de anonimización más común. Elimina permanentemente PII sustituyendo cada entidad detectada con un marcador basado en tipo. Aquí está el flujo de trabajo completo:
- Pega tu texto. Abre anonym.plus y pega el texto que deseas anonimizar en el área de entrada de texto. La aplicación funciona completamente sin conexión — tu texto nunca abandona tu dispositivo.
- Selecciona un preset de detección. Elige entre 121 presets incorporados como PII General, Cumplimiento GDPR, Médico HIPAA, o Servicios Financieros. Cada preset define qué tipos de entidades detectar y con qué umbral de confianza. También puedes crear presets personalizados en Configuración.
- Inicia análisis. Haz clic en "Iniciar Análisis" para ejecutar el motor NLP local. Presidio y spaCy escanean tu texto en busca de nombres, direcciones de correo electrónico, números de teléfono, fechas, ubicaciones, números de tarjeta de crédito, IBANs, IDs nacionales, y docenas de otros tipos de entidades.
- Revisa entidades detectadas. Cada entidad detectada aparece con una insignia codificada por color mostrando su tipo y puntuación de confianza. Puedes activar o desactivar detecciones individuales — útil para corregir falsos positivos o preservar valores específicos que deseas mantener.
- Elige el operador Reemplazar. En el panel de selección de operador, selecciona "Reemplazar" para cada tipo de entidad (o establécelo como predeterminado). Puedes personalizar el formato de reemplazo — por ejemplo, reemplazar nombres con
<PERSON_1>,<PERSON_2>para mantener coherencia de entidades. - Anonimiza y exporta. Haz clic en "Anonimizar" para procesar. El texto de salida contiene solo los marcadores — los valores PII originales se eliminan permanentemente. Copia el resultado a tu portapapeles o guárdalo como archivo.
Después del procesamiento, tu texto podría verse así: "<PERSON> envió una factura el <DATE_TIME> desde <LOCATION>." Los nombres, fechas y ubicaciones originales se han ido irreversiblemente.
Cómo Funciona Encriptar Texto
El operador Encriptar sigue el mismo flujo de trabajo de detección pero produce una salida fundamentalmente diferente. En lugar de marcadores, cada entidad PII se reemplaza con un token encriptado que puede invertirse.
- Pega tu texto. Lo mismo que arriba — pega texto en el área de entrada.
- Selecciona un preset de detección. Elige los mismos presets que en modo Reemplazar. El paso de detección es idéntico.
- Inicia análisis y revisa. El motor NLP detecta entidades de la misma manera. Revisa y activa/desactiva detecciones según sea necesario.
- Elige el operador Encriptar. Selecciona "Encriptar" en el panel de operadores. Necesitarás una clave de encriptación — crea una en Configuración o selecciona una clave existente de tu bóveda.
- Anonimiza con encriptación. Haz clic en "Anonimizar." Cada entidad PII se encripta individualmente usando AES-256-GCM con un nonce aleatorio por entidad. La salida contiene tokens encriptados como
<ENC:aGVsbG8gd29ybGQ=:iv:tag>en lugar de los valores originales. - Exporta y comparte. El documento encriptado puede compartirse con seguridad. Los destinatarios ven solo tokens de cifrado — no el PII original. Puedes desanonimizar el documento más tarde usando la característica Desanonimizar con la misma clave de encriptación.
La salida encriptada preserva la estructura del documento mientras hace que el PII sea ilegible para cualquiera sin la clave. Esto habilita un poderoso flujo de trabajo de colaboración: encripta un documento, compártelo con colegas para editar, recíbelo de vuelta, y desencripta el PII — incluso si el texto circundante fue modificado.
Reemplazar vs Encriptar: Cuándo Usar Cuál
La siguiente tabla proporciona una comparación lado a lado de los dos operadores a través de las dimensiones más importantes:
| Característica | Reemplazar | Encriptar |
|---|---|---|
| Reversibilidad | Irreversible — PII original se elimina permanentemente | Totalmente reversible — desencripta con la misma clave de encriptación |
| Formato de salida | Marcadores legibles por humanos (<PERSON>, <EMAIL>) |
Tokens de cifrado codificados en Base64 |
| Mejor caso de uso | Publicación pública, redacción permanente, anonimización GDPR | Compartir interno, colaboración, redacción temporal |
| Rendimiento | Más rápido — sustitución de cadena simple | Ligeramente más lento — encriptación AES-256-GCM por entidad |
| Nivel de seguridad | Máximo — el dato ya no existe | Alto — AES-256-GCM con nonce aleatorio por entidad |
| Clave requerida | No | Sí — debe seleccionar o crear una clave de encriptación |
| Clasificación GDPR | Anonimización (datos salen del alcance GDPR) | Seudonimización (datos permanecen en alcance GDPR) |
| Colaboración | El documento compartido no puede revertirse | Comparte, edita, devuelve — luego desencripta tokens intactos |
| Legibilidad de salida | Alta — los marcadores son auto-explicativos | Baja — los tokens de cifrado son opacos |
Cuándo elegir Reemplazar
- Necesitas publicar o compartir documentos públicamente y nunca quieres que el PII original sea recuperable.
- Los requisitos regulatorios demandan anonimización completa (GDPR Artículo 4: los datos anonimizados ya no son datos personales).
- Estás creando conjuntos de datos de entrenamiento, accesorios de prueba, o registros sanitizados donde los marcadores son suficientes.
- Deseas el procesamiento más simple y rápido sin gastos generales de gestión de claves.
Cuándo elegir Encriptar
- Necesitas compartir documentos para revisión o edición pero deseas restaurar el PII original después.
- Los procesos legales o de auditoría requieren la capacidad de rastrear hasta identidades originales.
- Estás trabajando en un equipo donde algunos miembros necesitan ver PII y otros no.
- Deseas seudonimización en lugar de anonimización completa — por ejemplo, Artículo 25 GDPR protección de datos por diseño.
Guía Paso a Paso
Aquí está una guía paso a paso combinada cubriendo ambos operadores de principio a fin:
- Abre anonym.plus. La aplicación se lanza con la pestaña Anonimizar activa.
- Pega texto en el área de entrada, o escribe directamente. No hay límite de tamaño para entrada de texto más allá de la memoria disponible.
- Selecciona un preset de detección del menú desplegable. Para uso general, "Detección General de PII" (umbral 0.85) funciona bien. Para cumplimiento más estricto, elige "Cumplimiento GDPR" (umbral 0.90).
- Haz clic en "Iniciar Análisis." El motor Presidio local escanea el texto. Las entidades detectadas se resaltan con insignias codificadas por color.
- Revisa cada detección. Haz clic en cualquier entidad para ver su tipo, puntuación de confianza, y posición. Desactiva falsos positivos.
- Elige tu operador:
- Para Reemplazar: selecciona "Reemplazar" en el menú desplegable de operador. No se necesita configuración adicional.
- Para Encriptar: selecciona "Encriptar" y elige una clave de encriptación de tu bóveda (o crea una nueva).
- Haz clic en "Anonimizar." El motor aplica tu operador elegido a cada entidad habilitada.
- Revisa la salida. Para Reemplazar, verifica que los marcadores sean correctos. Para Encriptar, verifica que los tokens encriptados estén presentes.
- Copia al portapapeles o guarda como archivo. La entrada de procesamiento se guarda en tu historial local para referencia futura o desanonimización.
¿Listo para intentarlo? Míralo en acción →