Wann Sie Batch-Verarbeitung verwenden
anonym.plus bietet zwei Verarbeitungsmodi: Einzel-Datei und Batch. Das Verstehen, wann Sie jeden verwenden, spart erhebliche Zeit und stellt konsistente Ergebnisse über Dokumentensätze hinweg sicher.
| Aspekt | Einzel-Datei-Modus | Batch-Modus |
|---|---|---|
| Dateien | Eine Datei auf einmal | Bis zu 20 Dateien gleichzeitig |
| Überprüfung | Manuelle Überprüfung jeder Entität | Auto-Genehmigungsoption verfügbar |
| Verarbeitung | Sequenziell | Parallel (1-5 gleichzeitige Dateien) |
| Export | Einzelner Datei-Download | ZIP-Archiv-Export |
Verwenden Sie Batch-Modus, wenn Sie große Dokumentensätze mit konsistenter Anonymisierung haben, wenn Sie die gleiche Vorgabe über alle Dateien anwenden möchten, oder wenn Sie automatisierte Workflows ohne manuelle Entitäts-für-Entitäts-Überprüfung benötigen. Bleiben Sie bei Einzel-Datei-Modus für hochrisiko-Dokumente, die sorgfältige per-Entitäts-Überprüfung erfordern, oder wenn jedes Dokument unterschiedliche Operator-Einstellungen benötigt.
Batch Replace vs Batch Encrypt
Batch-Modus unterstützt beide Replace- und Encrypt-Operatoren. Die Wahl bestimmt, ob Anonymisierung permanent oder reversibel ist:
| Feature | Batch Replace | Batch Encrypt |
|---|---|---|
| Ausgabe | Platzhalter (<PERSON>) |
Verschlüsselte Tokens |
| Reversibilität | Irreversibel | Reversibel mit Schlüssel |
| Schlüssel erforderlich | Nein | Ja |
| Export | ZIP mit anonymisierten Dateien | ZIP mit verschlüsselten Dateien |
| Anwendungsfall | Öffentliche Freigabe, permanente Redaktion | Interne Freigabe, spätere Entschlüsselung |
Schritt-für-Schritt: Batch Replace
Folgen Sie diesen Schritten, um mehrere Dokumente dauerhaft mit dem Replace-Operator zu anonymisieren:
- Navigieren Sie zur Batch-Modus-Registerkarte. Die Dropzone akzeptiert PDF-, DOCX-, TXT-, CSV-, JSON-, XML- und XLSX-Dateien bis zu 50 MB pro Datei.
- Fügen Sie mehrere Dateien hinzu. Ziehen Sie bis zu 20 Dateien auf die Dropzone. Konfigurieren Sie Ihre Erkennungsvorgabe, wählen Sie den Replace-Operator, legen Sie die Parallelität (1-5 parallele Dateien) fest und schalten Sie auto-approve um, wenn Sie manuelle Entitäts-Überprüfung überspringen möchten.
- Überprüfen Sie Batch-Einstellungen. Überprüfen Sie Ihre Konfiguration: Vorgabe, Operator (Replace), parallele Datei-Anzahl, auto-approve Umschaltung, continue-on-error Umschaltung, Ausgabeformat, ZIP-Export-Option und Dateiname-Muster (z. B.
{name}_anonymisiert.{ext}). - Klicken Sie auf Batch starten. Der Fortschritt-Balken zeigt die Gesamtvervollständigung. Jede Datei zeigt ihren individuellen Status: in Warteschlange, wird analysiert oder abgeschlossen. Live-Statistiken zeigen verstrichene Zeit, geschätzte verbleibende Zeit und Gesamtentitäten über alle Dateien hinweg.
- Alle Dateien abgeschlossen. Grüne Häkchen erscheinen neben jeder erfolgreich verarbeiteten Datei mit Entitäts-Zählungen. Klicken Sie auf Export-Ergebnisse-Button.
- Ergebnis-Zusammenfassung. Ein Modal zeigt die Batch-Zusammenfassung: Erfolgsquote, abgeschlossene Dateien, insgesamt erkannte und ersetzte Entitäten, und das ZIP-Archiv wird an Ihren gewählten Speicherort exportiert.
Schritt-für-Schritt: Batch Encrypt
Der Batch Encrypt-Workflow folgt der gleichen Struktur, erzeugt aber reversible verschlüsselte Ausgabe:
- Navigieren Sie zur Batch-Modus-Registerkarte. Gleiche Dropzone akzeptiert PDF-, DOCX-, TXT-, CSV-, JSON-, XML- und XLSX-Dateien.
- Wechseln Sie zum Encrypt-Operator. Nach dem Hinzufügen Ihrer Dateien wählen Sie Encrypt als Operator und wählen Sie einen Verschlüsselungsschlüssel aus der Dropdown-Liste. Alle Dateien im Batch verwenden diesen Schlüssel.
- Konfigurieren Sie Einstellungen. Legen Sie Parallelität, auto-approve, continue-on-error fest und geben Sie Ausgabeformat an. Der Verschlüsselungsschlüssel wird in der Einstellungs-Zusammenfassung zur Bestätigung angezeigt.
- Überwachen Sie Fortschritt. Gleiches Fortschritt-Layout wie Batch Replace: per-Datei Status-Indikatoren, Fortschritt-Balken und Live-Statistiken für verstrichene Zeit, verbleibende Zeit und gefundene Entitäten.
- Alle Dateien verschlüsselt. Grüne Häkchen bestätigen, dass jede Datei verarbeitet wurde. Entitäts-Zählungen zeigen, wie viele PII-Entitäten in jedem Dokument verschlüsselt wurden.
- Ergebnis-Zusammenfassung. Das Modal zeigt Erfolgsquote, abgeschlossene Dateien, insgesamt verschlüsselte Entitäten und das ZIP-Archiv mit allen verschlüsselten Dateien wird exportiert.
Batch-Limits und Konfiguration
Die folgende Tabelle fasst alle Batch-Verarbeitungs-Limits und konfigurierbaren Optionen zusammen:
| Parameter | Wert |
|---|---|
| Dateien pro Batch | 20 Maximum |
| Gesamt-Batch-Größe | Pro-Format-Limits gelten (PDF 50 MB, DOCX 30 MB, XLSX 20 MB, CSV/JSON/XML 30 MB, TXT 50 MB) |
| Parallele Verarbeitung | 1-5 gleichzeitige Dateien |
| Auto-approve | Überspringe manuelle Entitäts-Überprüfung (an/aus) |
| Continue on error | Markiere fehlgeschlagene Dateien einzeln, ohne den Batch zu stoppen |
| Ausgabeformat | Gleich wie Eingabe, PDF, DOCX oder TXT |
| Export | ZIP-Archiv mit allen verarbeiteten Dateien |
| Dateiname-Muster | {name}_anonymisiert.{ext} |
Sie können Dateitypen im gleichen Batch mischen. Die App verarbeitet formatspezifische Text-Extraktion unabhängig für jede Datei. Jede Datei im Batch erstellt einen eigenen Eintrag in Ihrer lokalen Verarbeitungs-Verlauf, daher können Sie einzelne Dateien deanonymisieren, ohne den gesamten Satz erneut zu verarbeiten.
Bereit, es selbst zu versuchen? Sehen Sie es in Aktion →