Glossar

Schlüsselbegriffe für PII-Erkennung, Dokumentenanonymisierung und Verschlüsselung.

Dieses Glossar definiert die technischen Begriffe, die in der gesamten Dokumentation, Sicherheitsarchitektur und Benutzeroberfläche von anonym.plus verwendet werden. Die Begriffe beziehen sich auf PII-Erkennung, NLP, Kryptografie und Datenschutzvorschriften.

A
AES-256-GCM
Advanced Encryption Standard mit 256-Bit-Schlüsseln im Galois/Counter Mode. Ein authentifizierter Verschlüsselungsalgorithmus, der sowohl Vertraulichkeit als auch Integrität gewährleistet. Wird von anonym.plus für die Vault-Verschlüsselung und reversible Dokumentenanonymisierung verwendet.
Anonymisierung
Der Prozess der Entfernung, Ersetzung oder Verschleierung personenbezogener Daten (PII) in Dokumenten, sodass Personen nicht erneut identifiziert werden können. anonym.plus bietet fünf Methoden: Replace, Redact, Mask, Hash und Encrypt.
Argon2id
Eine speicherintensive Passwort-Hashing- und Schlüsselableitungsfunktion. Kombiniert Argon2i (Seitenkanalresistent) und Argon2d (GPU-resistent). anonym.plus verwendet Argon2id mit 64 MB Speicherkosten und 3 Iterationen, um Vault-Verschlüsselungsschlüssel aus Benutzerpasswörtern abzuleiten.
B
Stapelverarbeitung
Gleichzeitige Verarbeitung mehrerer Dateien durch die Anonymisierungs-Pipeline. anonym.plus unterstützt 1-5 parallele Dateien mit konfigurierbarer Fehlerbehandlung und Auto-Approve-Modus. Erfordert eine Pro-Lizenz.
BIP39 (Bitcoin Improvement Proposal 39)
Ein Standard zur Erzeugung mnemonischer Wiederherstellungsphrasen aus zufälliger Entropie. anonym.plus generiert während der Vault-Einrichtung eine 24-Wort-BIP39-Phrase (256 Bit Entropie) als einzigen Wiederherstellungsmechanismus, falls der Benutzer seine PIN vergisst.
C
Konfidenz-Schwellenwert
Ein Wert (0,50 bis 1,00), der bestimmt, wie sicher die Erkennungs-Engine sein muss, bevor eine PII-Entität gemeldet wird. Niedrigere Schwellenwerte erfassen mehr Entitäten, erhöhen aber die Falsch-Positiv-Rate. Finanzpresets verwenden 0,95; Entwicklungspresets verwenden 0,70.
Benutzerdefinierte Entität
Ein benutzerdefinierter PII-Typ mit Regex-Mustern. anonym.plus unterstützt bis zu 50 benutzerdefinierte Entitäten mit jeweils bis zu 10 Mustern, Kontextwörtern und ReDoS-sicherer Validierung. Wird zusammen mit den über 200 integrierten Typen erkannt.
D
Deanonymisierung
Der umgekehrte Prozess der Wiederherstellung originaler PII-Werte in einem anonymisierten Dokument. Nur möglich, wenn der Encrypt-Operator verwendet wurde (AES-256-GCM). Replace, Redact, Mask und Hash sind konstruktionsbedingt irreversibel. anonym.plus unterstützt automatischen Abgleich mit der Verarbeitungshistorie.
Erkennungsvorlage
Eine gespeicherte Konfiguration, die festlegt, welche Entitätstypen erkannt werden, den Confidence-Schwellenwert und optionale Operatoren pro Entität. anonym.plus enthält 121 integrierte Presets in 7 Kategorien: Auto, Länderspezifisch, Regional, Technisch/DevSecOps, Industrie, Gesundheitswesen und Finanzen.
E
E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness)
Googles Qualitätsbewertungsrahmen für Webinhalte. Zeigt, dass Inhaltsersteller direkte Erfahrung mit und Expertise in ihrem Fachgebiet haben.
Verschlüsselungs-Operator
Eine Anonymisierungsmethode, die PII durch AES-256-GCM-verschlüsselten Chiffretext ersetzt. Im Gegensatz zu Replace, Redact, Mask oder Hash können verschlüsselte Entitäten später mit demselben Schlüssel entschlüsselt werden — was den Workflow „Verschlüsseln, Teilen, Bearbeiten, Entschlüsseln" ermöglicht.
Entitätstyp
Eine Kategorie von PII, die die Erkennungs-Engine identifizieren kann. Beispiele: PERSON, EMAIL_ADDRESS, US_SSN, CREDIT_CARD, DE_TAX_ID. anonym.plus erkennt über 200 Entitätstypen in 18 Gruppen.
G
DSGVO (Datenschutz-Grundverordnung)
EU-Verordnung zur Regelung der Verarbeitung personenbezogener Daten. Erfordert Datenminimierung, Zweckbindung und Schutz personenbezogener Daten. anonym.plus hilft Organisationen bei der Einhaltung, indem PII vor der Weitergabe von Dokumenten erkannt und entfernt wird.
H
Hash-Operator
Eine Anonymisierungsmethode, die PII durch einen kryptografischen Einweg-Hash ersetzt (SHA-256, SHA-512 oder MD5). Irreversibel — der Originalwert kann nicht wiederhergestellt werden. Nützlich, wenn konsistente Pseudonymisierung benötigt wird (dieselbe Eingabe erzeugt immer denselben Hash).
HIPAA (Health Insurance Portability and Accountability Act)
US-Bundesgesetz zum Schutz sensibler Patientengesundheitsinformationen (PHI). Verpflichtet betroffene Einrichtungen zur Implementierung von Schutzmaßnahmen für elektronische Gesundheitsdaten. anonym.plus enthält HIPAA-spezifische Erkennungspresets.
K
Schlüsselableitung
Der Prozess der Erzeugung kryptografischer Schlüssel aus einem Passwort oder einer Passphrase. anonym.plus verwendet Argon2id, um einen 256-Bit-AES-Schlüssel aus dem Vault-Passwort des Benutzers abzuleiten, wodurch Brute-Force-Angriffe rechenintensiv werden.
Schlüsselrotation
Austausch eines Verschlüsselungsschlüssels durch einen neuen. In anonym.plus ersetzt die Schlüsselrotation das alte Schlüsselmaterial dauerhaft. Dokumente, die mit dem alten Schlüssel verschlüsselt wurden, erfordern den alten Schlüsselwert für die Deanonymisierung.
L
LLM (Large Language Model)
Ein KI-Modell, das auf großen Textkorpora trainiert wurde und menschliche Sprache generieren und verstehen kann. Beispiele: ChatGPT, Claude, Gemini. anonym.plus hilft Benutzern, sensible Daten zu schwärzen, bevor Text an LLMs gesendet wird.
M
Maskierungs-Operator
Eine Anonymisierungsmethode, die PII teilweise verbirgt, indem Zeichen durch ein Maskierungszeichen ersetzt werden (Standard: *). Konfigurierbare Maskenanzahl. Beispiel: „4111-1111-1111" wird zu „XXXX-XXXX-1111". Irreversibel.
MCP (Model Context Protocol)
Ein offener Standard (von Anthropic) zur Verbindung von KI-Tools mit externen Datenquellen und Diensten. anonym.plus enthält einen MCP-Server, der Text automatisch anonymisiert, bevor er KI-Tools wie Cursor oder Claude Desktop erreicht, und Originalwerte in Antworten wiederherstellt.
N
NER (Named Entity Recognition)
Eine Technik der natürlichen Sprachverarbeitung (NLP), die benannte Entitäten (Personen, Orte, Organisationen, Daten) in Texten identifiziert und klassifiziert. anonym.plus verwendet spaCy-NER-Modelle in Kombination mit Presidios Regex-basierten Erkennern für hybride Erkennung.
NLP (Natural Language Processing)
Ein Bereich der KI, der sich mit der Interaktion zwischen Computern und menschlicher Sprache befasst. anonym.plus nutzt NLP über spaCy, um Textkontexte zu verstehen und PII-Entitäten zu erkennen, die einfache Regex-Muster übersehen würden.
O
OCR (Optical Character Recognition)
Technologie zur Extraktion von Text aus Bildern. anonym.plus verwendet Tesseract OCR, um Text aus PNG-, JPG-, BMP- und TIFF-Bildern mit zeichengenauen Bounding-Boxen zu extrahieren, wodurch PII direkt im Bild geschwärzt werden kann. Unterstützt 38 OCR-Sprachen.
Operator
Eine Anonymisierungsmethode, die auf eine erkannte PII-Entität angewendet wird. anonym.plus unterstützt fünf Operatoren: Replace, Redact, Mask, Hash und Encrypt. Jeder kann pro Entitätstyp innerhalb eines Erkennungspresets konfiguriert werden.
P
PHI (Protected Health Information)
Gesundheitsbezogene Daten, die eine Person identifizieren können, geschützt unter HIPAA. Umfasst Krankenakten, Laborergebnisse, Versicherungsinformationen und alle Gesundheitsdaten, die mit einer bestimmten Person verknüpft sind.
PII (Personally Identifiable Information)
Alle Daten, die zur Identifizierung einer bestimmten Person verwendet werden können. Umfasst Namen, E-Mail-Adressen, Telefonnummern, Sozialversicherungsnummern, Passnummern, IP-Adressen und Finanzkontodaten. anonym.plus erkennt über 200 PII-Entitätstypen.
Presidio
Ein Open-Source-Framework zur PII-Erkennung und -Anonymisierung von Microsoft. Kombiniert NLP-basierte NER mit konfigurierbaren Regex-Mustererkennern. anonym.plus bündelt Presidio als lokalen Sidecar-Prozess — es werden keine Cloud-API-Aufrufe durchgeführt.
R
Schwärzungs-Operator
Eine Anonymisierungsmethode, die PII-Text vollständig entfernt und durch Blockzeichen ersetzt (z. B. „john@mail.com" wird zu „███████"). Irreversibel. Hinterlässt keine Spur des Originalwerts.
Ersetzungs-Operator
Eine Anonymisierungsmethode, die PII durch einen typisierten Platzhalter ersetzt. Beispiel: „John Smith" wird zu „<PERSON>". Der Standard- und am häufigsten verwendete Operator. Irreversibel — der Originalwert wird nicht gespeichert.
S
Sidecar
Ein Begleitprozess, der neben der Hauptanwendung läuft. anonym.plus verwendet einen Python-Sidecar-Prozess, um Presidio und spaCy für die PII-Erkennung auszuführen. Die Kommunikation erfolgt über eine lokale HTTP-Schnittstelle mit tokenbasierter Authentifizierung.
spaCy
Eine Open-Source-NLP-Bibliothek für fortgeschrittene natürliche Sprachverarbeitung. Stellt die NER-Modelle (Named Entity Recognition) bereit, die anonym.plus zur Erkennung von Personennamen, Orten, Organisationen und Daten in Texten verwendet. 23 Sprachmodelle verfügbar.
T
Tauri
Ein Framework zur Erstellung von Desktop-Anwendungen mit Webtechnologien (HTML/CSS/JS) und einem Rust-Backend. anonym.plus verwendet Tauri für seine Desktop-App, wobei Rust die Verschlüsselung, Datei-E/A und Anonymisierungsoperatoren übernimmt.
Tesseract
Eine Open-Source-OCR-Engine, die von Google gepflegt wird. anonym.plus bündelt Tesseract zur Textextraktion aus Bildern mit zeichengenauen Bounding-Box-Daten, was eine präzise PII-Schwärzung auf gescannten Dokumenten und Fotos ermöglicht.
V
Tresor
Der verschlüsselte lokale Speicher von anonym.plus für sensible Daten einschließlich Verschlüsselungsschlüssel, Verarbeitungshistorie, Presets und Anmeldedaten. Geschützt durch AES-256-GCM-Verschlüsselung, Argon2id-Schlüsselableitung und eine optionale PIN oder 24-Wort-BIP39-Wiederherstellungsphrase.
Z
Zero-Knowledge-Architektur
Ein Systemdesign, bei dem der Server selbst bei Kompromittierung keinen Zugriff auf Benutzerdaten hat. In anonym.plus werden Passwörter clientseitig gehasht, bevor sie übertragen werden, Verschlüsselungsschlüssel verlassen nie den lokalen Vault, und das Frontend referenziert Schlüssel nur über IDs — das eigentliche Schlüsselmaterial verbleibt im Rust-Backend.

Referenzen

35 Begriffe definiert. Siehe auch: Entitätstypen-Referenz und Dokumentation.