La pseudonimizzazione dei dataset genomici sostituisce gli identificatori del donatore con codici stabili, mantenendo l'utilità scientifica delle sequenze. Il <strong>GDPR Art. 9</strong> e il <strong>Codice Privacy (D.Lgs. 101/2018)</strong> classificano i dati genetici come categoria speciale che richiede protezione rafforzata. anonym.plus elabora ogni file localmente, senza che i dati raggiungano servizi cloud.
Quando si applica
Il gruppo di ricerca dell'Istituto Mario Negri Milano deve condividere il dataset genomico con un consorzio internazionale. Nome, codice fiscale e data di nascita del donatore vanno sostituiti con codici prima della condivisione.
Come lo gestisce anonym.plus
- Apri il file del dataset genomico (VCF, CSV o XLSX) in anonym.plus.
- Il programma individua gli identificatori diretti nelle colonne di metadati.
- Esamina ogni elemento evidenziato e mantieni le varianti genomiche intatte.
- Scegli Sostituisci per assegnare un codice donatore stabile.
- Applica la pseudonimizzazione a tutti i record del dataset.
- Salva il file ripulito localmente: le sequenze originali restano invariate.
Cosa serve fornire
- Il dataset genomico con metadati (VCF con intestazione, CSV o XLSX).
- Operatore: Sostituisci per codici stabili.
- Tabella di mappatura donatore → codice genomico per la tracciabilità interna.
Tipi di entità rilevati nei dati sanitari
| Categoria | Tipo di entità anonym.plus | Esempio |
|---|---|---|
| Nome donatore | PERSON | Sofia Conti → [DONATORE_1] |
| Codice fiscale | IT_FISCAL_CODE | CNTSFR85M41H501X → [CF] |
| Data di nascita | DATE_TIME | 15/09/1985 → [DATA_NASCITA] |
| Email donatore | EMAIL_ADDRESS | s.conti@email.it → [EMAIL] |
| ID campione | MEDICAL_RECORD_NUMBER | NGS-MI-2026-00321 → [ID_CAMP] |
| Istituto | ORGANIZATION | Istituto Mario Negri Milano → [ISTITUTO] |
Conformità raggiunta
- C
- o
- n
- f
- o
- r
- m
- e
- a
- l
- <
- s
- t
- r
- o
- n
- g
- >
- G
- D
- P
- R
- A
- r
- t
- .
- 9
- <
- /
- s
- t
- r
- o
- n
- g
- >
- p
- e
- r
- i
- l
- t
- r
- a
- t
- t
- a
- m
- e
- n
- t
- o
- d
- i
- d
- a
- t
- i
- g
- e
- n
- e
- t
- i
- c
- i
- c
- o
- m
- e
- c
- a
- t
- e
- g
- o
- r
- i
- a
- s
- p
- e
- c
- i
- a
- l
- e
- .
- S
- u
- p
- p
- o
- r
- t
- a
- i
- l
- <
- s
- t
- r
- o
- n
- g
- >
- C
- o
- d
- i
- c
- e
- P
- r
- i
- v
- a
- c
- y
- (
- D
- .
- L
- g
- s
- .
- 1
- 0
- 1
- /
- 2
- 0
- 1
- 8
- )
- <
- /
- s
- t
- r
- o
- n
- g
- >
- .
- F
- u
- n
- z
- i
- o
- n
- a
- c
- o
- m
- p
- l
- e
- t
- a
- m
- e
- n
- t
- e
- o
- f
- f
- l
- i
- n
- e
- :
- n
- e
- s
- s
- u
- n
- D
- P
- A
- c
- o
- n
- c
- l
- o
- u
- d
- r
- i
- c
- h
- i
- e
- s
- t
- o
- .
- F
- i
- l
- e
- c
- i
- f
- r
- a
- t
- i
- c
- o
- n
- <
- s
- t
- r
- o
- n
- g
- >
- A
- E
- S
- -
- 2
- 5
- 6
- -
- G
- C
- M
- <
- /
- s
- t
- r
- o
- n
- g
- >
- e
- c
- h
- i
- a
- v
- e
- d
- e
- r
- i
- v
- a
- t
- a
- c
- o
- n
- A
- r
- g
- o
- n
- 2
- i
- d
- .
Anonimizza dataset genomici offline — vedi piani & inizia gratis →
Limiti & avvertenze
I dati genomici sono intrinsecamente identificativi: la sequenza stessa può identificare il donatore anche senza metadati. La pseudonimizzazione dei metadati riduce il rischio ma non lo elimina. Valuta misure aggiuntive come la condivisione federata o le tecnologie privacy-preserving.
Domande frequenti
I dati genomici sono sempre dati di categoria speciale?
Sì. Il GDPR Art. 9 include esplicitamente i dati genetici tra le categorie speciali. Il Codice Privacy italiano (D.Lgs. 101/2018) prevede protezione rafforzata.
La pseudonimizzazione è sufficiente per i dati genomici?
Riduce il rischio ma non lo elimina, poiché la sequenza stessa è identificativa. Considera tecniche aggiuntive come il differential privacy per dataset condivisi ampiamente.
Le varianti genomiche vengono alterate durante la pseudonimizzazione?
No. Il programma agisce solo sui metadati identificativi. Le varianti genetiche, le sequenze e i dati di qualità restano invariati.