Le G29 publie un avis sur les techniques d’anonymisation
Les solutions d’anonymisation des données sont aujourd’hui essentielles pour de nombreux acteurs qui souhaitent valoriser les informations qu’ils détiennent. Cependant, il est souvent difficile de savoir comment anonymiser correctement des données.
L’avis du G29 rappelle qu’un processus d’anonymisation est un traitement au sens de la directive 95/46/CE, du fait, notamment, que des données personnelles ont été initialement collectées. Il rappelle que la directive ne s’applique pas aux données anonymes mais que les données pseudonymisées ne sont pas des données anonymes.
Comment évaluer une solution d’anonymisation ?
Une solution d’anonymisation doit être construite au cas par cas et adaptée aux usages prévus. Pour aider à évaluer une bonne solution d’anonymisation, le G29 propose trois critères :
- L’individualisation : est-il toujours possible d’isoler un individu ?
- La corrélation : est-il possible de relier entre eux des ensembles de données distincts concernant un même individu ?
- L’inférence : peut-on déduire de l’information sur un individu ?
Ainsi :
- un ensemble de données pour lequel il n’est possible ni d’individualiser ni de corréler ni d’inférer est a priori anonyme ;
- un ensemble de données pour lequel au moins un des trois critères n’est pas respecté ne pourra être considéré comme anonyme qu’à la suite d’une analyse détaillée des risques de ré-identification.
Comment choisir les techniques d’anonymisation ?
L’avis décrit les principales techniques d’anonymisation utilisées aujourd’hui. Ces techniques se regroupent autour de deux grand principes : transformer les données pour qu’elles ne se référent plus à une personne réelle et généraliser les données de façon à ce qu’elles ne soient plus spécifiques à une personne mais communes à un ensemble de personnes. Pour chaque technique, une analyse de ses forces et faiblesses au regard des trois critères d’évaluation est fournie ainsi que des recommandations pratiques pour son utilisation.
L’anonymisation et la ré-identification de données sont des thématiques de recherche particulièrement actives et par conséquent il est indispensable, pour tout responsable de traitement mettant en œuvre des solutions d’anonymisation, d’effectuer une veille régulière pour préserver, dans le temps, le caractère anonyme des données produites.