Dans un monde où les données personnelles sensibles sont devenues le pivot dans de nombreux secteurs, la protection de la vie privée est plus importante que jamais. Les données de santé, en particulier, requièrent un traitement spécifique en raison de leur caractère très sensible et de leur importance vitale. Dans cet article, nous plongeons dans l'univers complexe de l'anonymisation des données de santé, explorant son rôle essentiel dans la protection de la confidentialité tout en permettant l’utilisation éthique et pertinente de ces données.
Contexte des données personnelles sensibles
Les données sensibles forment une catégorie particulière des données personnelles. Les données sensibles font référence à des informations qui, si elles sont compromises ou utilisées de manière inappropriée, pourraient entraîner des conséquences néfastes pour un individu. Ces données concernent généralement des aspects très intimes ou privés de la vie d'une personne. Voici quelques exemples de données personnelles sensibles :
- données de santé,
- données financières,
- données biométriques,
- orientation sexuelle ou politique,
- identifiants directs comme le numéro de sécurité social….
Selon la CNIL, les données sensibles sont des “informations qui révèlent la prétendue origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques ou l'appartenance syndicale, ainsi que le traitement des données génétiques, les données biométriques aux fins d'identifier une personne physique de manière unique, des données concernant la santé ou des données relatives à la vie sexuelle ou à l'orientation sexuelle d'une personne physique.”
Les guideslines juridiques des institutions
En raison de la nature particulièrement délicate de ces données, leur traitement est souvent soumis à des réglementations strictes en matière de protection des données, telles que le Règlement Général sur la Protection des Données (RGPD) en Europe ou la loi HIPAA aux États-Unis. En effet, il est crucial de mettre en place des mesures de sécurité robustes pour protéger ces données contre tout accès non autorisé, leur divulgation ou leur utilisation abusive.
Le traitement des données sensibles selon la CNIL
Le RGPD interdit de recueillir ou d’utiliser les données personnelles sensibles, sauf dans certains cas :
- si la personne concernée a donné son consentement exprès (démarche active, explicite et de préférence écrite, qui doit être libre, spécifique et informée) ;
- si les informations sont rendues publiques par la personne concernée ;
- si elles sont nécessaires à la sauvegarde de la vie humaine ;
- si leur utilisation est justifiée par l'intérêt public et autorisé par la CNIL ;
- si elles concernent les membres ou adhérents d'une association ou d'une organisation politique, religieuse, philosophique, politique ou syndicale.
Les bonnes questions à se poser selon la CNIL :
- De quelles données ai-je vraiment besoin pour atteindre l’objectif fixé à mon fichier ?
- Ai-je bien distingué les données obligatoires des données facultatives ?
- Les données que je recueille sont-elles objectives ?
- Pourrai-je en toute transparence, donner accès à toute personne qui en fait la demande à l’ensemble des données que je détiens sur elle ?
- Est-ce que je recueille des données sensibles ? Ai-je le droit de collecter ces données ? Est-ce justifié au regard de mes missions ? Puis-je faire autrement ?
Le traitement des données de santé selon l’HIPAA
L'HIPAA (Health Insurance Portability and Accountability Act) établit lui aussi des règles strictes pour protéger les données de santé personnelles aux États-Unis. Cette loi interdit par exemple la divulgation non autorisée des informations médicales identifiables, impose des normes de sécurité pour protéger ces données et donne aux individus des droits sur leurs propres informations médicales. Ainsi, l'HIPAA impose des normes nationales pour protéger les informations sensibles sur la santé des patients contre toute divulgation à leur insu ou sans leur consentement.
La règle de confidentialité de l’HIPAA comporte 12 exceptions : des cas dans lesquels les données des patients peuvent être partagées avec d'autres entités sans son consentement.
Ces exceptions sont les suivantes :
- Victimes de violence domestique ou d'autres agressions.
- Procédures judiciaires et administratives.
- Don d'organes, d'yeux ou de tissus cadavériques.
- Indemnisation des travailleurs.
Comment anonymiser des données de santé ?
Après avoir examiné les défis liés au traitement des données sensibles et notamment les données de santé, il est crucial d'explorer les solutions éthiques pour leur utilisation. L'anonymisation des données se présente comme une réponse pertinente, permettant de tirer parti des informations tout en préservant la confidentialité et la sécurité des individus concernés.
Définition de l’anonymisation
L’anonymisation consiste à utiliser des techniques de façon à rendre impossible, en pratique, la réidentification des individus à l’origine des données personnelles anonymisées. Ce traitement a un caractère irréversible qui implique que les données anonymisées ne sont plus considérées comme des données personnelles, sortant ainsi du cadre d’application du RGPD. Pour caractériser l’anonymisation, le Comité Européen de la Protection des Données (CEPD, et ex G29) se base sur les 3 critères énoncés dans l’avis du 05/2014 (source en bas de page) :
- Individualisation : les données anonymes ne doivent pas permettre de distinguer un individu. De ce fait, même en disposant de l’ensemble des informations quasi identifiantes relatives à un individu, il doit être impossible de distinguer celui-ci dans une base une fois anonymisé.
- Corrélation : les données anonymes ne doivent pouvoir être ré-identifiées en les croisant avec d’autres jeux de données. Ainsi il doit être impossible de relier deux ensembles de données provenant de sources différentes concernant le même individu. Une fois anonymisées, les données de santé d’un individu ne doivent pas pouvoir être reliées à ses données bancaires sur la base d’informations communes.
- Inférence : les données ne doivent pas permettre de déduire de l’information additionnelle sur un individu de façon raisonnable. Il doit être par exemple impossible de déterminer avec certitude l’état de santé d’un individu à partir de données anonymes. C’est lorsque ces trois critères sont respectés que des données sont considérées comme anonymes à proprement parlé. Elles changent alors de statut juridique : elles ne sont plus considérées comme des données personnelles et sortent du cadre du RGPD.
Une solution d’anonymisation unique et conforme : le logiciel avatar
Il est important de mentionner que les dernières années de recherche ont vu l’émergence de nombreuses techniques d’anonymisation avec notamment les deux grandes familles (selon la CNIL) : la généralisation et randomisation (plus de détails dans cet article).
Plus récemment, une pratique s’est aussi révélée très pertinente ; la génération de données synthétiques anonymes. Les données synthétiques assurent en effet une forte rétention de la pertinence statistique et facilitent la reproductibilité des résultats scientifiques. Elles reposent sur la création des modèles permettant de comprendre et reproduire la structure globale des données d’origines. On distingue notamment les réseaux neuronaux adversaires (GAN) et des méthodes reposant sur des distributions conditionnelles.
Vous souhaitez utiliser des données personnelles pour de nouveaux usages sans contrainte ?
Octopize, startup deeptech, a développé le logiciel d’anonymisation avatar : une approche conceptuelle unique, centrée sur l’individu, permettant la création de données synthétiques anonymes, protégées et pertinentes tout en apportant la preuve de leur protection. Son algorithme breveté a fait l'objet d'une publication dans la revue scientifique Nature Digital Medicine et a été évaluée avec succès par la CNIL française sur les 3 critères du CEPD (individualisation, corrélation et inférence).
Les données synthétiques avatar se distinguent des données d'origine, tout en gardant la même granularité et les mêmes liens entre variables. Elles peuvent supporter les mêmes analyses de données et être utilisées pour entraîner le même algorithme d'apprentissage automatique sans risque de réidentification pour vos utilisateurs. Pour plus de détails techniques, consultez la documentation technique de la solution.
Aussi, le logiciel répond aux défis de préservation de la confidentialité des données sensibles de santé tout en conservant leur valeur informative pour d’autres usages : partage, valorisation, IA, Open Data, conservation… La solution avatar libère donc le potentiel de vos données sensibles tout en assurant leur conformité avec les réglementations telles que la CNIL.
Voici ci-dessous quelques cas d’usage en santé dans lesquels la solution avatar s’est illustrée :
- CHU : analyses
- bioMerieux : partage
- APHP : IA
Pour consulter tous nos cas clients, dont ceux du secteur santé, cliquez ici.
Par où commencer ? Découvrez un logiciel pour vous aider à la mise en conformité globale au RGPD
La conformité RGPD en général est obligatoire depuis 2018. Dans les faits, toutes les entreprises ne sont pas toujours très au fait de la réalité de la conformité RGPD. Voici 7 règles de base pour assurer sa conformité RGPD :
- Minimiser la collecte des données
- Recueillir le consentement des personnes concernées
- Assurer la transparence et l'information
- Faciliter l'exercice des droits des individus
- Limiter la conservation des données
- Sécuriser et protéger les données
- Maintenir un niveau de conformité continu
Il est possible de se lancer dans le chantier de conformité sans aide extérieure mais il existe aujourd'hui des logiciels qui permettent d'automatiser la conformité et de se mettre en conformité très rapidement et beaucoup plus facilement. Leto est un très bon exemple de logiciel de mise en conformité qui permet de se connecter à plus de 6000 Saas. Cela permet d'aller chercher les données personnelles de vos clients, prospects et collaborateurs de façon automatisée. La plateforme est collaborative entre les différents départements, ainsi chacun participe à la conformité RGPD de l'entreprise, renforçant la confiance et la sécurité !
Leto est un parfait outil pour s'assurer de la bonne mise en oeuvre de la mise en conformité globale du RGPD !
En conclusion, la protection des données sensibles, telles que les données de santé, est d'une importance capitale pour garantir la confidentialité et la sécurité des individus. Face à ces défis, l'anonymisation des données se présente comme une solution éthique et efficace, permettant de préserver la vie privée tout en exploitant les informations de manière responsable. En développant des techniques comme les données synthétiques anonymes, des avancées significatives sont réalisées pour concilier la protection des données et leur utilisation à des fins bénéfiques. Des solutions innovantes, telles que le logiciel d'anonymisation avatar d'Octopize, offrent une approche centrée sur l'individu et assurent la conformité aux réglementations telles que la CNIL. En adoptant ces technologies, les organisations peuvent garantir la sécurité des données tout en libérant leur potentiel pour des utilisations diverses et éthiques.