Co-créer un notebook pédagogique sur l'utilisation et l’évaluation de données synthétiques
Challenge
Créer un notebook pédagogique comparant diverses méthodes de génération de données synthétiques.
Permettre à l'écosystème de mieux les appréhender / approfondir en mettant l'accent sur la qualité, et en fournissant des outils statistiques.
Offrir des moyens d'évaluation de l'utilité et de la confidentialité des données générées.
Solution
"La méthode de la start-up Octopize permet à la fois de prouver l’anonymat et d’assurer la reproductibilité des analyses. De plus, elle s’applique à tous les cas d’usage avec une faible difficulté dans l’entraînement des données".
Mise en place
Prestation de service réalisé par Octopize.
Maintien de la qualité statistique & de l'utilité
En comparaison de deux autres méthodes de génération de données synthétiques (CT-GAN et schéma structurel), la méthode avatar permet une meilleure conservation de l’utilité des données d’origine tout en permettant de prouver la privacy qu’elle apporte.
Résultat
Ce notebook met à disposition des outils d’évaluation de l’anonymat et de la qualité des données synthétiques générées.