Thales

Thales

Anonymiser des données de Défense pour entraîner un modèle de Machine Learning

Challenges

  • Anonymiser des données issues de capteurs pour entrainer un modèle de prédiction
  • Désensibiliser des données dans un contexte de Défense
  • Tester le niveau de fiabilité de données (séries temporelles multi-variées) sur les algorithmes existants en comparant le niveau d’utilité

Maintien de la qualité statistique et de l'utilité

- Comparaison de courbes de vitesse horizontale (VH) entre données originales et avatars - chaque courbe représente un vol

-Comparaison de courbes d’altitude (Alt) entre données originales et avatars - chaque courbe représente un vol

Ici on retrouve les différences de corrélation entre paires de variables - les valeurs sont proches de zéro donc on conserve bien la corrélation (par exemple entre altitude et vitesse horizontale)

ROI

  • Optimisation des modèles prédictifs : Reconstitution précise des traces temporelles pour améliorer la performance des modèles de données.
  • Partage simplifié et sécurisé : Accès élargi aux données anonymisées, permettant une exploitation plus rapide et conforme aux réglementations.
  • Visibilité renforcée : Résultats clés publiés dans un livre blanc dédié à l’IA et à la Défense, valorisant le projet et ses impacts stratégiques. [Lien à venir]
"Cette collaboration représente un enjeu majeur pour le traitement des données stratégiques et confidentielles en Défense. Ensemble, nous explorons l'application de leur méthode d'anonymisation avatar aux données de Défense, en particulier pour l'entraînement d'algorithmes de Machine Learning. (...) Nous prévoyons de partager les résultats dans un futur livre blanc consacré à l'IA et à la Défense." - Marine Martinez, Program Lead CyberStationF, Thales