Top Turnover

Top Turnover

Anonymiser des données RH pour les conserver sans limite et entraîner un modèle de Machine Learning

Challenge

Top Turnover, qui collabore avec des clients tels qu'Aymax, s'engage à l'avant-garde de l'innovation en collectant une multitude de données RH. Pour améliorer ses services, il est impératif pour TopTurnover de conserver de manière illimitée ces données de management et alimenter des modèles d'IA en toute intégrité éthique.

Le but ? Alimenter des modèles de prédiction RH, tout en respectant la vie privée des collaborateurs grâce aux données synthétiques et anonymes générées par la solution avatar.

Solution

  • La solution d’anonymisation des données personnelles d'Octopize a permis de libérer le potentiel des données RH de Top Turnover.
  • Pour permettre la constitution d’une base de données ainsi que l’entraînement de leur modèle prédictif, Octopize a généré des données synthétiques et anonymes à partir des données RH originales. Ainsi, Top Turnover a pu constituer une plateforme sur la base de données anonymes, pertinentes et sécurisées (non soumises aux durées de conservation légales).
  • Celle-ci permettra aussi aux datascientists d'optimiser le modèle grâce à des données RH multisecteurs.
  • Octopize a démontré la faculté de la méthode avatar à conserver les propriétés statistiques du jeu de données d'origine ainsi que sa variabilité tout en garantissant la confidentialité des individus.

Mise en place

Service d'anonymisation réalisé par Octopize à distance.


Maintien de la qualité statistique & de l'utilité

Comparaison de distribution univariée (expérience du collaborateur)

  • Les données anonymes conservent les distributions originales.

Comparaison de distribution bivariée (corrélation)

  • Les données anonymes conservent les corrélations entre les variables.
Modèle entraîné sur les données originales
Modèle entraîné sur les données anonymes
  • L’interprétabilité du modèle est conservée.

Comparaison de modèle de prédiction 

Objectif : prédire et anticiper les risques de démission avec les données RH

  • 68% de bonne prédiction avec le modèle entraîné avec les données d’origine
  • 70% de bonne prédiction avec le modèle entraîné avec les données anonymes
    • les données anonymes conservent la capacité prédictive des données d’origine
    • 2% d’amélioration sur la précision globale du modèle prédictif (échantillon de 200 collaborateurs)
      Top turnover peut utiliser les données anonymes en production

ROI

  • Garantie de la protection des individus et confiance dans les données
  • Conservation des données sans limite de temps
  • Conservation des performances de prédiction du modèle d'IA avec des résultats similaires (précision, corrélation, distribution...)
  • Meilleure répartition des données

Ressource complémentaire

Nous sommes ravis de partager avec vous le témoignage client d'Amine Menacer, Dr en IA, CTO et Co-fondateur de Top Turnover :
👉  "La solution avatar d’Octopize nous a permis de maintenir les mêmes performances du modèle prédictif IA et même mieux..." 💡
👉 "Les données anonymes avatar conservent les mêmes performances statistiques que les données originales et maintiennent les mêmes corrélations." 📊

🎬 Ne manquez pas cette vidéo exclusive pour découvrir comment Octopize libère le potentiel de vos données RH grâce à l’anonymisation. 🚀

“La solution avatar d’Octopize nous a permis de maintenir les mêmes performances du modèle prédictif IA, et même mieux..." 
 "Les données anonymes avatar conservent les mêmes performances statistiques que les données originales et maintiennent les mêmes corrélations." 

- Amine Menacer, Dr IA, CTO, CEO @Top Turnover

70% : Précision du modèle prédictif (vs 68% sans anonymisation)

“La solution avatar d’Octopize nous a permis de maintenir les mêmes performances du modèle prédictif IA, et même mieux..." 
 "Les données anonymes avatar conservent les mêmes performances statistiques que les données originales et maintiennent les mêmes corrélations." 

- Amine Menacer, Dr IA, CTO, CEO @Top Turnover