Mettre en Place une Stratégie de Gouvernance des Données Réussie
La gouvernance des données peut paraître ennuyeuse, personne ne veut s’en occuper…. Pourtant, une fois plongé dedans, vous pouvez la rendre fluide et, contre toute attente… plutôt amusante!
Permettez-moi de vous présenter les points sur lesquels vous pouvez travailler afin de faciliter la vie de votre équipe de data gouvernance:
1) Classification automatique des données PII : Un client peut vous fournir des informations personnelles, comme son email, sa date de naissance, des détails de carte de crédit ou même ses données médicales. Vous pouvez travailler sur des algorithmes de machine learning pour scanner et détecter automatiquement ces champs PII. Bien entendu, si vous auto-classez les balises/ marqueurs, informez vos clients qu'il s'agit d'une tag PII informatisée afin qu'ils puissent corriger l'erreur.
2) Automatiser l'accès aux données à l'aide de tags: les consommateurs de données sont nombreux. Il n'est jamais évident de fournir une politique de contrôle d'accès bien conçue pour les personnes chargées des données. Pourquoi ne pas définir l'accès en fonction de balises personnalisées telles que les métadonnées liées à l'entreprise, les métadonnées techniques ou les classifications de sécurité ? Cela vous permet de construire un système de droits d'accès complexe, sans avoir à gérer un nombre considérable de droits d'accès.
3) Automatiser la génération de lignage/ traçabilité : si vous travaillez avec des data warehouses modernes et des outils de visualisation de données, il y a de fortes chances que vous puissiez automatiser la génération de lignage grâce à l'analyseur SQL.
4) Construire un algorithme de propagation : si vous avez réussi à franchir les premières étapes, vous êtes maintenant en mesure de classer les IPI, d'étiqueter/ baliser les données et de construire le lignage de manière programmatique. Cela signifie que vous pouvez automatiquement vous assurer que chaque table ou colonne dérivée d'une colonne étiquetée comme sensible hérite de la même classification et des mêmes contrôles de sécurité.
5) Assurez-vous que personne n'accède jamais à des données sensibles : maintenant, dans le passé ou dans le futur. J’imagine que garder à la main un registre de tous les utilisateurs de données peut s'avérer pénible. Et si vous pouviez créer un journal d'audit de tous les utilisateurs et le faire correspondre aux rôles définis dans le warehouse ? Et si l'on signalait automatiquement les accès qui, par le passé, n'ont pas été conformes aux nouvelles politiques en matière de données ?
Il faut reconnaître qu'il s'agit tout de même d'un travail considérable pour quelques data engineers. Et souvent, les responsables de la protection des données n'ont pas le budget nécessaire pour mettre en place toute cette automatisation. Mais qu’est ce que ça rend la vie tellement plus facile.
À propos de nous
Nous écrivons sur tous les processus impliqués dans l'exploitation des actifs de données : de la data stack moderne à la composition des équipes data, en passant par la gouvernance des données. Notre blog couvre les aspects techniques et moins techniques de la création de valeur tangible à partir des données.
Chez CastorDoc, nous développons un outil de documentation des données pour la génération Notion, Figma, Slack.
Ou, pour les adeptes de Fivetran, Looker, Snowflake et DBT, une solution axée sur les données. Nous avons conçu notre logiciel de catalogue pour qu'il soit facile à utiliser, plaisant et collaboratif.
Envie de le découvrir ? Contactez-nous et nous vous ferons une démonstration.
S'inscrire à la newsletter
You might also like
Get in Touch to Learn More
“[I like] The easy to use interface and the speed of finding the relevant assets that you're looking for in your database. I also really enjoy the score given to each table, [which] lets you prioritize the results of your queries by how often certain data is used.” - Michal P., Head of Data