Amazon Redshift est un entrepôt de données intégré à la plus grande plateforme de cloud computing Amazon Web Services.
Pourquoi Castor x Redshift a-t-il du sens ?
Redshift est un service d'entreposage de données rapide, évolutif et fiable qui permet d'analyser de manière simple et rentable toutes vos données à l'aide du langage SQL standard et de vos outils de business intelligence existants. Cependant, à l'instar d'autres outils de traitement de données à grande échelle, identifier rapidement et efficacement les actifs de données les plus pertinents peut être une tâche ardue. En outre, il n'est pas facile de comprendre le lien entre les tables de l'entrepôt de données et d'autres actifs tels que les rapports ou les tableaux de bord. Castor, à l'inverse, est conçu pour simplifier le processus de recherche des actifs de données les plus pertinents grâce à une recherche robuste optimisée en fonction de la popularité et à des options de filtrage avancées. Castor explique également le lien entre les tables de l'entrepôt de données et d'autres actifs tels que les rapports ou les tableaux de bord. L'intégration de Castor à Redshift est donc logique car elle améliorera l'expérience utilisateur en facilitant la recherche rapide des actifs de données pertinents, en comprenant leur généalogie et, en fin de compte, en instaurant confiance et visibilité dans les données. Cela permettra aux entreprises de prendre rapidement des décisions plus éclairées, ce qui est impératif dans le monde dynamique d'aujourd'hui.
Comment fonctionne l'intégration Castor x Redshift ?
Castor ingère les métadonnées de Redshift. Ces métadonnées sont ensuite transformées et affichées dans Castor. Les métadonnées affichées peuvent inclure des noms et des descriptions de tables et de colonnes, des requêtes fréquemment exécutées sur vos données, des utilisateurs fréquents de ressources de données, des liens de traçabilité des données, des tests de qualité des données, la dernière mise à jour de la table de données, des balises techniques et commerciales, etc. Castor organise ces métadonnées dans une interface intuitive conviviale pour les utilisateurs techniques et professionnels. La configuration du processus d'ingestion dure environ 30 minutes et les métadonnées sont disponibles dans Castor le jour suivant. Il est essentiel de noter que Castor n'accède pas aux données elles-mêmes, mais uniquement aux métadonnées. Cela garantit que vos données restent en sécurité et que Castor offre autant de valeur que possible.
Accès à l'API: si un élément de métadonnées n'est pas disponible dans l'intégration native de CastorDoc, vous pouvez l'ingérer avec notre API complète.
Important: CastorDoc n'accède pas aux données elles-mêmes, mais uniquement aux métadonnées. Cela garantit que vos données restent en sécurité et que CastorDoc offre le plus de valeur possible.
En quoi CastorDoc vous aide-t-il ?
Castor vous permet de faire évoluer votre stratégie d'analyse en libre-service sans perdre le contrôle. Nous avons été conçus en tenant compte de cas d'utilisation réels :
🔎 Vous travaillez avec des données que vous ne connaissez pas
Votre patron vous demande de créer un rapport sur « Le taux de désabonnement des utilisateurs premium en 2021 ». Vous devez trouver le jeu de données pertinent, comprendre la signification de sa colonne et l'utiliser rapidement.
✅ Réduisez de 95 % le temps nécessaire pour trouver la bonne ressource de données (source : Lyft)
🧬 Un employé clé s'en va
Mike, l'ingénieur de données qui a construit l'ensemble de l'infrastructure de données, part à la fin du mois. Toutes les connaissances sont dans sa tête. Il doit le noter.
✅ 42 % du travail n'est pas récupéré sans gestion des connaissances (source : 360 Apprentissage)
👩🏽 🌾 L'intégration d'un nouvel employé
Elsa, analyste de données, est arrivée la semaine dernière. Elle n'a aucune idée des données stockées par l'entreprise ni de la manière dont elles sont utilisées. Elle passe des heures à se renseigner pour acquérir des connaissances.
✅ Les nouveaux employés sont autonomes après le premier jour
💣 Un pipeline de données est en retard
Nelson, analyste de la réussite client, actualise le tableau de bord des « utilisateurs actifs quotidiens » toutes les deux minutes. Les données ne sont pas encore arrivées. Il veut savoir ce qui se passe.
✅ 5 fois moins de messages Slack sur #ask_data
🗺️ Personne ne sait où se trouvent les informations personnelles
Camila, responsable de la gouvernance des données, doit cartographier toutes les informations personnelles pour se conformer aux exigences du RGPD. Elle a besoin d'une liste de tous les actifs de données et de leur emplacement.
✅ 70 % des employés ont accès à des données qu'ils ne devraient pas (source)
Contactez-nous pour en savoir plus
« J'aime l'interface facile à utiliser et la rapidité avec laquelle vous trouvez les actifs pertinents que vous recherchez dans votre base de données. J'apprécie également beaucoup le score attribué à chaque tableau, qui vous permet de hiérarchiser les résultats de vos requêtes en fonction de la fréquence d'utilisation de certaines données. » - Michal P., Head of Data.