Trino

CastorDoc and Trino

Trino, anciennement connu sous le nom de PrestoSQL, est un moteur de requête SQL distribué et rapide conçu pour les requêtes analytiques interactives sur de grands ensembles de données provenant de sources multiples.

integration mockup

Pourquoi CastorDoc x Trino a-t-il du sens ?

Trino, anciennement connu sous le nom de PrestoSQL, est un moteur de requête SQL distribué rapide conçu pour les requêtes analytiques interactives sur de grands ensembles de données provenant de sources multiples. Semblable à Vertica, il est conçu pour offrir rapidité, évolutivité et fiabilité dans les charges de travail liées au Big Data. Cependant, les défis rencontrés pour trouver les actifs de données les plus pertinents, comprendre le lignage entre les tables, les rapports ou les tableaux de bord des entrepôts de données et maintenir la visibilité et la confiance des données sont également courants dans Trino.

CastorDoc, comme mentionné ci-dessus, répond à ces défis en optimisant la recherche grâce à la popularité et à des options de filtrage avancées, en fournissant un lignage des données et en organisant les métadonnées dans une interface intuitive. L'intégration de CastorDoc à Trino est donc logique, car elle améliorera l'expérience utilisateur en permettant de trouver rapidement des actifs de données pertinents, de comprendre leur généalogie et, en fin de compte, de faire confiance aux données et d'avoir une visibilité dans celles-ci. Cela permettra aux entreprises de prendre de meilleures décisions plus rapidement, ce qui est essentiel dans le monde en évolution rapide d'aujourd'hui. ‍

Comment fonctionne l'intégration de CastorDoc x Trino ?

CastorDoc ingère les métadonnées de Trino, puis les transforme et les affiche dans CastorDoc. Les métadonnées affichées peuvent inclure des noms et des descriptions de tables et de colonnes, des requêtes fréquemment exécutées, des utilisateurs fréquents de ressources de données, des liens de traçabilité des données, des tests de qualité des données, la dernière mise à jour de la table de données, des balises techniques et commerciales, etc. CastorDoc organise ces métadonnées dans une interface intuitive pour les utilisateurs techniques et professionnels. La configuration du processus d'ingestion prendrait environ 30 minutes et les métadonnées seraient disponibles dans CastorDoc le lendemain. Il est important de savoir que CastorDoc n'accède pas aux données elles-mêmes, mais uniquement aux métadonnées. Cela garantit que vos données restent en sécurité et que CastorDoc offre le plus de valeur possible.

En quoi CastorDoc vous aide-t-il ?

Castor vous permet de faire évoluer votre stratégie d'analyse en libre-service sans perdre le contrôle. Nous avons été conçus en tenant compte de cas d'utilisation réels :

🔎 Vous travaillez avec des données que vous ne connaissez pas

Votre patron vous demande de créer un rapport sur « Le taux de désabonnement des utilisateurs premium en 2021 ». Vous devez trouver le jeu de données pertinent, comprendre la signification de sa colonne et l'utiliser rapidement.

✅ Réduisez de 95 % le temps nécessaire pour trouver la bonne ressource de données (source : Lyft)

🧬 Un employé clé s'en va

Mike, l'ingénieur de données qui a construit l'ensemble de l'infrastructure de données, part à la fin du mois. Toutes les connaissances sont dans sa tête. Il doit le noter.

✅ 42 % du travail n'est pas récupéré sans gestion des connaissances (source : 360 Apprentissage)

👩🏽 ‍ 🌾 L'intégration d'un nouvel employé

Elsa, analyste de données, est arrivée la semaine dernière. Elle n'a aucune idée des données stockées par l'entreprise ni de la manière dont elles sont utilisées. Elle passe des heures à se renseigner pour acquérir des connaissances.

✅ Les nouveaux employés sont autonomes après le premier jour

💣 Un pipeline de données est en retard

Nelson, analyste de la réussite client, actualise le tableau de bord des « utilisateurs actifs quotidiens » toutes les deux minutes. Les données ne sont pas encore arrivées. Il veut savoir ce qui se passe.

✅ 5 fois moins de messages Slack sur #ask_data

🗺️ Personne ne sait où se trouvent les informations personnelles

Camila, responsable de la gouvernance des données, doit cartographier toutes les informations personnelles pour se conformer aux exigences du RGPD. Elle a besoin d'une liste de tous les actifs de données et de leur emplacement.

✅ 70 % des employés ont accès à des données qu'ils ne devraient pas (source)

COMMENCEZ EN QUELQUES MINUTES, AVEC VOS OUTILS PRÉFÉRÉS

snowflake icon
redshift icon
bigquery icon
synapse icon
postgreSQL icon
mysql icon
databricks icon
dbt icon
looker icon
tableau icon
powerbi icon
slack icon

Contactez-nous pour en savoir plus

Découvrez ce que les utilisateurs aiment chez CastorDoc
Un outil fantastique pour la découverte de données et la documentation

« J'aime l'interface facile à utiliser et la rapidité avec laquelle vous trouvez les actifs pertinents que vous recherchez dans votre base de données. J'apprécie également beaucoup le score attribué à chaque tableau, qui vous permet de hiérarchiser les résultats de vos requêtes en fonction de la fréquence d'utilisation de certaines données. » - Michal P., Head of Data.