Générer de la documentation avec Data Build Tool (DBT)
Data Build Tool est un outil qui permet de transformer les données au sein-même de l’entrepôt de données (Data Warehouse). Basé sur l’emploi du langage SQL, c’est un outil simple d’utilisation et facilement accessible aux « data analyst ».
Parmi ses avantages majeurs, DBT permet de générer une documentation automatisée des transformations dans les datamarts, documentation qui peut être mise facilement à disposition des métiers via un serveur web.
De la documentation « collée » au code…
La génération de documentation d’un projet permet de renseigner des critères importants : nom exact de la table, propriétaire de la table, dernières modifications, package associé, liste de toutes les colonnes et descriptions, liste des dépendances de la table, code SQL, etc.
Elle permet aussi d’informer certaines étapes du développement : règles de gestion appliquées, descriptifs des champs des tables existantes, informations sur les tests effectués sur les champs, etc.
La génération de documentation se révèle très utile si un collaborateur du projet ou un data analyst recherche des informations sur les règles de gestions appliqué dans les développements. La documentation, toujours actualisée, permet ainsi de gagner du temps à la réalisation du projet, notamment en mode collaboratif. Si l’auteur du code n’est pas le même, il peut donc s’y retrouver rapidement.
… et déployée directement dans les bases
Résultat : les informations renseignées sur DBT sont déversées automatiquement au niveau des métadonnées de la table.