DATA CATALOGS OUTILS

Les catalogues de données sont devenus des incontournables dans une démarche de gouvernance de données.


Data Driven, ainsi va le monde ! Ainsi les data catalogs sont devenus indispensables.

Un Data Catalog est un outil de data management entièrement consacré à la documentation de tout ce qui est relatif à vos métadonnées : description, structure, sources, qualité, traitements, usage, accès, relations, etc.

Bien pensé, il vous permet de les classifier, de les comprendre et de les (re) trouver pour être immédiatement en capacité de les exploiter !

Zoom sur trois solutions de Data Catalogs

  1. Microsoft Purview 1. C’est l’un des nombreux services proposés dans la stack Azure dans le cadre de la mise en place d’une gouvernance de vos données. Il rassemble les métadonnées issues de multiples sources, y compris on-premise et multicloud, et facilite la data discovery. Sa faiblesse ? Le Data Lineage. 
  2. Databricks Unity – C’est une solution agnostique de data discovery et data governance, peu importe CSP que vous utilisez. Elle met à disposition de nombreux connecteurs avec la plupart des data stacks. Unity propose toutes les fonctionnalités nécessaires aux catalogues de données : connecteurs, data lineage, data discovery facilitée, etc.
  3. Amundsen (Lyft) est une solution de data catalog en Open Source avec une architecture microservices. Cela permet à la communauté des ingénieurs data de contribuer activement à son développement. Elle a d’ailleurs déjà un catalogue de connecteurs particulièrement riche. RDV sur GitHub !

Il existe beaucoup de solutions de Data Catalogs, citons Informatica, Talend, Collibra, Atlan ou encore le pure player français DataGalaxy. 


Smartpoint vous accompagne dans le choix de la meilleure solution pour vous selon votre stack data et l’implémente, contactez-nous 😊

SOURCES :

https://medium.com/@poatek/in-a-data-driven-world-data-catalogs-are-necessary-tools-5851ee3e22c2

https://medium.com/@poatek/in-a-data-driven-world-data-catalogs-are-necessary-tools-5851ee3e22c2