Existe uma solução de gerenciamento de metadados de código aberto? Eu gostaria de criar um repositório de metadados que manteria os detalhes dos metadados de esquemas de banco de dados, tabelas e itens de dados de centenas de bancos de dados corporativos.
Estou especialmente interessado em algo que possa consultar automaticamente os dados do esquema dos bancos de dados para poder rastrear as alterações nos metadados relacionados às tabelas. ou seja, alterações nos tamanhos dos dados das colunas, tabelas e colunas adicionadas, etc.
MIKE?
O que é MIKE2.0?
MIKE2.0, que significa Método para um Ambiente de Conhecimento Integrado, é uma metodologia de software livre para Gerenciamento de Informações Corporativas que fornece uma estrutura para o desenvolvimento de informações. A Metodologia MIKE2.0 faz parte da Estrutura de Metodologia Aberta geral.
Não tenho conhecimento de nenhuma ferramenta de código aberto que escalaria para 'centenas de bancos de dados corporativos'. As coisas mais próximas que vêm à mente são:
O Dia possui um mecanismo básico de modelagem que pode ser usado para criar modelos UML. No entanto, acho que você teria que escrever muita cola para colocar os modelos no Dia em primeiro lugar.
O Eclipse Modeling Framework (EMF) possui recursos de modelagem e também uma ferramenta de comparação/mesclagem de modelo, que pode levá-lo a algum lugar em relação ao seu requisito de controle de alterações. No entanto, acho que você ainda teria que escrever muita cola para fazer isso funcionar.
Além disso, você provavelmente está interessado em uma ferramenta de repositório comercial como Powerdesigner, Erwin ou Embarcadero. Se você está realmente trabalhando para uma empresa que tem 'centenas de bancos de dados corporativos' nos livros, há uma chance de que eles já tenham algo assim nos livros.
Que tal o Pentaho Metadata Editor?
Uma Visão Conceitual do Editor de Metadados Pentaho
Documentação do Pentaho Metadata Editor
Outra opção seria usar uma ferramenta como o liquibase para gerenciar todas as alterações no esquema do banco de dados e manter essas alterações no controle de origem do git.
O PostgreSQL possui um recurso de "comentário" que permite adicionar comentários aos objetos do banco de dados, que você pode usar para ajudar os analistas a entender as coisas. Por exemplo, colocamos comentários no estilo Javadoc nos comentários do PG e geramos documentos com base nisso.