Fundo
Estou trabalhando no projeto de banco de dados para um aplicativo que rastreia informações sobre projetos de desenvolvimento de banco de dados em minha empresa. O escritório de gerenciamento de projetos (PMO) atribui um número psued a cada projeto com base em se o custo do projeto é contabilizado na integração da fusão ou não. Para ilustrar, o número atribuído começará com INT (para um projeto que contribui para a integração da fusão) ou NINT (para um projeto que não contribui para a integração da fusão). Em seguida, um número sequencial é atribuído. Por exemplo, o INT175 seria o 175º projeto identificado contribuindo para a integração da fusão. Uma ruga adicional é que o PMO às vezes deseja criar vários projetos com o mesmo número de "relacionados". Então, por exemplo, pode haver um INT175 aprojeto, um projeto INT175 b e assim por diante.
Embora o PMO considere esse número como o identificador de um projeto, no banco de dados usarei a coluna apenas como uma chave única alternativa para garantir que projetos duplicados não sejam criados e como uma chave de pesquisa para os usuários. Desejo implementar uma restrição de verificação nessa coluna para garantir que apenas um número válido que corresponda às regras fornecidas acima possa ser inserido.
O que eu tentei - expressões regulares
Meu primeiro pensamento foi usar uma expressão regular. No Oracle, meu SGBD de destino, temos a função REGEX_LIKE que pode ser utilizada. Pesquisei a documentação ( aqui , aqui , aqui , aqui e aqui ) sobre expressões regulares e achei as opções estonteantes! Por alguma razão, meu cérebro fica confuso tentando pegar a lista de todas as várias opções de correspondência de padrões e aplicá-la ao meu exemplo específico. Sou uma daquelas pessoas que trabalham melhor com exemplos. Infelizmente, não encontrei muitos exemplos por aí. O que descobri foi muito simples ou tão complexo que não consegui entendê-los.
O que eu tentei até agora é algo assim:
select c
from (
select 'INT1756b' c from dual union all
select 'INT175a' c from dual union all
select 'INT75a' c from dual union all
select 'INT75' c from dual union all
select 'NINT2283a' c from dual union all
select 'NINT2283' c from dual union all
select 'NINT915c' c from dual union all
select 'NINT915' c from dual union all
select 'NINT95b' c from dual union all
select 'NINT95' c from dual union all
select 'ABC123' c from dual
) x
where REGEXP_LIKE ( c, '(NINT|INT)\d{2}[0-9]|[a-z]' );
Minha "tabela" x de teste tem o que prevejo como exemplo de todas as combinações possíveis de números válidos mais um número inválido. Todos eles começarão com INT ou NINT e, em seguida, terão pelo menos 2 números até 4 números e, opcionalmente, uma letra minúscula no final.
Minha luta - lidando com vários comprimentos
O que realmente estou lutando é como lidar com os comprimentos variados dos números. Pode haver 2, ou 3, ou 4 números, que podem ou não ser seguidos por uma letra minúscula. O que eu inventei acima, apenas para começar, foi procurar 2 números após o INT ou NINT . Eu sei que sempre haverá pelo menos dois números. Aí eu só olho para ver se o resto está no conjunto de dígitos ou letras minúsculas. Agora eu sei que isso não é bom o suficiente, mas é tudo o que consegui pensar depois de um ou dois dias quebrando a cabeça com isso.
Pedido de ajuda!
Alguém já fez algo semelhante com expressões regulares que poderia me apontar na direção certa ou me dar um exemplo? Existe uma maneira mais elegante e simples de implementar essa restrição? Agradeço toda e qualquer ajuda e dicas!