背景
我正在为跟踪我公司数据库开发项目信息的应用程序设计数据库。项目管理办公室 (PMO) 根据项目成本是否计入合并整合,为每个项目分配一个编号。为了说明,分配的数字将以INT(对合并整合有贡献的项目)或NINT(对合并整合没有贡献的项目)开头。然后分配一个序号。例如,INT175将是第 175 个确定有助于合并整合的项目。另一个问题是 PMO 有时希望创建多个具有相同编号的项目,因为它们是“相关的”。因此,例如可能有一个 INT175 a项目、INT175 b项目等。
虽然 PMO 认为这个数字是项目的标识符,但在数据库中,我只会将该列用作备用唯一键,以确保不会创建重复的项目,并作为用户的搜索键。我想对该列实施检查约束,以确保只能输入符合我上面给出的规则的有效数字。
我试过的 - 正则表达式
我的第一个想法是使用正则表达式。在我的目标 DBMS Oracle 中,我们有可以使用的 REGEX_LIKE 函数。我研究了有关正则表达式的文档(此处、此处、此处、此处和此处),发现选项令人眼花缭乱!无论出于何种原因,我的大脑都在尝试获取所有各种模式匹配选项的列表并将其应用于我的特定示例。我是最擅长使用示例的人之一。不幸的是,我还没有找到很多例子。我所发现的要么太简单,要么太复杂以至于我无法理解它们。
到目前为止我尝试过的是这样的:
select c
from (
select 'INT1756b' c from dual union all
select 'INT175a' c from dual union all
select 'INT75a' c from dual union all
select 'INT75' c from dual union all
select 'NINT2283a' c from dual union all
select 'NINT2283' c from dual union all
select 'NINT915c' c from dual union all
select 'NINT915' c from dual union all
select 'NINT95b' c from dual union all
select 'NINT95' c from dual union all
select 'ABC123' c from dual
) x
where REGEXP_LIKE ( c, '(NINT|INT)\d{2}[0-9]|[a-z]' );
我的测试“表”x 具有我预见的有效数字加一个无效数字的所有可能组合的示例。它们都将以INT或NINT开头,然后至少有 2 个数字,最多 4 个数字,最后可以选择一个小写字母。
我的奋斗——处理不同的长度
我真正苦苦挣扎的是如何处理不同长度的数字。可以有 2 个、3 个或 4 个数字,后面可能会或可能不会跟一个小写字母。作为初学者,我在上面想到的是在INT或NINT之后寻找 2 个数字。我知道总会有至少两个数字。然后我只看其余部分是否在数字或小写字母的集合中。现在我知道这还不够好,但这是我经过一两天的绞尽脑汁想出来的。
请求帮助!
有没有人用正则表达式做过类似的事情可以指出正确的方向或给我一个例子?有没有更优雅、更简单的方法来实现这个约束?我感谢所有帮助和指点!