我正在开发一个最终会增长的访问数据库。因此,必须考虑可扩展性。
我的背景:没有关于数据库的官方研究。
- 我已经阅读了 Access Database Design & Programming (O'Reilly) 并且我已经学习了多门关于数据库的课程(我一直在学习和阅读)
- 到目前为止,我一直致力于从头开始开发一个数据库,其中的表最多可达 50-60k 行(但会变得更大)。
- 高级 VBA 用户,熟悉 C#
我想确认/否认一些可能危及项目的假设。
- 假设 tblA 具有最小的超级键 uniqueID。uniqueID 是 7 个以上字符的文本字符串。是否有必要(推荐)定义一个新的字段类型 numeric(integer) 将用作其他表中的 FK 以生成关系?比方说,将来会迁移到 SQL 服务器。会有帮助吗?
- 应用先验原则。使用 Excel 连接数据库时,用户需要查看有助于他识别记录的信息属性,但是当我将其发送回数据库时,我需要传递连接两个记录的数值。假设我们需要更新 tblInventory 中与 tblEmpl/tblClients/tblPrices 有关系的记录。
我应该如何处理 empl_name="Carlos" 到 emplID=1 的转换?
维护字典键/项?生成 recorset 以查找 tblEmpl 中的值?是否有任何 SQL {INSERT INTO;UPDATE} 语法来创建 INNER JOIN 以便它自动转换它?(我还没有找到任何适用于 SQL Access 的东西)
- 通过使用数字 ID 查找表中的值(当表具有 3/4/+ 关系时),SELECT 语句导致嵌套的 INNER JOIN 看起来非常丑陋:
(即:想在 emplName 为“MyName”且 clientName 为“MyClient”的 tblC 上查找值。需要嵌套表才能找到这些属性)
SELECT tblC.ID,tblA.Name,tblB.Client FROM tblC INNER JOIN (tblA INNER JOIN tblC ON tblA.ID = tblC.FK_A) ON tblB.ID = tblC.FK_B WHERE (((tblA.Name)="MyName" ,(tblB.Client)="MyClient"));
如果我有 4 种不同的关系,它会变得可怕。
正如我自学的那样,我不确定我是否只是在 stackoverflow 中阅读了错误的帖子,或者这就是它的方式,我只是应该忍受它。
对这些问题的任何了解将不胜感激。
您的问题确实是:代理键有什么好处?
代理键是数据库中记录的(通常)整数标识符,用作主键(通常)并用作外键关系中的链接。
到处都可以找到答案,维基百科有一个很好的总结,包括优点和缺点,你提到了其中的一些:https ://en.wikipedia.org/wiki/Surrogate_key
解决你的每一个观点:
“会有帮助吗?” 是的。从性能的角度来看,如果您的数据库增长到很大的规模,这将产生巨大的差异,因为计算机自然使用整数并且比较它们对他们来说很容易。一旦您必须比较自然键/业务键,计算机处理时间就会大大增加。但这只是一个优势,不变性可能是最大的优势。阅读上面的维基百科文章以了解这一点。
“我应该如何处理 empl_name="Carlos" 到 emplID=1 的转换?" 你不应该。你有几个选择:
用户不需要知道幕后发生的事情。他们通常也不在乎。如果您隐藏或显示该列,则无需进行转换。其次,用户不应该离线更新 Excel 工作表上的详细信息,除非您有自动将这些信息重新集成到您的应用程序中的过程。相反,为他们构建一个数据输入表单以与搜索功能一起使用,并告诉他们直接对数据库进行更新。
“SELECT 语句看起来很丑” 这是因为 MS Access 使 SELECT 语句看起来很丑,而不是因为它们很丑。格式正确的 SELECT 语句看起来不错:
不幸的是,如果您受困于 Access,那么您将受困于丑陋的 SELECT。经常使用 MS Access,你最好只使用 Access 中的查询设计器而忘记 SQL 语句,除非你在 VBA 代码中执行它们。在 VBA 代码中,您可以控制它的外观,因此可以根据需要进行设计。
您的书似乎包括有关数据库理论的一章。这很重要,您应该重新阅读有关数据理论的部分(第 4 章),因为这些应该已经回答了您的问题。如果没有,请寻找另一本有希望的书。