三级 ANSI SPARC 数据库体系结构建议使用三个数据抽象级别,即外部级别、概念级别和内部级别。
如果我没理解错的话,外部层代表用户的观点,概念层是概念图(ER模型),内部层是关系模型。
我的问题是,我在文献中发现,除了这些之外,还有第四层(最低层),就是物理层。
我想了解具体是什么?是不是在这一点上,我们定义了索引的类型、访问路径以及与数据的物理访问相关的东西?
三级 ANSI SPARC 数据库体系结构建议使用三个数据抽象级别,即外部级别、概念级别和内部级别。
如果我没理解错的话,外部层代表用户的观点,概念层是概念图(ER模型),内部层是关系模型。
我的问题是,我在文献中发现,除了这些之外,还有第四层(最低层),就是物理层。
我想了解具体是什么?是不是在这一点上,我们定义了索引的类型、访问路径以及与数据的物理访问相关的东西?
尽管 ANSI/SPARC 体系结构的模式或表示级别的定义没有达到所需的精度,但它们只有三个,分别命名为external、conceptual和internal。
据我所知,没有第四层,因为数据库管理系统(简称 DBMS)采用的物理结构实际上构成了内部模式,我将在下面解释。
注意:即使不精确,ANSI/SPARC 体系结构在构建系统时绝对是一个非常有用的参考,因此看起来您找到的文献包含不准确的信息,或者它可能参考了层的(也非常有用)概念数据库的抽象被称为概念的、逻辑的和物理的,它们具有不同的含义。
ANSI/SPARC 三个级别的简要说明
我认为描述每个级别(从最高到最低抽象程度排序)是合适的,以揭示其范围:
外部层面是将信息呈现给计算机化信息系统的最终用户的方式;例如,在应用程序的屏幕或窗口(例如,通过列表、网格、标签、文本框、复选框、下拉菜单等)中显示或请求的信息片段的特定组织。
概念级别涉及信息结构的表示,如 (a) 业务专家感知和 (b) 数据库分析师建模,通常在实体类型、属性和关联方面,因此它由想法或概念化组成,它还不是“具体的”,它的表示需要较低抽象层次的结构。概念层被非正式地称为某个组织关于其信息需求的业务规则。另一方面,这种模式通常(尽管不一定)通过图形设备(例如实体关系图)来表达,以促进相关方之间的交流。
内部层面与相关的 DBMS 如何以具体形式存储信息有关;例如,数组、页面、范围、文件、记录、字段、指针等。这是较低级别的抽象,因为从某种意义上说,DBMS 将信息“保存”在“真实”结构中,因此这也可能被认为是架构的物理层,但以这种方式命名并不意味着有第四层。值得一提的是,内部层本身可以有不同的抽象子层,但该因素取决于所讨论的 DBMS 使用的特定机制。
根据 ANSI/SPARC 体系结构在 SQL DBMS 上创建的关系数据库
当从业者使用 SQL 平台(Microsoft SQL Server、IBM DB2、Sybase ASE、PostgreSQL 等)使用EF Codd 博士提出的 关系模型机制构建数据库时:
基表、列、类型(和域,如果可用)和约束必须反映概念模式(实体类型、属性、关联、基数)的特征,以便数据(以行的形式)与其保持一致。通过基表、列、类型和约束的数据子语言(例如,SQL DDL)进行的声明是形式化概念模式的工具,因此它们被认为是逻辑构造,因此它们还没有“触及” ” 在物理层面,它们仍然不受 DBMS 特定的具体存储结构的影响。规范化是一个逻辑过程,适用于此,而不适用于概念模式。
视图(即, “组合”来自一个或多个基表或其他派生表的列的派生表,通常借助涉及 JOIN 的 SQL DML 操作)与外部级别保持密切对应,因为它们收集并提供一个或多个应用程序的屏幕或窗口请求或发送的信息,就像最终用户看到的那样。
索引、页面、范围、文件1、记录2、字段3、分区、分配映射和许多其他安排与内部模式匹配,因为它们是 DBMS 用来存储信息的“物理”结构。
SQL DBMS 充当中介(1)在概念模式的内部和逻辑表示之间,以及(2)通过视图的连接在内部和外部表示之间。
笔记
1, 2, 3请注意区分 (a)文件、记录和字段与 (b)表、行和列— 或关系、属性和元组— 是多么重要,因为它们是属于不同抽象级别的元素因此,很容易受到非常不同的操作和处理,因此具有非常不同的影响。
我对三层的理解是:
在当前的 ER 建模中,您将创建概念或逻辑模型,捕获用户的需求,然后从中创建 3NF,以避免不一致并捕获关系的正确多重性(1:1、1:N、N:M ). 如有必要,您还可以在这里拆分实体。例如,将地址与客户分开,因为您可能需要帐单地址和送货地址。最后一步是创建物理模型,该模型考虑索引、代理键和仔细的非规范化。这还包括稍后考虑高级优化,如本机类型(例如 double、int64 等)、索引类型(btree 与位图、连接索引等)、特殊表布局(面向行或列、索引组织表) ,垂直或水平分区,包含相关行)。
访问路径通常由 sql 引擎及其优化器根据已知的数据(统计信息、数量结构)和可用索引来确定,并且可以在每个 SQL 语句的执行计划中查找。
ANSI 标准定义了 3 个不同级别来描述数据库的视图+示意图。“最低”层独立于此——它不是上述标准的一部分——因为它是数据库本身。