emilly Asked: 2017-07-23 17:56:48 +0800 CST2017-07-23 17:56:48 +0800 CST 2017-07-23 17:56:48 +0800 CST 如何在数据库中读取列? 772 假设我在 Employee 表中有 10 列,我只需要salary and name在下面的查询中使用两个列 select salary from Employee where name = 'Scott'; 从 6.30 到 8.30(2 分钟)看完视频后,我的理解是在 RDBMS 数据库(比如 oracle/Mysql 等)下,即使我必须读取两列 DBMS 将从内存中的磁盘读取完整的行,然后它将根据名称过滤行coum,最后阅读专栏工资。那是对的吗 ? mysql oracle 2 个回答 Voted Best Answer Rick James 2017-07-23T19:30:21+08:002017-07-23T19:30:21+08:00 对于 MySQL 的 InnoDB 引擎... 情况 1(最慢):没有索引。它将扫描整个表(所有行)以从中找到带有name = 'Scott' and fetchsalary` 的行。 案例 2: INDEX(name)。这将使用索引非常有效地获取 Scott 行,然后获取行并获取薪水。 案例 3(最快): INDEX(name, salary). 现在可以仅在索引内执行整个查询——而无需访问数据中的其余列。 更多 这称为“覆盖”索引。更准确地说:如果在中找到了entire所需的所有列,那么只需要触及索引,而不是数据。 SELECTINDEX 数据在一个 BTree 中,按PRIMARY KEY. AnINDEX在不同的 BTree 中,按索引排序。 BTree 在查找特定行或基于索引读取连续行时非常有效。请参阅关于 BTree 的维基百科文章。这也是一个很好的参考: https ://www.percona.com/files/presentations/percona-live/london-2011/PLUK2011-b-tree-indexes-and-innodb.pdf 对于其他数据库,可能存在差异。 如何存储一行 情况 1 (大多数情况):给定表“记录”(又名“行”)的所有列一起存储在一组连续的几十个字节中,也许是数百个字节。这一切都位于同一个“块”中,还有可能有一百个其他行。因此,当您从该行中获取任何一列时,所有其余列都已准备就绪。您的Employee表格示例可能属于这种情况。RDBMS 优化侧重于能够快速获取整行,但牺牲了不能快速获取整列。 案例 2:在某些数据库实现(包括 MySQL 的 InnoDB)中,大列(TEXT和BLOB)可能存储为“非记录”。也就是说,它们被放在其他一些块中。优点 ( ) 当你不需要那些笨重的部分时,它允许快速扫描行;( ) 通常,您一次只会获取一行的庞大列。 案例 3:有一种不同类型的数据库组织,名称如“Columnstore”。这会旋转数据,以便很容易快速获取列的所有值,但失去了快速获取单个行的所有列的能力。 关注案例 1,因为它很常见。 EdStevens 2017-07-24T09:55:13+08:002017-07-24T09:55:13+08:00 不要依赖一些可疑的 3d 方来源,您应该彻底阅读官方 Oracle 文档,特别是概念手册,更具体地说,是关于物理存储和逻辑存储的部分。也就是说,让我提出一些与您的问题相关的具体要点。首先,Oracle 并不真正从磁盘读取行。它要求操作系统从文件“y”返回“x”字节的数据,从偏移量“z”开始。而最小的字节数,它将请求的最小IO单位是'block'。而且,它保留了一个映射,因此它知道每个块在文件中的偏移量。给定表空间内的所有块大小相同,默认为 8k。一个块是一个逻辑Oracle 理解的结构,但对实际执行 I/O 的操作系统(或更准确地说,转换请求并将其传递给存储子系统)毫无意义。一个块包含多行,从块中选择单独的行和特定的列纯粹是内存中(数据库缓冲区缓存)操作。
对于 MySQL 的 InnoDB 引擎...
情况 1(最慢):没有索引。它将扫描整个表(所有行)以从中找到带有
name = 'Scott' and fetch
salary` 的行。案例 2:
INDEX(name)
。这将使用索引非常有效地获取 Scott 行,然后获取行并获取薪水。案例 3(最快):
INDEX(name, salary)
. 现在可以仅在索引内执行整个查询——而无需访问数据中的其余列。 更多 这称为“覆盖”索引。更准确地说:如果在中找到了entire所需的所有列,那么只需要触及索引,而不是数据。SELECT
INDEX
数据在一个 BTree 中,按
PRIMARY KEY
. AnINDEX
在不同的 BTree 中,按索引排序。BTree 在查找特定行或基于索引读取连续行时非常有效。请参阅关于 BTree 的维基百科文章。这也是一个很好的参考: https ://www.percona.com/files/presentations/percona-live/london-2011/PLUK2011-b-tree-indexes-and-innodb.pdf
对于其他数据库,可能存在差异。
如何存储一行
情况 1 (大多数情况):给定表“记录”(又名“行”)的所有列一起存储在一组连续的几十个字节中,也许是数百个字节。这一切都位于同一个“块”中,还有可能有一百个其他行。因此,当您从该行中获取任何一列时,所有其余列都已准备就绪。您的
Employee
表格示例可能属于这种情况。RDBMS 优化侧重于能够快速获取整行,但牺牲了不能快速获取整列。案例 2:在某些数据库实现(包括 MySQL 的 InnoDB)中,大列(
TEXT
和BLOB
)可能存储为“非记录”。也就是说,它们被放在其他一些块中。优点 ( ) 当你不需要那些笨重的部分时,它允许快速扫描行;( ) 通常,您一次只会获取一行的庞大列。案例 3:有一种不同类型的数据库组织,名称如“Columnstore”。这会旋转数据,以便很容易快速获取列的所有值,但失去了快速获取单个行的所有列的能力。
关注案例 1,因为它很常见。
不要依赖一些可疑的 3d 方来源,您应该彻底阅读官方 Oracle 文档,特别是概念手册,更具体地说,是关于物理存储和逻辑存储的部分。也就是说,让我提出一些与您的问题相关的具体要点。首先,Oracle 并不真正从磁盘读取行。它要求操作系统从文件“y”返回“x”字节的数据,从偏移量“z”开始。而最小的字节数,它将请求的最小IO单位是'block'。而且,它保留了一个映射,因此它知道每个块在文件中的偏移量。给定表空间内的所有块大小相同,默认为 8k。一个块是一个逻辑Oracle 理解的结构,但对实际执行 I/O 的操作系统(或更准确地说,转换请求并将其传递给存储子系统)毫无意义。一个块包含多行,从块中选择单独的行和特定的列纯粹是内存中(数据库缓冲区缓存)操作。