这是场景
SQL> exec dbms_stats.gather_table_stats(user,'TM', cascade=>true)
PL/SQL procedure successfully completed.
SQL> SELECT SEGMENT_NAME , SEGMENT_TYPE , BYTES / 1024 / 1024 MB , BLOCKS FROM DBA_SEGMENTS WHERE SEGMENT_NAME IN ('TM', 'TM_LD_IX');
SEGMENT_NAME SEGMENT_TYPE MB BLOCKS
------------------------------------------ ---------- ----------
TM TABLE 296 37888
TM_LD_IX INDEX 46 5888
SQL> select index_name , column_name from user_ind_columns where index_name = 'TM_LD_IX';
INDEX_NAME COLUMN_NAME
------------ ------------------------------
TM_LD_IX LD
SQL> explain plan for select distinct LD from TM;
Explained.
SQL> @ex
PLAN_TABLE_OUTPUT
---------------------------------------------------------------------------------------------------------------------------------
Plan hash value: 4241255022
--------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 693 | 4158 | 7920 (8)| 00:01:36 |
| 1 | HASH UNIQUE | | 693 | 4158 | 7920 (8)| 00:01:36 |
| 2 | TABLE ACCESS FULL| TM | 2549K| 14M| 7486 (3)| 00:01:30 |
--------------------------------------------------------------------------------------
9 rows selected.
SQL> explain plan for select /*+ index(x , TM_LD_IX) */ distinct LD from TM x;
Explained.
SQL> @ex
PLAN_TABLE_OUTPUT
---------------------------------------------------------------------------------------------------------------------------------
Plan hash value: 4241255022
--------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 693 | 4158 | 7920 (8)| 00:01:36 |
| 1 | HASH UNIQUE | | 693 | 4158 | 7920 (8)| 00:01:36 |
| 2 | TABLE ACCESS FULL| TM | 2549K| 14M| 7486 (3)| 00:01:30 |
--------------------------------------------------------------------------------------
SQL> select * from v$version;
BANNER
----------------------------------------------------------------
Oracle Database 10g Enterprise Edition Release 10.2.0.3.0 - Prod
PL/SQL Release 10.2.0.3.0 - Production
CORE 10.2.0.3.0 Production
TNS for 32-bit Windows: Version 10.2.0.3.0 - Production
NLSRTL Version 10.2.0.3.0 - Production
如您所见,oracle 没有使用索引,LD
而是选择了全表扫描。我什至不能让他使用带有历史记录的索引。
在上面的简单查询中,我希望对TM_LD_IX
. mydb_file_multiblock_read_count
设置为 32,所以我预计成本约为 5888 / 32 = 184(使用索引我还可以节省哈希唯一的成本)。
那么,我在这里缺少什么?
这种行为的原因是在索引中找不到 LD 为 NULL 的行。因此 Oracle 必须扫描整个表。如果表是使用 LD 作为 NOT NULL 列创建的,则优化器使用此信息并执行 INDEX FAST FULL SCAN。如果您向未为列 LD 定义 NOT NULL 的表添加“CHECK(LD is not null)”约束,则优化器不会使用约束提供的信息并再次进行全表扫描,即使您给了他一个提示。乔纳森刘易斯写了关于这种行为的文章。
以下脚本演示了 Oracle 11.2.0.3.0 的这种行为
*create_table.sql* 向表中插入数据并创建索引和统计信息
现在运行以下脚本:
这给出了以下输出
概括
如果列上有一个正常的 B*-tree 索引 NULL 值在列中是可能的,那么优化器不能仅仅依靠索引的信息来做'select distinc'并使一个 TABLE ACCESS FULL 。
如果在列上有一个正常的 B*-tree 索引和一个 NOT-NULL 检查约束,则优化器也不依赖索引的信息,并使 TABLE ACCESS FULL 成为可能。
如果有一个正常的 B*-tree 索引并且该列定义为 NOT NULL,那么优化器依赖于索引的信息并执行 INDEX FAS FULL SCAN。
如果列上有位图索引,则优化器知道所有信息都在索引中并执行 BITMAP INDEX FAST FULL SCAN