谁动了我的索引(三)

简介:
环境介绍:
SQL> desc t1;
Name Null? Type
----------------------------------------- -------- ----------------------------
NN NOT NULL NUMBER
CNN NUMBER
R ROWID

SQL> select count(distinct nn) a,count(distinct cnn) b,count(*) c from t1;

A B C
---------- ---------- ----------
2 201275 402550

SQL> select nn,count(*) from t1 group by nn;

NN COUNT(*)
---------- ----------
1 1
99 402549

SQL> select index_name from user_indexes where table_name = 'T1';

no rows selected
case 7:
关键字:组合索引,谓词,索引列
我们在使用一个B树索引,而且谓词中没有使用索引的最前列。如果是这种情况,可以假设有一个表T,在T(x,y)上有个索引,我们要如下查询:select * from t where y = 5。此时,CBO就不打算使用T(x,y)上的索引,因为谓词不涉及x列。在这种情况下,如果使用索引,可能必须查看每一个索引条目(稍后讨论 index skip scan),而CBO通常倾向于对T做一个全表扫描。
SQL> create index idx_t1_cnn_nn on t1(cnn,nn);

Index created.

SQL> exec dbms_stats.gather_table_stats(user,'T1',cascade=>true);

PL/SQL procedure successfully completed.

SQL> set autot traceonly;
SQL> select * from t1 where nn = 1;


Execution Plan
----------------------------------------------------------
Plan hash value: 3617692013

--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 17 | 329 (4)| 00:00:04 |
|* 1 | TABLE ACCESS FULL| T1 | 1 | 17 | 329 (4)| 00:00:04 |
--------------------------------------------------------------------------
当然,这并不完全排除使用索引。如果:
SQL> select nn,cnn from t1 where nn = 1;
优化器就会注意到,它不必全扫描表来得到nn,cnn,对索引本身做一个index fast full scan会更合适,因为这个索引一般比底层表小得多。如下:

Execution Plan
----------------------------------------------------------
Plan hash value: 3065609956

--------------------------------------------------------------------------------
------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time
|

--------------------------------------------------------------------------------
------

| 0 | SELECT STATEMENT | | 1 | 8 | 244 (5)| 00:0
0:03 |

|* 1 | INDEX FAST FULL SCAN| IDX_T1_CNN_NN | 1 | 8 | 244 (5)| 00:0
0:03 |

--------------------------------------------------------------------------------

另一种情况CBO也会使用T(x,y)上的索引,这就是index skip scan。 当且仅当索引的最前列的选择性很低(只有很少的几个不同值):
我们知道nn的选择性很低,所以,我们重新建立索引。
SQL> drop index idx_t1_cnn_nn;

Index dropped.

SQL> create index idx_t1_nn_cnn on t1(nn,cnn);

Index created.

SQL> exec dbms_stats.gather_table_stats(user,'T1',cascade=>true);

PL/SQL procedure successfully completed.

SQL> set autot traceonly;

当做以下查询时( cnn不是索引的第一列 ):
SQL> select * from t1 where cnn = 100;
结果如下:

Execution Plan
----------------------------------------------------------
Plan hash value: 1275931045

--------------------------------------------------------------------------------
-------------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU
)| Time |

--------------------------------------------------------------------------------
-------------

| 0 | SELECT STATEMENT | | 2 | 34 | 5 (0
)| 00:00:01 |

| 1 | TABLE ACCESS BY INDEX ROWID| T1 | 2 | 34 | 5 (0
)| 00:00:01 |

|* 2 |  INDEX SKIP SCAN | IDX_T1_NN_CNN | 2 | | 3 (0
)| 00:00:01 |

--------------------------------------------------------------------------------
-------------
index skip scan告诉Oracle姚跳跃式扫描这个索引,查找nn值有改变的地方,并且那里开始向下读树,然后扫描索引查找cnn =100。
总结:考虑查询只包括一个查询条件的情况,如果是选择性强的列作为前缀列,当查询指定选择性不高的列时,Oracle不会选择索引。而对于选择性差的列作为前缀列,当查询指定选择性高的列时,Oracle可以使用索引SKIP扫描。

case 8 :
关键字:绑定变量
在实际应用中,为了减少语句的解析(十分消耗资源),要常常使用到绑定变量。那它是不是十全十美的呢?让我们peek里面的秘密吧:
SQL> alter system flush shared_pool;

System altered.

SQL> alter system flush buffer_cache;

System altered.

SQL> alter session set tracefile_identifier = 'test';

Session altered.

SQL> alter session set sql_trace = true;

Session altered.

SQL> variable vn number;( ←定义一个绑定变量
SQL> exec :vn := 99;

PL/SQL procedure successfully completed.

SQL> select * from t1 where nn = :vn;

********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.01 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 1755 0.05 0.51 96 1836 0 26311
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 1757 0.07 0.52 96 1836 0 26311

Misses in library cache during parse: 1
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
26311  TABLE ACCESS FULL T1 (cr=1836 pr=96 pw=0 time=130246 us)

********************************************************************************

这时优化器的选择是全表扫描,是OK的。接下来,改变绑定变量的值:

SQL> exec :vn := 1;

PL/SQL procedure successfully completed.

我们知道,根据 case 3 的结论,应该是走索引的,那来执行一下:

SQL> select * from t1 where nn = :vn;

********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 2 0.31 1.78 1345 1446 0 1
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 4 0.31 1.78 1345 1446 0 1

Misses in library cache during parse: 0
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
1 TABLE ACCESS FULL T1 (cr=1446 pr=1345 pw=0 time=65 us)

********************************************************************************

敏感词,*&……*&……*%&……¥&%……*……&*,和谐词,*&*((*)
这不是我们所期望的,我们期望的是INDEX RANGE SCAN。单显然优化器使用了全表扫描。这个查询的就像它有谓词where nn = 99一样。这就是绑定变量窥视(bind peeking)了。查询第一次是硬解析( Misses in library cache during parse: 1 ),优化器考虑绑定变量的值并生成执行计划。当再次查询的时候又进行了全表扫描,直接使用了第一次硬解析生成的执行计划( Misses in library cache during parse: 0 )。也就是bind peeking只是在hard parse发生,任何重用这个特定计划的查询都将使用全表扫描。
下面,颠倒执行顺序来验证这一结论:
SQL> alter system flush shared_pool;

System altered.

SQL> alter system flush buffer_cache;

System altered.

SQL> alter session set sql_trace = true;

Session altered.

SQL> exec :vn := 1;

PL/SQL procedure successfully completed.

SQL> select * from t1 where nn = :vn;

********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 2 0.00 0.00 24 5 0 1
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 4 0.00 0.01 24 5 0 1

Misses in library cache during parse: 1
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
1 TABLE ACCESS BY INDEX ROWID T1 (cr=5 pr=24 pw=0 time=2184 us)
INDEX RANGE SCAN  IDX_T1_NN_CNN (cr=4 pr=16 pw=0 time=1314 us)(object id 52618)

********************************************************************************


SQL> exec :vn := 99;

PL/SQL procedure successfully completed.

SQL> select * from t1 where nn = :vn;


********************************************************************************

select * 
from
t1 where nn = :vn


call count cpu elapsed disk query current rows
------- ------ -------- ---------- ---------- ---------- ---------- ----------
Parse 1 0.00 0.00 0 0 0 0
Execute 1 0.00 0.00 0 0 0 0
Fetch 178 0.01 0.02 104 2841 0 2656
------- ------ -------- ---------- ---------- ---------- ---------- ----------
total 180 0.01 0.02 104 2841 0 2656

Misses in library cache during parse: 0
Optimizer mode: ALL_ROWS
Parsing user id: 61 

Rows Row Source Operation
------- ---------------------------------------------------
2656 TABLE ACCESS BY INDEX ROWID T1 (cr=2841 pr=104 pw=0 time=31930 us)
2656  INDEX RANGE SCAN  IDX_T1_NN_CNN (cr=185 pr=8 pw=0 time=10659 us)(object id 52618)

********************************************************************************

当SQL第一次执行的时候,优化器会根据绑定变量来确定执行计划(如果存在柱状图)。BIND PEEKING只有当该SQL第一次执行的时候,进行HARD PARSE的时候才进行,第二次调用该SQL,就不会再次进行BIND PEEKING。这种情况下,就存在另外一个风险,如果某个列的倾斜性很厉害,那么使用BIND PEEKING就是不安全的,因为不同的参数代入,只能走第一次执行时的执行计划,那么执行计划就像掷色子一样,要靠运气了。碰到这种情况,应用就不应该使用绑定变量,而应该改为直接值了。
So,温馨提示:
使用绑定变量的时候可以有效的减少PARSE
对于使用不同绑定变量执行计划应该不同的情况,建议不要使用绑定变量,否则可能会产生随机的执行计划


至此,总结了一下常见了不走索引的情况,和筒子们分享了一下。其实实际的情况以及每个知识点都可以进一步深入,里面还有很多细节问题。不过为了主线清晰,没有拓展。希望大家能够深入研究,共同探讨。感谢收看



本文转自MIKE老毕 51CTO博客,原文链接:http://blog.51cto.com/boylook/1298611,如需转载请自行联系原作者


相关文章
|
7天前
|
关系型数据库 MySQL 定位技术
解谜MySQL索引:优化查询速度的不二法门
解谜MySQL索引:优化查询速度的不二法门
14 0
|
3月前
|
存储 SQL JSON
晓得不,中间表是这样被消灭的
晓得不,中间表是这样被消灭的
|
11月前
|
XML Java 数据格式
从非诚勿扰看数据索引,优化代码小妙招
从非诚勿扰看数据索引,优化代码小妙招
110 0
|
存储 缓存 自然语言处理
阿里二面:MySQL索引是怎么支撑千万级表的快速查找?
在 MySQL 官方提到,改善操作性能的最佳方法 SELECT 在查询中测试的一个或多个列上创建索引。索引条目的作用类似于指向表行的指针,从而使查询可以快速确定哪些行与WHERE子句中的条件匹配,并检索这些行的其他列值。所有MySQL数据类型都可以建立索引。
234 0
建立索引,我有话要说,这样理解更快更准
MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱
|
存储 SQL 算法
别再一知半解啦!索引其实就这么回事!
别再一知半解啦!索引其实就这么回事!
别再一知半解啦!索引其实就这么回事!
|
存储 缓存 算法
【肝帝一周总结:全网最全最细】☀️Mysql 索引数据结构详解与索引优化☀️《❤️记得收藏❤️》
【肝帝一周总结:全网最全最细】☀️Mysql 索引数据结构详解与索引优化☀️《❤️记得收藏❤️》
98 0
【肝帝一周总结:全网最全最细】☀️Mysql 索引数据结构详解与索引优化☀️《❤️记得收藏❤️》
|
存储 关系型数据库 MySQL
MySQL索引的测试 (千万级数据) 以及特点总结|周末学习
创建表 可以看到这里创建的索引类型都是 BTREE -- ---------------------------- -- Table structure for mall -- ---------------------------- DROP TABLE IF EXISTS `mall`; CREATE TABLE `mall` ( `id` int(11) NOT NULL AUTO_INCREMENT, `categoryId` int(11) NOT NULL, `name` varchar(255) CHARACTER SET utf8 COLLATE utf8_gen
239 0
|
SQL 索引
SQL优化小讲堂(五)——索引的那些事
提到索引,想必小伙伴们都知道,它是为了提高查询效率而生。但是在查询过程中,怎么才能让我们的查询语句使用索引?相必大家或多或少都会遇到这样的问题。今天我们就来回答这个问题。
|
SQL 缓存 数据库
SQL优化小讲堂(一)——不查询多余的列和行
从今天开始,每天会给大家普及一点优化的小技巧。感兴趣的同学可以跟着多多练练手,示例数据库可以在阅读原文处获取。我使用的示例是AdventureWorks2012的备份包,小伙伴下载后还原即可。记得数据库要是高版本的才能还原成功,我使用的数据库是SQL Server 2016版本的。
SQL优化小讲堂(一)——不查询多余的列和行