【原创】MySQL5.7 虚拟列实现表达式索引-阿里云开发者社区

【原创】MySQL5.7 虚拟列实现表达式索引

2017-11-22 1764

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

云数据库 RDS PostgreSQL，集群系列 2核4GB

简介：

MySQL自古以来就不提供函数索引这么复杂的功能。那怎么在MySQL里面实现这样的功能呢？我们先来看看函数索引的概念。函数索引，也可称为表达式索引，也就是基于字段以特定函数（表达式）建立索引来提升查询性能之需。函数索引的优势在于更加精确的获取所需要的数据。

MySQL 5.7提供了一个新的特性，虚拟列，可以很完美的解决这个问题。

在介绍虚拟列之前，我们来看看在MySQL里面普通索引的范例。

示例表结构：

 
  
    
      
      
        CREATE 
        TABLE 
        t1 (id 
        INT 
        ,rank 
        INT
        , log_time DATETIME, nickname 
        VARCHAR
        (64)) ENGINE INNODB; 
       
 
        ALTER 
        TABLE 
        t1 
        ADD 
        PRIMARY 
        KEY 
        (id), 
        ADD 
        KEY 
        idx_rank (rank),
        ADD 
        KEY 
        idx_log_time (log_time); 
       
 
    

   
 

示例表数据量,这里我增加了5000条记录：

 
        mysql> 
        select 
        count
        (*) 
        from 
        t1; 
       
        +
        ----------+ 
       
        | 
        count
        (*) | 
       
        +
        ----------+ 
       
        |     5000 |
       
        +
        ----------+ 
       
        1 row 
        in 
        set 
        (0.00 sec)

假设我们来检索2015年4月9号的数据。（结果是有两条记录，id 分别为95和3423。）

 
        mysql> 
        SELECT 
        * 
        FROM 
        t1 
        WHERE 
        DATE
        (log_time) = 
        '2015-04-09'
        \G 
       
        *************************** 1. row ***************************
       
        id: 95 
       
        rank: 24 
       
        log_time: 2015-04-09 05:53:13
       
        nickname: test
       
        *************************** 2. row ***************************
       
        id: 3423 
       
        rank: 42 
       
        log_time: 2015-04-09 02:55:38
       
        nickname: test
       
        2 
        rows 
        in 
        set 
        (0.01 sec)

下来我们看看这条语句的查询计划。

 
        mysql> explain 
        SELECT 
        * 
        FROM 
        t1 
        WHERE 
        DATE
        (log_time) = 
        '2015-04-09'
        \G 
       
        *************************** 1. row ***************************
       
        id: 1 
       
        select_type: SIMPLE 
       
        table
        : t1 
       
        partitions: 
        NULL 
       
        type: 
        ALL 
       
        possible_keys: 
        NULL 
       
        key
        : 
        NULL 
       
        key_len: 
        NULL 
       
        ref: 
        NULL 
       
        rows
        : 5000 
       
        filtered: 100.00 
       
        Extra: Using 
        where 
       
        1 row 
        in 
        set
        , 1 warning (0.00 sec)

我们发现TYPE是ALL，扫描的函数是5000，也就是说这条语句进行了一个全表扫描。虽然给字段log_time 加了索引，但是没有用到，那这个时候怎么办？

在MySQL里面一般这样修改：

 
        mysql> 
        SELECT 
        * 
        FROM 
        t1 
        WHERE 
        log_time >= 
        '2015-04-09 00:00:00' 
        AND 
        log_time <=
        '2015-04-10 00:00:00'
        \G 
       
        *************************** 1. row ***************************
       
        id: 3423 
       
        rank: 42 
       
        log_time: 2015-04-09 02:55:38
       
        nickname: test
       
        *************************** 2. row ***************************
       
        id: 95 
       
        rank: 24 
       
        log_time: 2015-04-09 05:53:13
       
        nickname: test
       
        2 
        rows 
        in 
        set 
        (0.00 sec)

通过查询结果，发现结果集一致，那再来看看查询计划

 
        mysql> explain 
        SELECT 
        * 
        FROM 
        t1 
        WHERE 
        log_time >= 
        '2015-04-09 00:00:00' 
        AND 
        log_time <= 
        '2015-04-10 00:00:00'
        \G 
       
        *************************** 1. row ***************************
       
        id: 1 
       
        select_type: SIMPLE 
       
        table
        : t1 
       
        partitions: 
        NULL 
       
        type: range 
       
        possible_keys: idx_log_time
       
        key
        : idx_log_time 
       
        key_len: 6 
       
        ref: 
        NULL 
       
        rows
        : 2 
       
        filtered: 100.00 
       
        Extra: Using 
        index 
        condition 
       
        1 row 
        in 
        set
        , 1 warning (0.00 sec)

可以看到这条修改过的语句很好的利用到了idx_log_time这条索引。

那好，这个是之前在MySQL 5.6以及之前的旧版本解决方法，随着MySQL 5.7的发布，虚拟列的出现让这个问题更加简单。

现在修改下之前的表结构：

 
        ALTER 
        TABLE 
        t1 
        ADD 
        COLUMN 
        log_date  
        DATE 
        AS 
        (
        DATE
        (log_Time)) stored, 
        ADD 
        KEY 
        idx_log_date (log_date);

这样，增加了一新列，用来存放date(log_time)这个表达式，并且给他加了一列索引。

那么，之前的语句就变成如下：

 
        mysql> 
        SELECT 
        * 
        FROM 
        t1 
        WHERE 
        log_date = 
        '2015-04-09'
        \G 
       
        *************************** 1. row ***************************
       
        id: 95 
       
        rank: 24 
       
        log_time: 2015-04-09 05:53:13
       
        nickname: test
       
        log_date: 2015-04-09
       
        *************************** 2. row ***************************
       
        id: 3423 
       
        rank: 42 
       
        log_time: 2015-04-09 02:55:38
       
        nickname: test
       
        log_date: 2015-04-09
       
        2 
        rows 
        in 
        set 
        (0.00 sec)

执行后结果集和之前的一致。

我们来看看查询计划，发现很好的利用了idx_log_date索引列。

 
        mysql> explain  
        SELECT 
        * 
        FROM 
        t1 
        WHERE 
        log_date = 
        '2015-04-09'
        \G 
       
        *************************** 1. row ***************************
       
        id: 1 
       
        select_type: SIMPLE 
       
        table
        : t1 
       
        partitions: 
        NULL 
       
        type: ref 
       
        possible_keys: idx_log_date
       
        key
        : idx_log_date 
       
        key_len: 4 
       
        ref: const 
       
        rows
        : 2 
       
        filtered: 100.00 
       
        Extra: 
        NULL 
       
        1 row 
        in 
        set
        , 1 warning (0.00 sec)

通过以上介绍，我们看到虚拟列实现起来相对之前的方法来的容易的多。但是这里笔者还是得说上几句。

函数索引的用法以及SQL语句虽然写起来简单，但是在大部分场合下，只能说不得已而为之，是一种设计上的缺陷，后期增加了运维人员的运维难度以及繁琐度。这也就是为什么MySQL 直到5.7才推出了这项类似的功能的原因。

本文转自 david_yeung 51CTO博客，原文链接：http://blog.51cto.com/yueliangdao0608/1712423，如需转载请自行联系原作者

【原创】MySQL5.7 虚拟列实现表达式索引

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【原创】MySQL5.7 虚拟列实现表达式索引

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像