Vertica的这些事<十四>—— vertica优化-阿里云开发者社区

Vertica的这些事<十四>—— vertica优化

2016-07-04 1663

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： DELETE_VECTORS 数据模型： 1、规范化你的表 2、使用核实的压缩格式表设计： 1、使用分区 2、定义主键外键 3、默认的数字类型长度可能比实际需要的大。例如：NUMBERC 该类型默认的长度是38位，如果实际的长度比这个小，那你建表的时候最好加上适合的长度。 4、对于一个True/False值，Boolean类型比char(1)类型和

DELETE_VECTORS

数据模型：

1、规范化你的表

2、使用核实的压缩格式

表设计：

1、使用分区

2、定义主键外键

3、默认的数字类型长度可能比实际需要的大。例如：NUMBERC 该类型默认的长度是38位，如果实际的长度比这个小，那你建表的时候最好加上适合的长度。

4、对于一个True/False值，Boolean类型比char(1)类型和integer类型更快。

Projections

1、 Segmentation vs. Replication (unsegmented)简单的说，如果数据量大的话使用Segmentation，小的话使用unsegmented

2、使用order by ，理想的order by 的字段应该全部在where查询字句中出现（详见另一篇文章【】）

3、列长度的规范，不要一味的定义大长度，在过滤条件和join时的字段如果是字符类型，最好使用int类型。

4、 GROUP BY：使用group by 时，一定要explain查看执行计划，如果执行计划中使用的【GROUP BY HASH】这时候就要修改你的查询sql或者projection的，group by最好使用【GROUP BY PIPELINE】这种方式使用更少的内存，查询更快！

5、清楚不必要的projection，多余的projection意味着查询是要花费更多的时间去选择。

6、 Projection中的order 字段首先选用过滤的字段，然后选用join使用的列。

7、确保Projection数据均匀分布在各个节点上，以免查询时产生数据倾斜。

查询：

1、避免使用in

2、避免使用union

3、 Select 时避免使用*，查询时选择合适的列

4、使用with子句

5、避免使用别名，例如 groupby 1,2,3

6、在子查询中使用orderby

7、避免使用不等关系，例如：>=，not in 等

8、对于复杂的sql,可以多使用临时表

9、 delete_vectors中的数据尽量清除

资源（Resources）

1、 PROFILE，查看查询所需要的内存

2、建立专用的资源池

文章标签：

SQL

Vertica的这些事<十四>—— vertica优化

热门文章

最新文章

相关电子书

相关实验场景

Vertica的这些事&lt;十四&gt;—— vertica优化

热门文章

最新文章

相关电子书

相关实验场景

Vertica的这些事<十四>—— vertica优化