UNIQUEIDENTIFIER列上的统计信息

2017-11-13 1067

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS SQL Server，独享型 2核4GB

简介：

问题重现（The repro）

为了向你展示我们刚抱怨的行为，我用下列简单的表定义创建了一个数据库，我在UNIQUEIDENTIFIER列上强制主键约束。这意味着SQL Server在后台会生成唯一聚集索引，聚集索引本身有一个统计信息对象来描述那列的数据分布情况。当然，数据分布是线性的，因为在UNIQUEIDENTIFIER列每个值本身都是唯一的。

1 -- Create a new table with a UNIQUEIDENTIFIER column as primary key.
2 -- SQL Server will enforce the primary key constraint through unique clustered index in the background.
3 CREATE TABLE CustomersTableGuid
4 (
5     ID UNIQUEIDENTIFIER NOT NULL PRIMARY KEY,
6     FirstName VARCHAR(50),
7     LastName VARCHAR(50)
8 )
9 GO

下一步我往表里插入1百万条记录。

 1 -- Insert 1 million records
 2 DECLARE @i INT = 0
 3 WHILE (@i <= 1000000)
 4 BEGIN
 5     INSERT INTO CustomersTableGuid (ID, FirstName, LastName)
 6     VALUES
 7     (
 8         NEWID(),
 9         'FirstName' + CAST(@i AS VARCHAR),
10         'LastName' + CAST(@i AS VARCHAR)
11     )
12     
13     SET @i +=1
14 END
15 GO

现在我们用FULLSCAN在表上更新我们的统计信息。FULLSCAN意味着SQL Server扫描整个表内在数据来更新统计信息对象。

1 -- Let's update the Statistics with a FULLSCAN.
2 UPDATE STATISTICS CustomersTableGuid WITH FULLSCAN
3 GO

但当你现在查看统计信息对象时，你会看到在直方图里SQL Server只生成了4个步长。

1 sp_helpindex 'dbo.CustomersTableGuid'
2 
3 DBCC SHOW_STATISTICS('dbo.CustomersTableGuid', 'PK__Customer__3214EC271273C1CD')

在表头信息里你可以看到，在统计信息更新期间，1百万行被采样，但直方图只显示了4个步长！但当你现在用更小采样区间来更新统计信息对象，事情就会改变：

1 -- Let's update the Statistics with a smaller sampling interval.
2 UPDATE STATISTICS CustomersTableGuid WITH SAMPLE 50 PERCENT
3 GO

当你现在看下直方图，你会看到我们有很多不同的步长：

小结

当你在数据库设计里用UNIQUEIDENTIFIER列时要记住这点了。只要这些值是唯一的，你就会有性能上的问题，因为对于直方图里，你有的巨量区间，AVG_RANGE_ROW 只能做出1行的正确估计。

感谢关注！

本文转自Woodytu博客园博客，原文链接：http://www.cnblogs.com/woodytu/p/4720240.html，如需转载请自行联系原作者

UNIQUEIDENTIFIER列上的统计信息

问题重现（The repro）

小结

热门文章

最新文章

相关电子书