关于SQLServer2005的学习笔记——CTE递归和模拟测试数据

本文涉及的产品
云数据库 RDS SQL Server,独享型 2核4GB
简介:
在 Oracle 中模拟测试 数据是非常简单的一件事情。
Oracle 首先提供了一个 dual 的虚表
其次提供了一个 Connect by 语句,实现了虚表数据列的模拟
最后 Oracle 提供了强大的 DBMS_RANDOM 包进行相关随机数的产生。
SELECT
  TRUNC(DBMS_RANDOM.VALUE(1,101)),
  DBMS_RANDOM.string('~',5),
  DBMS_RANDOM.string('l',5),
  DBMS_RANDOM.string('L',5),
  DBMS_RANDOM.string('a',5),
  DBMS_RANDOM.string('A',5),
  DBMS_RANDOM.string('u',5),
  DBMS_RANDOM.string('U',5),
  DBMS_RANDOM.string('x',5),
  DBMS_RANDOM.string('X',5),
  DBMS_RANDOM.string('p',5),
  DBMS_RANDOM.string('P',5)  
from
(
SELECT level,ROWNUM rn
  FROM DUAL
CONNECT BY ROWNUM<=1001

 
 
相比而言, SQLServer 则没那么幸运了,首先没有虚拟的概念,则需要构建一个物理表以存储需要模拟的次数,再次需要使用 CTE 递归来模拟一个虚表数据,最后才通过相关随机函数进行构建数据。
-- 创建一个物理表,并插入要模拟的次数,最大不能超过 32767
CREATE TABLE RandTable
(
  MaxNumber INT CHECK (MaxNumber >= 0 AND MaxNumber<=32767),
)
INSERT INTO RandTable values(32767); 
 
-- 使用 CTE 递归构建列数据
WITH AutoSequence(MaxNumber,Identiy)
AS
(
SELECT e.MaxNumber,1 AS Identiy FROM RandTable AS e
UNION ALL
SELECT e.MaxNumber,Identiy+1 c FROM RandTable AS e,AutoSequence d
WHERE d.Identiy<e.MaxNumber AND d.Identiy<500

 
-- 用时间 + 递增值做种子进行 RAND
SELECT LEFT(NEWID(),4),
       RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
       RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
       CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT),
       CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())) AS VARCHAR(100)),2) AS INT)
  FROM AutoSequence
OPTION (MAXRECURSION 32767);
SELECT LEFT(NEWID(),4),
       CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT)
  FROM AutoSequence
OPTION (MAXRECURSION 32767);
  
 
小结:
使用 CTE 递归和 SQLServer 随机函数还是存在很多问题的。
1 、一定需要构建一种物理表
2 、 CTE 递归限制在 0 到 32,767 之间
3 、 RAND 产生的随机数比较集中,通过时间 + 递增值的方式来实现的话,只能截取后几位,导致无法控制随机值的区域。
4 、 NEWID() 产生的随机数为字符和数字混杂,也不能得到预期的效果
 
附,经测试不需要物理表也可
WITH RandTable(MaxNumber)
AS
(
SELECT 500 MaxNumber
),
AutoSequence(MaxNumber,Identiy)
AS
(
SELECT e.MaxNumber,1 AS Identiy FROM  RandTable AS e
UNION ALL
SELECT e.MaxNumber,Identiy+1 c FROM  RandTable AS e,AutoSequence d
WHERE d.Identiy<e.MaxNumber AND  d.Identiy<500
)
SELECT LEFT(NEWID(),4),
RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS  VARCHAR(100)),2) AS INT),
CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE()))  AS VARCHAR(100)),2) AS INT)
FROM AutoSequence
OPTION (MAXRECURSION 32767);
 



本文转自baoqiangwang51CTO博客,原文链接:http://blog.51cto.com/baoqiangwang/310457 ,如需转载请自行联系原作者
相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
相关文章
|
29天前
Mybatis+mysql动态分页查询数据案例——测试类HouseDaoMybatisImplTest)
Mybatis+mysql动态分页查询数据案例——测试类HouseDaoMybatisImplTest)
20 1
|
29天前
|
Java 关系型数据库 数据库连接
Mybatis+MySQL动态分页查询数据经典案例(含代码以及测试)
Mybatis+MySQL动态分页查询数据经典案例(含代码以及测试)
24 1
|
2月前
|
计算机视觉
Google Earth Engine(GEE)——使用MODIS数据单点测试SG滤波和harmonics method 滤波的差异分析
Google Earth Engine(GEE)——使用MODIS数据单点测试SG滤波和harmonics method 滤波的差异分析
46 0
|
15天前
|
人工智能 分布式计算 Kubernetes
人工智能,应该如何测试?(三)数据构造与性能测试篇
本文探讨了人工智能场景中的性能测试,区别于传统互联网测试,其复杂性更高。主要关注点包括两类AI产品——业务类和平台类,后者涉及AI全生命周期,测试难度更大。测试重点是模型训练的性能,特别是数据模拟。需要构造大量结构化数据,如不同规模、分布、分片和特征规模的数据,以评估算法效率。此外,还涉及模拟设备规模(如视频流)和节点规模(边缘计算),以测试在大规模负载下的系统性能。文中提到了使用工具如Spark、ffmpeg、流媒体服务器和Kubernetes(K8S)的扩展项目,如Kubemark,来模拟大规模环境。最后,文章介绍了使用Golang进行异步IO操作以构建海量小文件,优化IO性能。
31 0
|
1月前
|
存储 Android开发 C++
【Android 从入门到出门】第五章:使用DataStore存储数据和测试
【Android 从入门到出门】第五章:使用DataStore存储数据和测试
31 3
|
2月前
|
Java 测试技术 编译器
JMM测试利器-JCStress学习笔记
JMM测试利器-JCStress学习笔记
|
2月前
|
存储 人工智能 自然语言处理
选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试
OpenAI最近发布了他们的新一代嵌入模型*embedding v3*,他们将其描述为性能最好的嵌入模型,具有更高的多语言性能。这些模型分为两类:较小的称为text- embeddings -3-small,较大且功能更强大的称为text- embeddings -3-large。
86 0
|
2月前
|
JSON 测试技术 API
一个数据驱动的API测试框架
一个数据驱动的API测试框架
|
2月前
|
存储 测试技术 数据库
数据驱动测试中的参数化
数据驱动测试中的参数化
|
2月前
|
存储 XML 测试技术
什么是数据驱动测试?
什么是数据驱动测试?