一种测试方向的探讨-基于模型测试调研引发的思考 - 2

简介:
第二篇 文化背后

2.1 IBM的敏捷史

2.1.1 大象也会跳舞--敏捷的老面孔
IBM是个非常有意思的公司,从硬件到软件再到咨询、服务业。完成了几次成功的华丽转身。每次几乎都能给你意外惊喜。了解的人都知道大象跳舞的历史。而这种反思文化的实质是在追求高效。也就是我们目前不断提及的敏捷内容的核心。
敏捷不是什么新鲜玩意,几乎每个组织与个人都曾经经历过。
一个公司需要反思自己的市场定位,一个部门需要反思自己的公司定位,一个工程师则需要反思自己的角色定位。
总结:那么QA的角色是什么?价值在哪里?我们如何避免组织结构与技术上的边缘化?
2.1.2 七年之痒--技术的未来还是产品的未来
七年之痒,借指一下IBM对基于模型测试七年研究的一路风雨。
先展示一下IBM标准,也是目前通用的基于模型测试的系统架构。

 



再展示一下IBM的对模型测试的几个阶段的研究与尝试。



基于模型测试本身,IBM实现了比较成熟的技术(如基于UML的状态/数据流模型),获得了很大的收益。但是几度弃用已开发的产品。有两点总结值得思考:
1、 技术人员自己定义技术,发展技术。(实则在指责技术研究为了技术而技术,脱离产品本身)
2、 技术上的高耦合性。(IBM的基于模型测试从模型制定,到分析,到自动执行。集成度非常之高。造成了产品的不通用性, 因此单个案例成功多,复用性少。)
总结:技术应该基于产品才有生命力,产品分析的高耦合性与技术实现的低耦合性。

 


2.2 Micosoft的聪明(spec explorer)

 


2.2.1 技术的大众化
spec explorer是微软基于模型测试研究的商业产品。模型实现过程基本概括如下:
 



这套技术本质上与IBM一样,基于相同的模型标准在做。但是微软很聪明,实现了几个跨越:
第一、对传统软件对象进行了高度抽象。状态机的描述不仅完美而且被扩大。
状态机进行代码设计。(注意,模型驱动设计的雏形,联想到什么?测试驱动设计?没那么轻松!!?)
第二、在理论上与实践中解决了模型测试产生的case爆炸问题。(正交技术的运用。这个不是简单的去重,做了非常多的算法优化。)
第三、实现了产品的高耦合性(作为软件服务存在),与技术的低耦合性(分析与执行的较低联系)
总结:这个案例还是值得借鉴的,通用的思路,每一步都进行最彻底完善的解决。
2.2.2 产品理念的商业化
微软对spec的包装与宣传是成功的。现在提及基于模型的测试,大家最先想到的总是spec。这种技术影响力的方式值得我们思考。如何展现百度质量部门自己的技术影响力,形成我们测试人员自己的技术沉淀。这个应该是伴随整个公司与产品发展形成的,或者我们也可以称之为底蕴的东西。

 


2.3 google的创新与实用主义

 


2.3.1 google的实用主义
IBM曾经因为技术高耦合而弃用一些已开发好的模型工具。原因是复用性不够。这点google采取了截然相反的思路。Google开发的是基于微模型的思路。每一个模型只为解决一个互联网问题(小吗?不小,因为处理数据量的庞大,这个模型本身需考虑的已足够复杂)。
 



微模型(个人定义,可能存在不妥的地方.不知google自己怎么叫)的分析方式
总结:这个对比是最值得我们深思的,传统意义上的软件测试,模型测试是基于事件触发跳转的(界面操作系统的核心)。因此天生是完美的有限状态机模型。对于互联网产品来说,核心基于数据处理,这种状态机模型已经不能覆盖。因此业界有数据流模型,流程图模型等等。目前我们采取的组件化测试的核心仍然是基于流程模型的。但是设计之初,我们不希望对分析方法作严格限定,可以对不同组件采取不同分析方法。即不同微模型的不同分析。这个后续可以根据需求裁定。
2.3.2google的保守与创新
Google在微模型建立方面应该积攒了丰富的经验。(从目前流出的资料,我的猜测)。目前海量数据的大部分分析都是基于不同微模型的。但是我们同时发现,公开的paper与成果非常少。只能在技术大会与相关介绍中抓到几个精髓。目前看到的有一篇关于分析问题与答案系统的微模型比较经典(是不是联想到百度知道了? 呵呵,这里的问答系统指广义的搜索需求。) 

 作者:sevensky615  










本文转自百度技术51CTO博客,原文链接:http://blog.51cto.com/baidutech/743713 ,如需转载请自行联系原作者
相关文章
|
2月前
|
人工智能 搜索推荐 测试技术
模拟试错(STE)法让7B大模型测试超GPT-4
【2月更文挑战第24天】模拟试错(STE)法让7B大模型测试超GPT-4
41 1
模拟试错(STE)法让7B大模型测试超GPT-4
|
2月前
|
传感器 算法 计算机视觉
基于肤色模型和中值滤波的手部检测算法FPGA实现,包括tb测试文件和MATLAB辅助验证
该内容是关于一个基于肤色模型和中值滤波的手部检测算法的描述,包括算法的运行效果图和所使用的软件版本(matlab2022a, vivado2019.2)。算法分为肤色分割和中值滤波两步,其中肤色模型在YCbCr色彩空间定义,中值滤波用于去除噪声。提供了一段核心程序代码,用于处理图像数据并在FPGA上实现。最终,检测结果输出到"hand.txt"文件。
|
2月前
|
测试技术
模型驱动测试:引领软件质量的新潮流
模型驱动测试:引领软件质量的新潮流
24 2
|
22天前
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
|
1月前
|
人工智能 搜索推荐 算法
人工智能,应该如何测试?(七)大模型客服系统测试
这篇文稿讨论了企业级对话机器人的知识引擎构建,强调了仅靠大模型如 GPT 是不够的,需要专业领域的知识库。知识引擎的构建涉及文档上传、解析、拆分和特征向量等步骤。文档解析是难点,因文档格式多样,需将内容自动提取。文档拆分按语义切片,以便针对性地回答用户问题。词向量用于表示词的关联性,帮助模型理解词义关系。知识引擎构建完成后,通过语义检索模型或问答模型检索答案。测试环节涵盖文档解析的准确性、问答模型的正确率及意图识别模型的性能。整个过程包含大量模型组合和手动工作,远非简单的自动化任务。
52 0
|
1月前
|
机器学习/深度学习 人工智能 文字识别
|
2月前
|
测试技术
模型驱动测试引领测试开发新风向
模型驱动测试引领测试开发新风向
21 3
|
3月前
|
存储 人工智能 自然语言处理
选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试
OpenAI最近发布了他们的新一代嵌入模型*embedding v3*,他们将其描述为性能最好的嵌入模型,具有更高的多语言性能。这些模型分为两类:较小的称为text- embeddings -3-small,较大且功能更强大的称为text- embeddings -3-large。
116 0
|
3月前
|
运维 数据可视化 测试技术
Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试
2023年10月,我们发表了一篇关于TimeGPT的文章,TimeGPT是时间序列预测的第一个基础模型之一,具有零样本推理、异常检测和共形预测能力。 虽然TimeGPT是一个专有模型,只能通过API访问。但是它还是引发了对时间序列基础模型的更多研究。到了2024年2月,已经有了一个用于时间序列预测的开源基础模型:laglllama。
168 2
|
3月前
|
测试技术 程序员 图形学
常用的Negative prompt用语-测试模型(Stable-Diffusion)
常用的Negative prompt用语-测试模型(Stable-Diffusion)
86 0

热门文章

最新文章