【机器学习】融入ML的持续集成与持续交付框架

  1. 云栖社区>
  2. 博客>
  3. 正文

【机器学习】融入ML的持续集成与持续交付框架

flowerwaiter 2019-03-06 02:48:31 浏览4306
展开阅读全文

上期我们介绍了持续集成与持续交付的敏捷开发架构。随着机器学习的流行,越来越多的敏态业务除了要尽快上市,还要结合机器学习来尽快预测出市场发展。
在敏态交付的示意图中,开发和运维不再分家,应用被模块化地拆解开来,单元测试和集成测试周期被大大缩短。持续集成/持续交付作为其中衔接的环节,帮助了很多原来只懂开发的程序员了解了业务需求,提高了运维水平。
1
回过头来说说机器学习,它其实是一个对输入参数、算法选择和参数不断进行最优调试的过程。比如说我们对猫的种类通过图像识别来进行归类训练,输入的参数(或从图像识别到的参数)有:猫的发色、发量、体型、瞳距等等;
2
由于是监督学习的归类问题,可选择的算法也只有SVM,近似邻域和CART算法,结合调参,可以算出通过学习样本预测的数据准确度。
3
对于验证样本的目标准确度,我们可以设置一个预期值,比如95%,经过反复的调参之后,基本就可以得到准确的配参算法。由于机器学习发生在数据层,敏捷交付发生在应用层,因此在将数据训练结合到DevOps双曲环中一定是可以并行工作的。
4
在企业已有CI/CD平台的基础上,并行接入机器学习的API接口是最初级的对接方式,由数据科学家在集成开发环境(IDE)中完成测试后,将训练环境的算法接口开放给应用,应用将元数据标签一一对接即可。
5
最佳集成模型是建立应对不同数据应用的模型库,同时建立新数据的返送机制,这样可以不断提高模型的成熟度,同时结合业务不断丰富模型库。
6

网友评论

登录后评论
0/500
评论
flowerwaiter
+ 关注