机器学习模型开发必读:开源数据库最全盘点

  1. 云栖社区>
  2. 雷锋网>
  3. 博客>
  4. 正文

机器学习模型开发必读:开源数据库最全盘点

玄学酱 2017-08-02 15:27:00 浏览1680
展开阅读全文

机器学习模型开发必读:开源数据库最全盘点

开发 AI 和机器学习系统从来没有像现在这样方便。类似于 TensorFlow、Torch 和 Spark 这样的开源工具,在 AI 开发者群体中已是无处不在。再加上亚马逊 AWS、Google Cloud 等云服务带来的海量计算能力,将来使用笔记本电脑来训练 ML 模型或许不再难以想象。

公众对 AI 的遐想,总忽视了数据的角色。但海量被标记、注解过的数据,是当下 AI 革命当之无愧的主要推手之一。业内研究团队和公司机构,均明白“数据民主化”的意义——使任何开发者都能获取高质量的数据来训练、测试模型,是加速 AI 技术发展的必要措施。

但就雷锋网所知,大多数涉及机器学习和 AI 的产品依赖于专有数据库( proprietary datasets)。它们大多是不被公开的,以保护知识产权以及防范安全风险。

即便你幸运地找到了相关公共数据库

网友评论

登录后评论
0/500
评论
玄学酱
+ 关注
所属团队号: 雷锋网