武耀文 + 关注
知行合一

回归模型评估指标

发布时间:2019-07-08 12:37:36 浏览:7748 评论 :0

SSE(和方差、误差平方和):The sum of squares dueto error MSE(均方差、方差):Meansquared error RMSE(均方根、标准差):Root mean squared error R-square(确定系数):Coefficientof determ...

算法 Image

常见超参数调优工具

发布时间:2019-06-19 15:15:17 浏览:7229 评论 :0

1.Skopt https://scikit-optimize.github.io/ 是一个超参数优化库,包括随机搜索、贝叶斯搜索、决策森林和梯度提升树。这个库包含一些理论成熟且可靠的优化方法,但是这些模型在小型搜索空间和良好的初始估计下效果最好。

深度学习 算法 函数 性能 分布式计算 并行计算 github 超参数调优

开源-NLP工具-Pytext

发布时间:2019-05-11 18:21:02 浏览:1159 评论 :0

PyText 是一个工业级的开源 NLP 工具包,可用于在 PyTorch 中开发 NLP 模型,并通过 ONNX 部署。其预训练模型包括文本分类、序列标注等。

深度学习 分布式 code 序列

开源-NLP工具

发布时间:2019-05-11 18:17:25 浏览:1603 评论 :0

NLP开源工具 1. AllenNLP 说明:An open-source NLP research library, built on PyTorch。官网:https://allennlp.org/github:https://github.com/huntzhan/allennlp 2. PyText 说明:PyText是基于NLP深度学习技术、通过Pytorch构建的建模框架。

深度学习 code github

开源-开源公司-Apache

发布时间:2019-05-11 18:12:00 浏览:1243 评论 :0

Apache开源软件一览: 1.Hadoop Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。

分布式 hdfs hadoop Apache 数据处理 集群 数据分析 spark scala 分布式文件系统 查询优化 Mapreduce github

开源-开源公司-Google

发布时间:2019-05-11 18:05:14 浏览:1648 评论 :1

Google开源软件一览(大数据和AI方向) 1. Tensorflow 官网地址:https://www.tensorflow.org/Github:https://github.com/tensorflow/tensorflow 2.

大数据 算法 google Machine github 神经网络

开源-开源公司-Alibaba

发布时间:2019-05-11 17:53:53 浏览:2041 评论 :0

Alibaba开源软件概览(大数据和AI方向) MNN MNN 是一个轻量级的深度神经网络推理引擎,在端侧加载深度神经网络模型进行推理预测。目前,MNN 已经在阿里巴巴的手机淘宝、手机天猫、优酷等 20 多个 App 中使用,覆盖直播、短视频、搜索推荐、商品图像搜索、互动营销、权益发放、安全风控等场景。

大数据 性能 测试 图像搜索 淘宝 解决方案 alibaba github 神经网络

AI平台-Spark引擎架构

发布时间:2019-05-11 16:38:57 浏览:872 评论 :0

1. 背景 2.spark内核结构 2.1 重要组成部分 1、Application2、spark-submit3、Driver4、SparkContext5、Master6、Worker7、Executor8、Job9、DAGScheduler10、TaskScheduler11、ShuffleMapTask and ResultTask2.

架构 Image spark Driver

AI平台-第四范式AutoML综述

发布时间:2019-05-07 17:46:18 浏览:1967 评论 :0

这是一篇来自第四范式(4Paradigm)公司的关于AutoML的综述文章。第四范式是目前国内关于AutoML研究较早较深入的公司之一。AutoML全称是Automated Machine Learning,是2014年以来,机器学习和深度学习领域最炙手可热的领域之一。

深度学习 算法 配置

AI平台-NeuronBlocks【NLP工具】

发布时间:2019-05-07 14:49:22 浏览:1221 评论 :0

NeuronBlocks是一个模块化NLP深度学习建模工具包,可以帮助工程师/研究者们快速构建NLP任务的神经网络模型。 该工具包的主要目标是将NLP中深度神经网络模型构建的开发成本降到最低,包括训练阶段和推断阶段。

深度学习 架构 模块 配置 问答 序列 神经网络

AI平台-MLJ【机器学习框架】

发布时间:2019-05-07 09:55:21 浏览:1176 评论 :0

MLJ:超越传统Pipeline的灵活模型组合

深度学习 算法 测试 API pipeline 数据类型 github

AI平台-TransmogrifAI【AutoML】

发布时间:2019-05-07 09:15:44 浏览:1102 评论 :0

TransmogrifAI(发音为 trăns-mŏgrə-fī)是一个用 Scala 编写的 AutoML 库,它运行在 Spark 之上。它的开发重点是通过机器学习自动化加速机器学习开发人员的工作效率,以及实施编译时类型安全、模块化和重用的 API。

云栖社区 深度学习 算法 人工智能 数据挖掘 scala 自然语言处理

python web框架漫谈

发布时间:2019-04-29 14:36:44 浏览:959 评论 :0

说到Web Framework,Ruby的世界Rails一统江湖,而Python则是一个百花齐放的世界,各种micro-framework、framework不可胜数,不完全列表见: http://wiki.python.org/moin/WebFrameworks 虽然另一大脚本语言PHP也有不少框架,但远没有Python这么夸张,也正是因为Python Web Framework(Python Web开发框架,以下简称Python框架)太多,所以在Python社区总有关于Python框架孰优孰劣的话题,讨论的时间跨度甚至长达3-5年。

编程语言 python 性能 Django web Framework Tornado Rails flask Pylons

【数据中台】数据中台的由来

发布时间:2019-04-25 11:36:18 浏览:5459 评论 :0

数据中台这个概念是由阿里首次提出的,所以以其为例,阿里现在拥有众多业务分支系统,如淘宝,天猫,阿里妈妈,阿里巴巴等,每套系统都有自己的体系和数据源,都在各自的系统上做了很多服务,但这些系统之间是否是贯通的呢? 强大的数据中台到底是如何起作用的? 如果需要对某个信息进行深度挖掘,但在系统中无法查询,需要用另一个系统去查,也就是说数据在各系统之间无法共享,导致效率低下。

大数据 人工智能 淘宝 运营 机器人

机器学习开源一览

发布时间:2018-12-31 12:05:55 浏览:1082 评论 :0

python 大数据 算法 java hadoop c++ Apache 数据挖掘 自然语言处理 lucene

数据质量和特征分析

发布时间:2018-09-11 20:31:20 浏览:1449 评论 :0

函数 Image DataFrame pandas

聊聊DMP

发布时间:2018-09-10 21:01:57 浏览:2007 评论 :0

关于招聘:如何短时间全面评估一个程序员的能力

发布时间:2018-09-04 22:35:08 浏览:3290 评论 :1

云栖社区有很多类似的讨论,有很多评估方式,之前好像在一些文章里也表达过自己的看法,但是在招聘时,时间很有限,最多也就一两小时,如何在这么短时间内评估一个人的技术能力呢?是个有意思的问题。我也招过一些技术人员,我觉的有两点很重要,也很简单。

云栖社区 编程语言 程序员 函数

再议拼多多崛起---数据人无事闲聊

发布时间:2018-08-20 22:50:15 浏览:13509 评论 :0

拼多多本质上是他背后强大制造业和互联网等要素构成的价值网,以及无处安放的低端供应链和低销人群构成的巨大市场,最终撑起了拼多多。还有,中国的营销效率是全世界最好的,中国的制造业能力是最强的,中国可以触及的市场是最大的,在这样的价值网基础上,未来中国肯定会崛起许多本土品牌并走向国际。

电商 淘宝 运营

人人都是自己的CEO【商业及经济思考】

发布时间:2018-08-05 04:19:48 浏览:3594 评论 :0

其实生活本身就是在创业,工作也是在创业,自己的人生本身就是一家公司。创业和上班的本质区别是:上班是将自己的时间出售给公司,创业是将自己的时间出售给自己,创业是否能成功,本质上就可以理解成把自己的时间出售给某家公司还是出售给自己更具商业价值的抉择。

创业

4