【Spark Summit East 2017】可扩展性机器学习的特征哈希

简介: 本讲义出自Nick Pentreath在Spark Summit East 2017上的演讲,主要介绍了特征哈希是用于处理高维特性的一个功能强大的机器学习技术,特征哈希快速、简单、并且节约内存,而且适合在线学习场景,演讲中分享了特征哈希的基本功能,以及如何使用特征哈希在机器学习中的所有功能类型,并介绍了一个在Spark ML管道中使用的更加灵活和强大的转化器。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Nick Pentreath在Spark Summit East 2017上的演讲,主要介绍了特征哈希是用于处理高维特性的一个功能强大的机器学习技术,特征哈希快速、简单、并且节约内存,而且适合在线学习场景,演讲中分享了特征哈希的基本功能,以及如何使用特征哈希在机器学习中的所有功能类型,并介绍了一个在Spark ML管道中使用的更加灵活和强大的转化器。


4c47a30bf53e244879410367dba7d4b96d26fd38

51006ed9f0ac8634c6e3be6f44f7c72949660e07

ffe21491b8b056d767bd293cc643a46c67a556a2

97279c7133e157bc1f8adc78554329f1cfd09f07

6c8950498f42c1187d0d3a482462349139763433

c5a961681d45a23099dc3a1a5e3c9b878c1bb83a

e89e7093c9c47cb7762cc2042d12cb53e1b5281d

e8426653aef15bd7c22e9419ef7f7f9d78db5dc8

a6b92b8992da05e816cc6c7e6ce3443aa8f57a15

2c71163d12c37cf889c7631f613e67d466b4bbb9

a1e095ff3920f6e014b631967d6a00c154c1ed1c

8db43c12c24130e6bb7e317eee1be4e38acc9056

48baed7bfdd213ec8983cce4f920fe720efa952f

2f14c073dfdf52ed1c1ebcc20508cedb96e923b4

1224bb58376be4c888ba41f2fdc8610b643d7283

44714fa98d68e2671e7123d2ec3c577ae2356d83

0dc6394383173166c1e24b78cd99de9caf4e82c6

62d8065ae3375d60457c589b618463ba691629ff

04721b3d39f589cba870a87e1cf817fb047e2bd1

590f9b39a107f37369cccdc73ca964670ccb03a8

49972e3ea839e590e148ce4e58b1c375eac1b93a

3fbe2e2c7e10d93a3c8b2c6c16e4061ee8bc79d7

f6c87d1dba6a72854c6a4ee652db0a3a6a555a12

f319399092b770f89e5bdeaf1213765ce2b9baf7

07a7a8072f99721c14daa9271c4fcd3f85aa4d9d

0f30ee6efd8321d185ef7823dc48910590c9df44

743438124ba496e1fbce225141fd39ae5b862529

20c6567136cbc53c7f074f7ce420894055fbabdc

8c890ee147d69d77b1463ad1b2352101b5bdd582

33c7256b4047c6ddd70ee2fed5c1ed7af7f41efb

9d8e091b8fc636e352245d296c3df0f00b277f02



相关文章
|
3月前
|
机器学习/深度学习 分布式计算 算法
Spark中的机器学习库MLlib是什么?请解释其作用和常用算法。
Spark中的机器学习库MLlib是什么?请解释其作用和常用算法。
37 0
|
1月前
|
机器学习/深度学习 Python
【机器学习】包裹式特征选择之递归特征消除法
【机器学习】包裹式特征选择之递归特征消除法
153 4
|
1月前
|
机器学习/深度学习 数据采集 监控
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
68 0
|
16天前
|
机器学习/深度学习 数据可视化 算法
【python】Python大豆特征数据分析 [机器学习版一](代码+论文)【独一无二】
【python】Python大豆特征数据分析 [机器学习版一](代码+论文)【独一无二】
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
【机器学习】样本、特征、标签:构建智能模型的三大基石
【机器学习】样本、特征、标签:构建智能模型的三大基石
209 0
|
1月前
|
机器学习/深度学习 数据挖掘 Python
机器学习-特征选择:如何使用互信息特征选择挑选出最佳特征?
机器学习-特征选择:如何使用互信息特征选择挑选出最佳特征?
31 1
|
1月前
|
机器学习/深度学习 算法
机器学习-特征选择:如何使用交叉验证精准选择最优特征?
机器学习-特征选择:如何使用交叉验证精准选择最优特征?
38 0
|
1月前
|
存储 机器学习/深度学习 Apache
Apache Hudi与机器学习特征存储
Apache Hudi与机器学习特征存储
29 0
|
1月前
|
机器学习/深度学习 算法 数据挖掘
【机器学习】包裹式特征选择之递归特征添加法
【机器学习】包裹式特征选择之递归特征添加法
63 5
|
2月前
|
机器学习/深度学习 人工智能 异构计算
人工智能平台PAI问题之Tag类型特征等长如何解决
人工智能平台PAI是指阿里云提供的机器学习平台服务,支持建模、训练和部署机器学习模型;本合集将介绍机器学习PAI的功能和操作流程,以及在使用过程中遇到的问题和解决方案。
45 0