备案控制台

开发者社区

开发者社区大数据文章正文

【Spark Summit EU 2016】使用参数服务器在Spark上扩展因式分解机

2017-02-14 2412

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Nick Pentreath在Spark Summit EU 2016上的演讲，主要介绍了什么是因式分解机（Factorization Machines）以及使用Spark和Glint构建的分布式因式分解机过程中使用到的Spark线性模型、参数服务器以及分布式因式分解机等内容，除此之外讲义中还介绍了目前的研究成果以及面对的挑战和未来的研究发展方向。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Nick Pentreath在Spark Summit EU 2016上的演讲，主要介绍了什么是因式分解机（Factorization Machines）以及使用Spark和Glint构建的分布式因式分解机过程中使用到的Spark线性模型、参数服务器以及分布式因式分解机等内容，除此之外讲义中还介绍了目前的研究成果以及面对的挑战和未来的研究发展方向。

dfd535037aef02cd982ea617d242e56dc24565e6

e41b81a309267c36363f2b76053277db0f2f640e

4e9e60bb16a99a6f8a5833ead52fb670c535e57b

45e7e13a863cd59cf21f83e8cb94f5c5a8a57242

c31888912bb1279a75de30e5658531edee4bb4e7

8b7ddeb9a26996a8225187fca840744bde0118de

ea228cd0e1ace20d32e6cb28aaca3da35d8fdba9

b10a45ca2a3f733c1243ed5050274301171ce679

61595e55f56faca74f87f563275ef671d49f7161

52c188df567fd5ebab766a45d2521fbde0a8c665

7907a7c587b441da2f58dd50ed6841206e0e5226

9c86dc1b19bdce81f83fa5d1ff3c5c90fb753cf2

fd028c11cee9d33796db7925c6c66fa5c128a090

efb8a20c7206ba5116d5215cd978e5436247ef7d

99599a72357c5e8e4fa41dc37aec2de80202c9ce

ab120b5473aba3d6ca2a6e2a21b41dfc55bda98e

4177cc672a788913f7f523da565b4cc5cc2a1637

93c419c7ea67f8a24a50b6d01dd1bfe73fb36fef

92b205008d92de7793de183aa386c08b34ea8dcf

e9084e95f91c48ae2ae857d88fac5870290ca298

38c26053e4f57315cde6698c7246d0341854bb17

f74ecece1711a73d19cf41cf61faa0c9a2c9e470

3bce368ccec91545fdd2babff48ea3fc40a9018d

4dc15f47aaaffbd22e2fcbcee3b8c162db389057

0f074d946b27f03658796f18d0e3d8268ac40e47

cffb5651a217aa2c5e2ee1b86a8c3b60deeefe58

c89e62efd0b0da77a3a0e9ad85d723aab6b72648

87698156bd4c51211bf3a350d418d3f30f41401d

0d1b30f30a5507ff5f58fcd1c9b041b182a997e1

4674a44bd447bdda4da0a16e22b6ed6d738ca808

f11529e6d00c533c104eab1c5ccb4b5f367ce77e

文章标签：

分布式计算

Spark

关键词：

云服务器 ECS参数

云服务器 ECS扩展

apache spark扩展

apache spark参数

apache spark summit

小猫吃鱼569

目录

相关文章

阿甘兄

|

6月前

|

分布式计算 API 流计算

22MyCat - Spark/Storm 对join扩展（简略）

22MyCat - Spark/Storm 对join扩展（简略）

阿甘兄

30 0 0

晓之以理的喵~~

|

3月前

|

SQL 分布式计算测试技术

使用UDF扩展Spark SQL

使用UDF扩展Spark SQL

晓之以理的喵~~

39 0 0

楚国玉

|

9月前

|

分布式计算 Spark

Spark重要参数详解

Spark重要参数详解

楚国玉

61 0 0

1130411424003382

|

SQL 存储分布式计算

Spark强大的函数扩展功能

Spark强大的函数扩展功能

1130411424003382

138 0 0

bqospzg5rfs7g

|

分布式计算资源调度 Kubernetes

Spark 集群搭建_Spark 集群结构_扩展|学习笔记

快速学习 Spark 集群搭建_Spark 集群结构_扩展

bqospzg5rfs7g

129 0 0

Spark 集群搭建_Spark 集群结构_扩展|学习笔记

程序员欣宸

|

分布式计算 Java 大数据

docker下的spark集群，调整参数榨干硬件

调整docker-compose编排的参数，充分发挥硬件信息能运行spark集群

程序员欣宸

245 0 0

docker下的spark集群，调整参数榨干硬件

阿里云E-MapReduce团队

|

存储机器学习/深度学习分布式计算

10月29日社区直播【Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析】

介绍如何利用持久化内存与高性能RDMA 网络来加速Spark Shuffle。

阿里云E-MapReduce团队

4287 0 0

10月29日社区直播【Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析】

袋鼠云

|

SQL 分布式计算运维

技本功|Hive优化之Spark执行引擎参数调优（二）

影响Hive效率的主要有数据倾斜、数据冗余、job的IO以及不同底层引擎配置情况和Hive本身参数和HiveSQL的执行等因素。本文主要结合实际业务情况，在使用Spark作为底层引擎时，通过一些常见的配置参数对报错任务进行调整优化，主要包含以下两个方面：

袋鼠云

1107 0 0

技本功|Hive优化之Spark执行引擎参数调优（二）

阿里云E-MapReduce团队

|

SQL 人工智能分布式计算

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

超乎你想象的干货合集打包带走！

阿里云E-MapReduce团队

22615 0 0

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

阿里云E-MapReduce团队

|

人工智能分布式计算 Spark

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

阿里云E-MapReduce团队

881 0 0

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

热门文章

最新文章

Linux基础与服务器架构综合小实践

在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客

什么是阿里云FPGA云服务器？FPGA云服务器产品优势及应用场景介绍

服务器中常用的几个资源监控工具整理

ECS独立站问题之建立独立站如何解决

2024年阿里云服务器不同实例规格与配置实时优惠价格整理与分享

ECS迁移问题之跨账号迁移ECS如何解决

ECS网页问题之认证实验考不了如何解决

阿里云服务器实例、CPU内存、带宽、操作系统选择参考

使用阿里云 mqtt serverless 版本超低成本快速实现 webscoket 长链接服务器

Spark【环境搭建 01】spark-3.0.0-without 单机版（安装+配置+测试案例）

【Flink】Flink跟Spark Streaming的区别？

大数据技术与Python：结合Spark和Hadoop进行分布式计算

bigdata-36-Spark转换算子与动作算子

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark环境搭建与使用

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

相关实验场景

更多

使用阿里云ECS监控您的特斯拉

使用阿里云ECS安装家用内网穿透服务

ECS实例选型最佳实践

ECS服务保活和宕机启动

云原生场景自动化响应ECS系统事件

幻兽帕鲁联机服务快速部署【有ECS用户】

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）