开发者社区大数据文章正文

【Spark Summit East 2017】为了乐趣和利润的全球扩张

2017-02-19 1572

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Michelle Casbon在Spark Summit East 2017上的演讲，为了建立一个全球的用户群，一个产品需要支持多种语言环境，这带来挑战是在不同语言环境下对于字符进行本地化，Qordoba为了应对这些挑战，使用了高度可扩展的机器学习和自动化计数，使用Scala和Akka作为编排层，Apache Cassandra和MariaDB作为存储层，Spark进行自然语言处理，Kafka作为消息总线。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Michelle Casbon在Spark Summit East 2017上的演讲，为了建立一个全球的用户群，一个产品需要支持多种语言环境，这带来挑战是在不同语言环境下对于字符进行本地化，Qordoba为了应对这些挑战，使用了高度可扩展的机器学习和自动化计数，使用Scala和Akka作为编排层，Apache Cassandra和MariaDB作为存储层，Spark进行自然语言处理，Kafka作为消息总线。

51e0a0b53eaca66730ad8831578f8490ec89c269

c2618869a881cf3a271a51750afc4267f26c9ee7

e9e3a1db20d02347e1ff21650443fe9930748afa

1900c3036da8e5dad59f8bddd7d684cde01e71c3

083be1461d174257e2b465f32ffad0c875557284

f17f259614a7921b875cf537f3b227ab0707225f

f5c74a5009bd18c352c827a419264ff62a2ae6cb

52c9ba6619f8df65a10d8351e0e6db7cc4b598b3

93af17e4f96fed716702d6e6cd6d2d023177fecf

a96026e4f40ea8bfbee41d6d0a6cb7f6e34f75dd

6305674f6913f1e9c882a57d7193d3ed427ce119

d0f0a8050b214f5e0ae943b89ee0ba780efdef72

64d1ce0719c08fb63249d9951ee46a4997165d71

59bf6315057a09bc42ea8b138c71211acecd2628

fcfafb315a97a24616e429f2427d90e05899fdf5

5598b5dc934547a2c56b90db6214084177481d75

9e08d7cad4332b64d9cddc295594352624c0bb7d

a1734bd33bd7308776cc28018593be3c10e5e33a

c06c62f0738bf88694793da6efa686d9ab42482b

2f9aa75f3224f1ad25f4ddf0130e3ab509ed8e5f

674866c733c35b3a69da3e543e2c30b917ab9f6e

d66d91b3e32b535f73dfd5cddb8ee7647575288d

38c18a463119bd22343eb90d25cbff868f6795af

92f0caf974d6d1bd34e39cff8fb4a51b054cb850

5ffdea668a5d6747454f935d4e3708a517575bc6

d5ca9264b7ed3e292e49448ac7fae6fad09003ab

328efc314437724a2123b3514d9acd4f05f8b07b

23ffb55a9ccfaf2b6bdfb21ab312ca37859d866b

0238ecb0869b08bffc7511d1c07021ddeb958d6a

0ff4d5abb9709394d17b64001a7188c102c354e8

af334fd700335927694c3f1b180a1dccce432e58

a3e3274452192ff6507112a0580127fe080944c5

75c245ab4b844235cfb9d964ac98aa337fc33bf0

c14d91c333979b21cee0dbf5fed97a8a4c13ec54

2d5f1c3e867a3ed870e48e6cfcc395a4385ead67

ed67d5da42a863001c7a40822876d72d51cf1de6

dfc20b0e3ed1ef4abdbde3e30c42441ee8f96d80

88b2941099d22d8202adbaa44189c72ca7a24e25

ff839a129f2d8bce1b9438ef53b05f52c0367e36

8a85f95f049f3c1e4b0169cbc36ed236c1d5c92b

0f05ed6dee5574f3a996fb1a39d3d5d9474641d0

e132ae4d3af46f9ff62611a4da3e3a95072100dd

eec933e07e0c0310506a8a5de51ed37c634b8bb7

7c185c521842a4e3a64c82fe7601945ab0be556b

e6a4b1ba923e35708bb8ea3140ed147f11068a21

95d541d1b4c085ad1f2e2abed6d25aa9f558006f

文章标签：

Apache

分布式计算

Spark

消息中间件

机器学习/深度学习

关系型数据库

NoSQL

Kafka

Scala

MaxCompute

关键词：

apache spark summit

apache spark summit east

apache spark east

小猫吃鱼569

阿里云E-MapReduce团队

SQL 人工智能分布式计算

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

超乎你想象的干货合集打包带走！

阿里云E-MapReduce团队

22612 0 0

回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束（附PPT下载）

阿里云E-MapReduce团队

人工智能分布式计算 Spark

SPARK + AI SUMMIT 2020 中文精华版线上峰会材料

阿里云E-MapReduce团队

880 0 0

阿里云E-MapReduce团队

机器学习/深度学习人工智能分布式计算

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题介绍

阿里云E-MapReduce团队

1540 0 0

阿里云E-MapReduce团队

分布式计算 Prometheus Kubernetes

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题发布

阿里云E-MapReduce团队

2126 0 0

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题

阿里云E-MapReduce团队

SQL 人工智能缓存

Spark 10年，作者 Matei 在 Spark + AI Summit 2020 上深情回顾，Photon 引擎首次曝光

在Spark + AI Summit 2020上， Matei 先生的keynote对 Spark 10 年做了非常精彩的演讲和深情的回顾。SparkSQL 重回巅峰，在性能上大幅超越 Presto。在过去几年，我们见过了太多的 benchmark，大家都在纷纷超越 Spark。Spark 3.0 这一进展可以说大大提振了大家对 Spark 的信心，可谓及时雨。

阿里云E-MapReduce团队

2445 0 0

Spark 10年，作者 Matei 在 Spark + AI Summit 2020 上深情回顾，Photon 引擎首次曝光

开源大数据EMR

人工智能分布式计算大数据

Spark + AI Summit 2020 中文议题有奖征集

北美 Spark + AI Summit 2020 盛会在即，Apache Spark 中国技术交流社区在此诚邀各位，代表国内开发者选择您最希望听到的主题，届时社区将联合国内顶尖技术专家一一展开中文形式分享。

开源大数据EMR

1076 0 1

阿里云E-MapReduce团队

机器学习/深度学习人工智能分布式计算

Spark + AI summit 2019北美技术峰会华丽落幕

本次SAIC含盖了数据工程与数据科学的内容，包括AI产品化的最佳实践案例分享：超大数据规模下，利用流数据处理确保训练数据更新的时效性，完成数据质量监控，测试以及数据模型服务。也有对流行的软件框架如TensorFlow，SciKit-Learn，Keras，PyTorch，DeepLearning4J，BigDL以及Deep Learning Pipelines等，分别进行深入的主题分享探讨。

阿里云E-MapReduce团队

1202 0 0

寒凝雪

机器学习/深度学习分布式计算大数据

Spark Summit EU重头戏：TensorFlow、结构化的流和GPU硬件加速

寒凝雪

1499 0 0

小猫吃鱼569

分布式计算 Hadoop 流计算

【Hadoop Summit Tokyo 2016】像搭乐高一样搭建Storm与Spark Streaming Pipelines块

本讲义出自Arun Murthy在Hadoop Summit Tokyo 2016上的演讲，主要介绍了Arun Murthy与团队的从各种流使用中学习到的最佳实践和经验，演讲的内容非常简单易懂并且非常有趣，在演讲的最后还介绍了像搭乐高一样搭建Storm与Spark Streaming Pipelines块的相应工具。

小猫吃鱼569

2467 0 0

小猫吃鱼569

分布式计算安全 Hadoop

【Hadoop Summit Tokyo 2016】Apache Spark & Apache Zeppelin的安全状态

本讲义出自Vinay Shukla在Hadoop Summit Tokyo 2016上的演讲，主要介绍了 Spark的安全体系、以及YARN AM上的Spark驱动以及Kerberos身份验证等相关内容，最后还介绍了SparkSQL的相关内容。

小猫吃鱼569

2906 0 0

【Spark Summit East 2017】为了乐趣和利润的全球扩张

热门文章

最新文章

相关课程

相关电子书

相关实验场景