2016Qcon上海之旅

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 转载wangshen主要是大数据应用方向早上第一个听了IBM 企业海量数据以及全面云数据服务实践,主要介绍 了IBM 云计算的应用场景,主要是介绍IBM 在云数据服务方面的应用,主要是分享了几个客户案例.

免费开通大数据服务:https://www.aliyun.com/product/odps

转载wangshen

主要是大数据应用方向
早上第一个听了IBM 企业海量数据以及全面云数据服务实践,主要介绍 了IBM 云计算的应用场景,主要是介绍IBM 在云数据服务方面的应用,主要是分享了几个客户案例,其中一个是央视的西藏骑行的电视直播,中间涉及物理设备数据采集,背后实时的数据分析,结合地理位置 数据,地图以及运动员数据同时支持可视化,提升活动本身的参与性,整体全部基于IBM云服务来做。整个开发周期10天,可见IBM在解决方案级别的能力较强,其次主要介绍了IBM 的云服务。如下:
1

其次就是阿里巴巴的神盾介绍集团的风控平台,整体建设思路和蚂蚁的风控平台类似。
2
3
4


这里融合计算概念没有讲的很清楚,其次基于zk 做指标逻辑的动态更新,而不需要中断指标计算。

接下来主要是基于Elastic Stack 做的大数据多维分析。目前国内应用较多的大数据多维分析工具,一个是apache kylin 一个就是es。这里主要介绍如何应用es 做指标分析。
5

1)数据收集:logstash+beats
     
Logstash:在 server 端,处理传入的日志,采用pipeline 的模式过滤计算数据,不支持数据之间的聚合操作。
     
beats:在client端,用于采集各种情况下的日志,日志包括DB,redis,http,top,file,消息队列。
2)数据分析:elasticsearch
   
 elasticsearch 可以作为OLAP引擎来用。
     
elasticsearch目前加入了很多聚合的功能,包括
   
 a)支持一些数据分析功能,包括柱状图、分布、统计、地理
 
  b)支持任何数据:只要数据能被查询,就可以被分析
   
  c)按需计算和实时性:可以按需实时计算、实时性在秒左右
 
  d)可嵌套组合


3)数据展现:kibana
   kibana被用作数据展示工具,Web 界面,用来搜索和可视化日志。
现场看了一下es的演示,因为结合了可视化,数据采集以及数据清洗以及多维分析的能力,整体体验较为不错。

下午重点:
主要是携程推荐平台负责人介绍了携程推荐平台的介绍,核心点主要是rerank 以及abtest ,根据携程的业务特有的推荐特征筛选等等。
6
7

另外比较重要的就是阿里巴巴宗超介绍了集团在海量数据下数据研发体系的建设和管理,由于数据的暴增如何解决多样数据的规范化存储以及开发等等,核心观念如何统一数据资产以及工具研发体系的标准化。

MaxCompute

8


9


欢迎加入“数加·MaxCompute购买咨询”钉钉群(群号: 11782920)进行咨询,群二维码如下:

96e17df884ab556dc002c912fa736ef6558cbb51 
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
打赏
0
0
0
0
82935
分享
相关文章
上海-技术沙龙问题汇总答疑
影子库表方式的话,是通过特殊的标记将压测数据路由到对应的带特殊标识的中间件和DB,影子库一般和生产的业务DB在同一个实例,这种情况下数据预埋是将生产数据同步到影子库,然后进行脱敏处理;
阿里云开发者DevUP沙龙·成都前端技术沙龙 圆满结束
2020年8月15日下午,在武侯区天府五街菁蓉汇2栋5楼举办了阿里云开发者DevUP沙⻰。 本次活动邀请了阿里巴巴高级前端工程师常艳芳、Web/javaSCript全栈开发者水歌,阿里云高级前端技 术专家杜欢,来和大家分享~~~
1516 0
阿里云开发者DevUP沙龙·成都前端技术沙龙 圆满结束
2017杭州云栖大会100位大咖视频+讲义全分享
“如果我看得更远一点的话,是因为我站在巨人的肩膀上。”2017杭州云栖大会资料全部整理完毕,首批100位大咖视频+讲义分享给大家。
69572 0
2016杭州云栖大会看点、技术系列合集
2016杭州云栖大会有价值的新闻、观点和产品在此汇聚。
21675 0
云栖大会上海峰会精彩回顾直通车
1月20日云栖大会・上海峰会圆满结束,60+场高浓度演讲令到场的开发者朋友们深觉不虚此行。云栖社区精选涵盖大会全景、王坚博士分享、最具人气的演讲、一线实战经验总结、重磅产品发布、数项合作发布等在内的17篇文章,组成回顾系列,与希望一探大会究竟的朋友们共享。
2546 0
杭州云栖大会技术见闻
非常有幸参加今年在杭州云栖小镇举办的云栖大会。在为期三天的展会中,主要就感兴趣的平头哥和飞天智能两类产品,参观了相关的展台和聆听了相关的分论坛。 在平头哥的展台上,主要看了下今年推出的玄铁内核展示,下面是使用武功秘籍的形式,展示出音频,视频,电力和人工智能等10个领域使用玄铁内核开发出的芯片;还是感
1499 0
一年一度的硬核科技盛会——杭州云栖大会就要来了! | 开发者必读(059期)
最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!
827 0
阿里云2019北京峰会之我见(技术篇)
鉴于整个峰会的内容太多,我的分析将分成上下两篇,这次是技术篇,对应的是技术和产品,下次是商业篇,对应的是商业和生态。
2593 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等