1. 云栖社区>
  2. 全部标签>
  3. #大数据#
大数据

#大数据#

已有267人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

Kafka实战(三) -Kafka的自我修养

Apache Kafka是消息引擎系统,也是一个分布式流处理平台(Distributed Streaming Platform) Kafka是LinkedIn公司内部孵化的项目。LinkedIn最开始有强烈的数据强实时处理方面的需求,其内部的诸多子系统要执行多种类型的数据处理与分析,主要包括业务系统和应用程序性能监控,以及用户行为数据处理等。

云栖社区 分布式 大数据 Apache 集群 spark 分布式存储

大数据学习路线分享函数+map映射+元祖

好程序员大数据学习路线分享函数+map映射+元祖,大数据各个平台上的语言实现hadoop 由java实现,2003年至今,三大块:数据处理,数据存储,数据计算存储: hbase --> 数据成表处理: hive --> 数据仓库的工具计算: mapreduce --> 入门级hive j.

大数据 程序员 函数 scala string 表达式 unit 数据类型 数组 map映射 元祖

当餐饮遇上大数据,嗯真香!

之前去开了一场会,主题是「餐饮领袖新零售峰会」。认真听完了餐饮前辈和新秀们的分享,觉得获益匪浅,把脑子里的核心纪要整理了一下,今天和大家做一个简单的分享,欢迎感兴趣的小伙伴一起交流! 先简单说一下结论: 餐饮和零售的边界在新零售的冲击下,正在模糊边界,打破时空的限制; 传统零售 KPI 是「坪效」,新零售则是「复购率」,这中间最核心的是「会员数据化运营」以及「复购频次」问题。

大数据 运营 餐饮

Redis和Memcached如何选

尺有所长、寸有所短,在真实的场景中,选择最适合的就好。

数据存储与数据库 大数据 redis NOSQL memcached 性能 数据库 负载均衡 存储 数据类型

支持自研技术!河南省引入阿里巴巴飞天云平台

8月22日,河南省人民政府、郑州市人民政府与阿里巴巴集团宣布达成战略合作。双方将在云计算、互联网金融、新零售等领域深入合作,借助阿里巴巴自研飞天云平台、人工智能、信息安全等领域的科技优势,打造中国数字经济强省。

大数据 飞天 互联网 操作系统 云平台

云上一指禅:大数据产品DataWorks每日问答

每天,阿里巴巴集团数万名数据/算法开发工程师正在使用DataWorks,承载阿里巴巴集团99%数据业务构建。

大数据 数据管理 数据开发 DataWorks 数据治理

APS实现的要点与难点

在前一篇关于文章中讨论了不同层级、粒度的生产计划,在各行业中受重视程度的差异问题。 承蒙大家热烈讨论。本文则在收集各方高见的基础上,对于供应链上各个环节的运营、生产计划再作稍微深入一点的探讨。本文将列举APS技术中常见的重点难点作展开讨论,基保重点的计划场景是制造业的生产计划。

深度学习 大数据 算法 开发框架与中间件 工单

Coding and Paper Letter(六十九)

资源整理

大数据 github

快递单号自动识别api接口如何对接?

众所周知,单号识别API为用户提供单号识别快递公司服务,依托于物流大数据平台,用户提供快递单号,即可实时返回可能的一个或多个快递公司,存在多个快递公司结果的,大数据平台根据可能性、单号量,进行智能排序。

大数据 排序 API 大数据分析

数据中台之结构化大数据存储设计

对数据系统核心组件进行拆解,介绍每个组件下对应的开源组件以及云上产品。

大数据 架构 分布式系统与计算 NOSQL TableStore hbase 数据库 索引 离线计算 数据同步 存储 数据存储 流计算

Apache Zookeeper常用命令

一.功能简述 Apache ZooKeeper是一种用于分布式应用程序的分布式开源协调服务;提供了命名服务、配置管理、集群管理、分布式锁、队列管理等一系列的功能 Ⅰ).角色功能 ZooKeeper主要包括leader、learner和client三大类角色,其中learner又分为follower和observer 功能描述 a).

云栖社区 大数据 服务器 hbase Apache 配置 集群 zookeeper 常用命令

好程序员大数据学习路线分享分布式文件系统HDFS

好程序员大数据学习路线分享分布式文件系统HDFS,设计目标: 1、存储量大 2、自动快速检测应对硬件错误 3、流式访问数据 4、移动计算比移动数据本身更划算 5、简单一致性模型 6、异构平台可移植 特点 优点: 高可靠性:Hadoop按位存储和处理数据的能力强高扩展性:hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中高效性:hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快高容错性:hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。

大数据 hdfs hadoop 程序员 path 镜像 集群 string 数据节点 分布式文件系统 存储

1752
GO