1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. H>
  5. hive 数据清洗方案

当前主题:hive 数据清洗方案

hive 数据清洗方案相关的博客

查看更多 写博客

DataSimba系列之流式计算

你是否有过这样的念头:如果能立刻马上看到我想要的数据,我就能更好地决策? 市场变化越来越快,企业对于数据及时性的需求,也越来越大,另一方面,当下数据容量呈几何倍暴增,数据的价值在其产生之后,也将随着时间的流逝,逐渐降低。 因此,我们最好在事件发生之后,迅速对其

阅读全文

Phoenix在2345的实践

本文介绍Phoenix在2345公司的实践,主要是实时查询平台的背景、难点、Phoenix解决的问题、Phoenix-Sql的优化以及Phoenix与实时数仓的融合思路。具体内容如下: 实时数据查询时客服系统中一个很重要的模块,提供全公司所有主要产品的数据的

阅读全文

零基础学习大数据的路线和方向

大数据本质是:数据挖掘深度和应用广度的结合。对海量数据进行有效的分析和处理,而不单单是数据量大就叫大数据。 随着人们对大数据的认识越来越深入,很多零基础人员看到了大数据的未来,也想学习这个前沿技术,踏入时代的领军行业。但是一直没有一个很好的思路和方向,本文将

阅读全文

大数据开发之路:hive篇,你看了吗?

引语 大数据开发之路漫漫其修远兮,吾将上下而求索。很多入门大数据的小伙伴,可能第一个接触到的,就是一只可爱的“小象”,也就是我们的大数据领域的数据仓库工具hive。 这只小象给我们提供了方便类SQL查询语言HQL来操纵数据,使得我们一开始不用编写复杂的代码,

阅读全文

如何从 0 到 1 设计、构建移动分析架构

作者:处厚,目前主要负责支付宝数据分析组件开发和通过移动开发平台 mPaaS 对外输出工作。本专题主要围绕 mPaaS 移动分析服务 MAS 展开分享如何从 0 到 1 设计、构建移动分析架构。 直播回顾地址(请复制到浏览器中打开):http://t.cn/

阅读全文

阿里开发者招聘节 | 蚂蚁金服平台前端技术部诚招技术人才啦!

蚂蚁金服平台前端技术部,隶属于蚂蚁金服 CTO 线 - 平台数据技术事业群 - 体验技术部,是蚂蚁金服乃至阿里经济体内最专业的前端团队之一,大部门由前端大神玉伯 带领,而团队则是由可视化领域专家林峰 负责。 不同于一般的技术团队,平台前端技术部是一支基础技术

阅读全文

Apache Flink®生态所面临的机遇与挑战

作者:简锋 引言 在谈生态之前,我们来聊聊什么是生态。生态是指在某个特定领域,以某个组件为核心衍生出来其他多个组件,这些组件可以间接或者直接用到这个核心组件,然后辅助这个核心组件共同完成一个更大或者更特殊的任务。Flink生态圈就是指以Flink为核心的生态

阅读全文

大数据方面核心技术有哪些?新人必读

大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。首先给出一个通用化的大数据处理框架,主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗

阅读全文

hive 数据清洗方案相关问答

提问题

MaxCompute百问集锦(持续更新20171011)

![fd7e5655f16e03d1198dc492cead625bbfb9af58_jpeg](https://yqfile.alicdn.com/ee78085f2e6a147c3fffcc95038b11a73c609bf1.jpeg) 大数据计算服务

阅读全文