CDH4.5.0 新特性

2016-04-08 1729

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Apache Flume

新特性：

FLUME-2190 - 引入一个新的Twitter firehose的feed源
FLUME-2109 - HTTP输入源支持HTTPS.
FLUME-1666 - 系统日志的TCP源现在可以保持时间戳和处理领域中的事件主体.
FLUME-2202 - AsyncHBaseSink can now coalesce increments to the same row and column per transaction to reduce the number of RPC calls
FLUME-2189 - Avro Source can now accept events from a restricted set of peers
FLUME-2052 - Spooling Directory Source can now ignore or replace malformed characters.
Flume自动检测Cloudera Search依赖。

变化的特性：

Memory Channel calculates byte capacity usage on transaction commits instead of puts to improve performance

Apache Hive

新特性：

新增支持非Kerberos身份验证HiveServer2和JDBC客户端之间的SSL加密通信,请见Configuring Encrypted Client/Server Communication for non-Kerberos HiveServer2 Connections

Hue

新特性：

增加了对SAML验证后端和其他安全修补程序支持.

变化的特性:

HUE-1609 - [core] LDAP后端和进口应不区分大小写.
HUE-1632 - [oozie] Workflow with & in a property fails to submit.
HUE-1555 - [hbase] Python 2.4 支持.
HUE-1521 - [core] 改进 JobTracker HA.
[search] 默认的模板应显示的所有字段.
[core] 让搜索绑定认证可选的LDAP

Apache MapReduce v1 (MRv1)

新特性:

HDFS访问追踪：当mapreduce.job.token.tracking.ids设置为true时，MRv1任务根据持有的HDFS访问凭证来访问HDFS上的数据。而且，当MRv1其访问数据数据时HDFS日志会记录其访问信息。
堆栈跟踪的任务超时：为了便于调试，当MR任务超时时会累记其堆栈信息.
KeyOnlyTextInputWriter 和KeyOnlyTextOutputReader使工作流不使用分隔符即可写入/读取文本.

变化的特性：

用户在使用MRv1压缩包的bin-mapreduce1目录下的脚本时，不再需要根据情况的不同而设置不同的环境变量了.

Apache MapReduce v2 (YARN)

新特性:

HDFS访问追踪：当mapreduce.job.token.tracking.ids设置为true时，MRv1任务根据持有的HDFS访问凭证来访问HDFS上的数据。而且，当MRv1其访问数据数据时HDFS日志会记录其访问信.
KeyOnlyTextInputWriter 和KeyOnlyTextOutputReader使工作流不使用分隔符即可写入/读取文本.
公平调度器现在可以不用受节点心跳检测的判断影响，从而可以更快的调度

Apache Oozie

新特性:

Pig和Hive现在无需手动操作或配置即可访问 Parquet 文件.

Apache Sentry (孵化中)

新特性:

Hive Metastore服务的访问可以不受IPTables的限定。在HiveServer2和ImpalaD运行的用户必须要首先在core-site.xml中配置，然后才可以访问Hive Metastore服务。例如，hivemetastore 是Hive Metastore服务的用户。hive和impala分别是运行HiveServer2 和 ImpalaD不同用户。按如下的配置，这些用户将被允许访问Hive Metastore服务.

<property>
    <name>hadoop.proxyuser.hivemetastore.groups</name>
    <value>hive，impala</value>
</property>

Sentry现在已经集成到Cloudera Search中，配置方法请参考： Configuring Sentry for Search

原文地址：What’s New in CDH4.5.0

CDH4.5.0 新特性

Apache Flume

新特性：

变化的特性：

Apache Hive

新特性：

Hue

新特性：

变化的特性:

Apache MapReduce v1 (MRv1)

新特性:

变化的特性：

Apache MapReduce v2 (YARN)

新特性:

Apache Oozie

新特性:

Apache Sentry (孵化中)

新特性:

热门文章

最新文章

相关课程

相关电子书