开发者社区> 问答> 正文

在使用emapreduce跑mr的时候,输出7个文件,怎么才能输出一个文件呢?

我用hadoop集群,正常运行后,在输出结构的时候,总是有0-6,一共7个文件,这样,我难以在一个文件中获得结果,如何设置?让集群输出是一个文件呢?

展开
收起
封神 2016-04-26 10:02:08 3241 0
1 条回答
写回答
取消 提交回答
  • 专注在大数据分布式计算、数据库及存储领域,拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验,6年云智能大数据产品技术一号位经验,10年技术团队管理经验;云智能技术架构/云布道师; 研发阿里历代的大数据技术产品包括ODPS、DLA、ADB,最近五年主导宽表引擎研发、DLA、ADB湖仓研发;

    mapreduce分为map、reduce阶段的。reduce的个数是可以调整的,也确定最后的数目。
    如果想输出一个文件,最好设置mapred.reduce.tasks=1。
    不过注意的是,设置 mapred.reduce.tasks = 1 会造成并行度下降,性能会降低的。

    如果你的真实需求是获取一个结果,可以后续把多个文件合并下。

    2019-07-17 18:47:57
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
数据采集:日志数...[jing.luojing].1477375627.pdf 立即下载
《Apache Flink-重新定义计算》PDF下载 立即下载
低代码开发师(初级)实战教程 立即下载