备案控制台

开发者社区大数据文章正文

数据对接—kettle使用之十三

2016-05-05 2363

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

这一篇我们继续介绍转换插件的使用，Row Normaliser、行转列和字段选择。

Row Normaliser控件

这个步骤转动表，标准化数据格式。

行转列

这个插件也是转动表，标准化数据格式，但是相关设置比上面的插件要多一些，例如你想更新一个实际的物理表，这种形式的数据是更容易掌握的。

1、关键字段：不转的字段
2、构成分组的字段：标准化的字段名称(例如Product A，Product C)
3、目标字段：你可以制定一个或者多个新值将要转入的字段(例如sales)

字段选择

这个插件常常用来：
1、选择字段
2、重命名字段
3、指定字段长度或者精度

上面三个不同标签的功能：
1、选择和修改：指定输出流中字段的精确顺序和名称。
2、删除：指定必须从输出流中删除的字段。
3、元数据：修改数据字段的名称、类型、长度和精度。
选项：
1、字段名称：选择或者修改的字段名称。
2、改名：如果不想改名就留空白。
3、长度、精度：输入数字指定长度、精度(-1：代表没有长度、精度指定)

总结：

这几个插件在格式化表数据中作用很大，尤其是下面的字段选择控件，使用的地方很多。

文章标签：

数据格式

skyme

目录

相关文章

不吃西红柿丶

|

存储 SQL 消息中间件

大数据生态圈常用组件（一）：数据库、查询引擎、ETL工具、调度工具等

大数据生态圈常用组件（一）：数据库、查询引擎、ETL工具、调度工具等

不吃西红柿丶

847 0 0

钱塘大舅哥

|

9月前

|

大数据分布式数据库 Hbase

【大数据环境准备】（十三）Phoenix安装

整合Phoenix

钱塘大舅哥

149 1 1

程序员叶同学

|

数据采集缓存分布式计算

大数据 ETL 处理工具 Kettle 的核心概念

上一篇中对 Kettle 进行了简单的介绍，并快速体验了一把 Kettle，完成了「把数据从 CSV 文件复制到 Excel 文件」 HelloWrold 级别的功能。而在实际工作中，可以使用 Kettle 的图形化的方式定义复杂的 ETL 程序和工作流，如下图就是通过一系列的转换（Transformation）完成一个作业（Job）流程。

程序员叶同学

170 0 0

程序员叶同学

|

SQL JavaScript 前端开发

大数据 ETL 处理工具 Kettle 完成一个作业任务

简单一句话，作业流程，即是对转换流程进行调度，也可以嵌套转换流程和作业流程。

程序员叶同学

216 0 0

程序员叶同学

|

数据采集 Java Unix

大数据 ETL 处理工具 Kettle 入门实践

Kettle 是一款国外开源的 ETL 工具，对商业用户也没有限制，纯 Java 编写，可以在 Window、Linux、Unix 上运行，绿色无需安装，数据抽取高效稳定。Kettle 中文名称叫水壶，它允许管理来自不同数据库的数据，把各种数据放到一个壶里，然后以一种指定的格式流出。Kettle 中有两种脚本文件，Transformation 和 Job， Transformation 完成针对数据的基础转换，Job 则完成整个工作流的控制。通过图形界面设计实现做什么业务，并在 Job 下的 start 模块，有一个定时功能，可以每日，每周等方式进行定时。

程序员叶同学

235 0 0

skyme

数据对接—kettle使用之十二

skyme

1535 0 0

skyme

|

数据库

数据对接—kettle使用之十一

skyme

2051 0 0

skyme

数据对接—kettle使用之十五

skyme

1811 0 0

skyme

|

数据库

数据对接—kettle使用之九

skyme

1944 0 0

skyme

|

Java 关系型数据库数据库

数据对接—kettle使用之一

skyme

5178 0 1

热门文章

最新文章

企业应用架构实践（复杂性应对之道）

3+1保障：高可用系统稳定性是如何炼成的？

Java并发基础：了解无锁CAS就从源码分析

Java程序员的日常 —— 多进程开发

windows2008系统启动weblogic报错

火狐浏览器适用的 CSS简单的渐变背景

当Python字符串遇上MySQL

澳大利亚政府大数据6大应用

软件开发的能力体系及锻炼

【刷题】Leetcode 415 字符串相加和 34 字符串相乘

【Linux】开始使用gdb吧！

【Python 基础】检查字符串是否只包含数字和字母？

【刷题】双指针入门

【Python 基础】如何将一个字符串转化为全大写和全小写？

【Python 基础】remove、del和pop有什么区别？

【Python 基础】递推式构造字典（dictionary comprehension）

【Python 基础】Python中的异常处理是如何进行的？

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

2020版大数据实战项目之DMP广告系统（第四阶段）

2020版大数据实战项目之DMP广告系统（第五阶段）

2020版大数据实战项目之DMP广告系统（第六阶段）

2020版大数据实战项目之DMP广告系统（第七阶段）

2020版大数据实战项目之DMP广告系统（第一阶段）

相关电子书

更多

生态与兼容MaxCompute大数据生态集成和开发工具

打造现代化离线任务平台

CarbonData:大数据交互式分析实践

相关实验场景

更多

基于DTS构建一站式实时数据服务

基于Hologres+Flink搭建GitHub实时数据大屏

基于Flink+Tair搭建实时监控大屏

Github实时数据分析与可视化

使用Flink实时发现最热Github项目

lindorm多模间数据无缝流转

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）