元数据的来源

简介:
一、   源系统
1、    操作型系统数据模型(手工制作或建模工具)
2、    来自于系统文档的数据元素定义
3、    物理文件布局及字段定义
4、    程序规范
5、    外部数据来源的文件布局和字段定义
 
二、   数据抽取
1、    源平台的数据和连接
2、    所选择的数据源的布局和定义
3、    用于抽取的字段的定义
4、    在每一个平台上初始抽取文件的合并准则
5、    标准化字段类型与长度的规则
6、    数据抽取计划
7、    增量修改的抽取方法
8、    数据抽取任务流
 
三、   数据转换和清洗
1、    抽取文件到数据准备文件的映射规范
2、    单独文件的转换规则
3、    字段默认值  
4、    有效性检查和商业规则
5、    分类及重排序安排
6、    从数据抽取到数据准备的审查跟踪
 
四、   数据装载
1、    从数据准备文件到装载映象的映射规则
2、    为每个文件分配键时的分配规则
3、    数据准备到装载映象的审查跟踪
4、    完全刷新的计划
5、    增时装载的计划
6、    数据装载任务流
 
五、   数据存储
1、    集中式数据仓库独立数据集市的数据模型
2、    由多个表组成的主题区域
3、    统一化数据集市的数据模型
4、    物理文件
5、    表和列的定义
6、    有效性检查的商业规则
 
六、   信息传递
1、    查询和报表工具列表
2、    预定义查询和报表的列表
3、    特殊 OLAP 数据库的数据模型
4、    OLAP 检索数据的计划
本文转自   wenyan  51CTO博客,原文链接:http://blog.51cto.com/wenyan/10086
相关文章
|
7月前
|
SQL 存储 分布式计算
MaxCompute元数据使用实践--项目信息统计
MaxCompute的租户级别Information Schema从租户角度提供项目元数据及使用历史数据等信息,您可以一次性拉取您同一个元数据中心下所有Project的某类元数据,从而进行各类元数据的统计分析。
484 0
|
4天前
|
存储 供应链 容灾
平台设计-用户数据来源
平台的基本理念是一个组织只有一套系统
|
8天前
|
SQL 存储 分布式计算
Hive【基础 01】核心概念+体系架构+数据类型+内容格式+存储格式+内外部表(部分图片来源于网络)
【4月更文挑战第6天】Hive【基础 01】核心概念+体系架构+数据类型+内容格式+存储格式+内外部表(部分图片来源于网络)
24 1
|
4月前
|
关系型数据库 MySQL PHP
MySQL基础知识之【元数据】
MySQL基础知识之【元数据】
42 1
|
8月前
|
存储 JavaScript 安全
什么是数据、元数据、主数据和参考数据?
什么是数据、元数据、主数据和参考数据?
|
8月前
|
NoSQL 安全 数据管理
元数据是什么?怎么管?
元数据是什么?怎么管?
|
10月前
|
存储 SQL 关系型数据库
|
11月前
|
运维 Ubuntu 关系型数据库
使用kettle进行多复合来源数据的采集与关联
使用kettle进行多复合来源数据的采集与关联
|
11月前
|
存储 数据采集 XML
大数据数据采集的数据来源的日志数据之搜索类数据
在大数据领域,数据采集是一个非常重要的环节。日志数据已经成为了大数据应用中不可或缺的一部分,尤其是搜索类数据。本文将介绍搜索类日志数据作为数据来源的特点以及其采集流程。
125 0
|
存储 数据可视化 数据管理
你的元数据是否成功管理
如果Google可以在几秒钟内在整个互联网上交付搜索结果,那为什么在我的组织中寻找东西时会遇到很多麻烦呢?
你的元数据是否成功管理