带你读《企业数据湖》之二:数据湖概念概览

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

带你读《企业数据湖》之二:数据湖概念概览

云迹九州 2019-10-19 21:12:04 浏览1240
展开阅读全文

点击这里查看第一章:数据导论
点击这里查看第三章:Lambda架构:一种数据湖实现模式

第2章数据湖概念概览

数据湖概念的诞生,源自企业面临的一些挑战,如数据应该以何种方式处理和存储。最开始,企业对种类庞杂的应用程序的管理都经历了一个比较自然的演化周期。最开始的时候,每个应用程序会产生、存储大量数据,而这些数据并不能被其他应用程序使用,这种状况导致数据孤岛的产生。随后数据集市应运而生,应用程序产生的数据存储在一个集中式的数据仓库中,可根据需要导出相关数据传输给企业内需要该数据的部门或个人。然而数据集市只解决了部分问题。剩余问题,包括数据管理、数据所有权与访问控制等都亟须解决,因为企业寻求获得更高的使用有效数据的能力。为了解决前面提及的各种问题,企业有很强烈的诉求搭建自己的数据湖,数据湖不但能存储传统类型数据,也能存储任意其他类型数据,

网友评论

登录后评论
0/500
评论
云迹九州
+ 关注
所属团队号: 华章计算机