1. 云栖社区>
  2. 全部标签>
  3. #数据仓库#
数据仓库

#数据仓库#

已有5人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

开源大数据周刊-第69期

资讯: 阿里巴巴成立达摩院,三年1000亿旨在创造颠覆性基础技术 10 月 11 日,2017 杭州·云栖大会开幕。会上,阿里巴巴集团首席技术官张建锋宣布阿里巴巴成立全球研究院达摩院,进行基础科学和颠覆式技术创新研究,并将在未来 3 年投入 1000 亿元进行基础科学研发。

云栖社区 分布式 大数据 阿里云 hadoop HTTPS 云栖大会 Apache 阿里巴巴 数据仓库 开源大数据 KV存储 kafka kylin 神经网络

DockOne微信分享(九十七):现有系统实施微服务架构改进经验分享

本文讲的是DockOne微信分享(九十七):现有系统实施微服务架构改进经验分享【编者的话】微服务是最近非常热门的话题了,它带来的好处吸引不少互联网公司对现有项目进行微服务架构改进。 本次分享是博主根据自身的项目经验,介绍如何对现有架构进行调整,总结这过程中的相关技术选型,以及如何实施技改,并分享最终取得的非常让人意外的成果。

RPC 架构 MongoDB hbase 性能 数据库 数据仓库 微服务 数据同步

【干货】林漳希:新兴中的数据科学与工程

演讲全文: 我先谈谈如何重新认识大数据,接着我要分别强调一下数据科学和数据工程,这是这个报告的要点,我想从一个具体的案例分析说起,最后一点谈谈如何重构大数据的价值。 我们对大数据的认识,如同一个人在成长过程中对人生的认识,可以用德国文学家歌德的著名短篇小说“少年维特之烦恼”来比喻。

大数据 数据处理 数据仓库

【独家】蒋步星:慎思笃行,数据创业者的真实一面

导读关系代数作为数据库的基础理论,四十年来并没有关键性的发展,仍然是当前业界的主流。然而,面对更复杂的需求和更大的数据量时,关系代数在运算描述和实施方面都显得有些力不从心。一家国内的新技术公司——润乾软件,敢于颠覆传统,开创性地提出来离散数据集模型,试图撼动关系代数在数据库领域的统治地位,开发拥有自主理论体系的新一代数据库和数据仓库。

数据库 数据仓库

【独家】颠覆传统,告诉你一个不同于数据库的计算体系

[导读]数据库是当前数据分析中最重要的数据存在形式,但受其封闭性和关系代数四十年没有关键性发展等影响,现今很难满足多数据计算量的计算需求。演讲嘉宾蒋步星将针对结构化数据常见的集合和有序运算以及大数据计算等实际业务需求,分析探讨关系代数在描述和实施计算时面临的困难,研究结构化数据的计算特点后提出更有适应性的计算模型,并进一步形成更有开放性的计算能力提交方案,最后再简单分享对新一代数据仓库的展望。

大数据 数据库 数据仓库 报表

【数据蒋堂】非结构化数据分析是忽悠?

大数据概念兴起的同时也带热了非结构化数据分析。传说一个企业中80%的数据都是非结构化数据,如果按占据空间来算,这个比例大体不假,毕竟音视频这类数据真地很大。有这么大的数据量,需要进行分析是很自然的事了,而要分析当然就要有相应的技术手段了。

云栖社区 大数据 语音识别 数据仓库 数据分析 云数据库 报表 存储 数据存储 人脸识别

【数据蒋堂】1T数据到底有多大?

一英里不是个很长的距离,一立方英里相对于地球也不会让人觉得是个很大的空间。然后我说,这个空间内能装下全世界所有人,你会不会觉到很惊讶?不过这话不是我说的,是美国作家房龙在一本书里写的。 业内有个著名的数据仓库产品,叫Teradata,20多年前起这个名字,显然是想给人能处理海量数据的感觉。

大数据 数据仓库 报表 存储

【数据蒋堂】我们需要怎样的OLAP?

被狭义化的OLAP OLAP是商业智能应用中重要的组成部分,这个词从字面上理解是在线分析的意思,也就是由用户,特别是业务人员,面对数据进行各种分析操作。 但是,现在的OLAP概念被严重狭义化了。说到OLAP,基本上仅指多维分析,也就是针对一个事先建设好的数据立方体,按指定维度层次进行汇总并呈现成表格或图形,再辅以钻取、聚合、旋转、切片等操作以变换维度层次及汇总范围。

数据仓库 OLAP 报表 在线分析 多维分析

黑色魔方玩转云计算

本文讲的是<strong>黑色魔方玩转云计算,</strong>随着云计算时代的来临,商业环境中超过半数的x86服务器已经应用了虚拟化技术。虚拟化技术降低了成本,提升了资源利用率并带来了更敏捷的业务效率,但是与此同时,也对系统及应用软件管理员的技术水平和人员数量提出了更高的要求。

云栖社区 分布式 架构 性能优化 性能 配置 数据仓库 弹性计算 IT基础设施 云平台 分布式存储 数据中心 存储

【数据蒋堂】列式存储的另一面

列存是常见的数据存储技术,在许多场景下也确实很有效,因而也被不少数据仓库类产品采用,在业内列存也常常就意味着高性能。 可是,列存真有这么好吗?搜索一下,容易找到的列存缺点一般是针对数据修改的,而对于只读的分析计算任务,却很少能见到较详细的讨论。

大数据 性能 数据仓库 索引 并行计算 报表 磁盘 存储

Infosys 推出新平台 BigDataEdge

本文讲的是Infosys 推出新平台 BigDataEdge,2013年2月20日,Infosys(印孚瑟斯)正式推出新平台BigDataEdge。这是一个通过对大数据进行分析,获取重要信息,进而简化复杂任务的新工具。

云栖社区 大数据 架构 算法 Oracle 云服务器 数据仓库 解决方案 数据管理

云计算影响数据库软件发展趋势

本文讲的是云计算影响数据库软件发展趋势,近年来,数据库市场成几何级的增长,各种数据库软件市场规模不断扩大。新的应用不断涌现,未来数据库市场的发展将出现新的趋势。   云的时代,充满想象力   从云计算到虚拟化技术,再到自助商业智能工具等,数据库面临信息管理技术创新带来的新的挑战。

云栖社区 数据库 数据仓库 数据库存储 存储 数据类型 海量数据 在线分析

大数据面临的挑战:当大数据遭遇云计算

本文讲的是大数据面临的挑战:当大数据遭遇云计算,据IDC的报告,未来十年全球大数据将增加50倍。仅在2011年,我们就将看到1.8ZB(也就是1.8万亿GB)的大数据创建产生。这相当于每位美国人每分钟写3条Tweet,而且还是不停地写2.6976万年。

大数据 架构 服务器 Oracle 数据处理 数据库 数据仓库 电商 数据挖掘 单点故障 CPU 存储

平板电脑和云计算时代的数据保护策略

本文讲的是平板电脑和云计算时代的数据保护策略,信息的激增给黑客、窃贼、恶意内部人员创设了一个有着众多攻击目标的环境,而且传统的外围防御无法对付这种威胁。为在信息保护和合法的访问之间实现平衡,企业的信息安全工作人员必须重视保护文件和通信的内容,而不仅仅保护数据的容器和通道。

云栖社区 安全 服务器 加密 数据仓库

云计算时代 企业要如何迎接大数据?

本文讲的是云计算时代 企业要如何迎接大数据,随着云计算的落地,“大数据”已成为业界讨论最广泛的关键词之一,很多企业已经在寻找合适的BI工具来处理不同来源收集到的大数据,但尽管大家对于大数据的意识在提高,但只有少部分的企业如谷歌和Facebook这样的企业才能够真正利用大数据挖掘企业商业价值。

大数据 安全 架构 加密 数据库 数据仓库 存储 数据管理

2012年CCS云计算高峰论坛暨展览将召开

本文讲的是2012年CCS云计算高峰论坛暨展览将召开,第四届CCS云计算高峰论坛暨展览(ccs.d1net.com),将于4月17、18日由《企业网D1Net》,《运营与增值D1Com》联合在北京国家会议中心举行。

云栖社区 大数据 安全 架构 云安全 软件架构 数据仓库 云服务 云平台 数据中心 存储

数据蒋堂 | 怎样看待存储过程的移植困难

存储过程移植困难是经常被诟病的,在罗列存储过程的缺点时,这一条几乎从来不会被遗漏。 存储过程的移植确实很困难,一般业务逻辑复杂到需要写存储过程的地步,总会不可避免地用到数据库独有的特性和语法,更换数据库时这部分代码就需要重写。

大数据 函数 c++ 数据库 数据仓库 报表 存储过程

云非万能!云计算不能解决的三大问题

本文讲的是云非万能!云计算不能解决的三大问题,云计算可以做很多事情,但是它并不是万能的。对于许多企业和政府来说云计算是一个很重要的方向,很强的成功模式展示了它的价值。但是由于最近一段时间对它的大肆宣传,你可能会认为云计算可以做任何事情。

云栖社区 数据仓库

数据蒋堂 | 开放的计算能力为数据库瘦身

我们在上一期谈到,数据库的臃肿,也就是过多的中间表以及相关存储过程,是由于其计算封闭性造成的。如果能够实现独立的计算引擎,使计算不再依赖于数据库提供,那么就可以为数据库瘦身了。 内部来源的中间数据不必再以数据表的形式落地在数据库中,而可以放到文件系统中,由外部计算引擎提供进一步的计算能力。

云栖社区 大数据 hadoop 性能 模块 数据库 数据仓库 云数据库 报表 存储过程 存储 数据存储

福布斯:带你了解Hadoop的前世今生

文章讲的是福布斯:带你了解Hadoop的前世今生,如今Apache Hadoop已成为大数据行业发展背后的驱动力。Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper、Flume)。

大数据 java 服务器 hbase hdfs hadoop 数据库 数据仓库 集群 分布式计算 Hive 编程 zookeeper Mapreduce 存储

60
GO