1. 云栖社区>
  2. 全部标签>
  3. #数据仓库#
数据仓库

#数据仓库#

已有6人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

机器学习影响现代云计算的五种方式

云计算行业正逐渐向智能的方向转变。虽然计算、存储和网络仍然是云供应商的主要收入来源,但机器学习也正慢慢成为当代云计算的焦点。 以下是五种被机器学习高度影响的云服务: 认知计算(Cognitive Computing) 认知计算的目标是为应用程序带来感觉能力,使App能够看、听、说、甚至决策。

云栖社区 大数据 算法 用户体验 数据仓库 API 云服务 物联网 云平台 自然语言处理 机器人 语音助手 人脸识别

数据挖掘敲门砖--Python爬虫入门

Python爬虫.jpg WHAT 数据挖掘是一门综合的技术,随着Ai的兴起,在国内的需求日渐增大。 数据挖掘的职业方向通常有三个,顺便概要地提一下所需的技能(不仅于此) 数据分析方向:需要数理知识支撑,比如概率论,统计学等 数据挖掘方向:需要懂得主流算法的原理及应用,数据库的原理和操作 科学研究方向:通常是科学家们在深入研究数据挖掘的相关基础理论和算法 但是看完简介,好像和爬虫没什么关系? 接着往下看。

python 算法 服务器 数据仓库 数据分析 数据挖掘 正则表达式 html 存储 数据存储

确认过眼神?上云之路需要遇上对的人!

在“上云就上阿里云”解决了上什么云的问题之后,如何上云成为企业技术人员头疼的问题。业务系统云上应用基础架构应该如何设计、系统存储与数据库如何才能平滑迁移等等成为企业上云之路的障碍。为了解决企业上云前的痛点,阿里云支持与服务团队重磅推出咨询与设计场景下五款专家服务产品。

大数据 安全 架构 性能 数据库 数据仓库 微服务 专家服务 咨询与设计 迁云咨询 应用架构咨询 大数据和机器学习咨询 DevOps咨询 云化战略咨询 典型案例

存储和计算技术的选择

前一阵子公司有个售前来沟通某个用户的情况:数据量比较大,又涉及很多复杂的关联计算,在数据库中用SQL计算性能很差。本来这种场景是比较适合集算器的集文件(集算器特有的压缩二进制格式)存储并计算,但据说这个用户的历史数据还会经常变动,而集文件目前没有提供改写能力(为了保证压缩率和性能),也就不容易直接用。

大数据 算法 NOSQL 性能 数据库 数据仓库 存储 存储技术 计算技术

分析型数据库AnalyticDB推出新规格c4和s8n

信息摘要: 分析型数据库AnalyticDB推出两款高性价比规格c4和s8n。适用客户: 对于中小型客户来说,用以前的c1的几乎相同的成本可以买到性能和容量更为强悍的c4! 超大规格s8n,用极低的成本,可以满足特大型客户未来相当长时间内的容量储备!版本/规格功能: c4是原c1规格的升级版,CPU、内存和存储空间均得到大幅提升,主要是满足中小客户的更高性能实时数据分析需求。

性能 数据仓库 数据分析 aliyun 分析型数据库 CPU 高性能 存储 AnalyticDB

mysql管理工具Maatkit介绍

Maatkit是不错的mysql管理工具,已经成为Percona的一部分。包含以下主要工具: 1、mk-table-checksum 检查主从表是否一致的有效工具 2、mk-table-sync 有效保证表一致的工具,不必重载从表而能够保证一致。

css mysql innodb hbase hadoop 数据库 数据仓库 同步 多线程 权限管理 replication html Blog

阿里云消息队列 Kafka 公测发布

产品介绍: 消息队列 Kafka 是一个分布式的、高吞吐量、高可扩展性消息队列服务,广泛用于日志收集、监控数据聚合、流式数据处理、在线和离线分析等大数据领域,是大数据生态中不可或缺的产品之一。 阿里云提供 Apache Kafka 全站式托管服务,彻底解决开源产品长期以来的痛点,用户只需专注于业务开发,无需部署运维,低成本、更弹性、更可靠。

分布式 大数据 架构 监控 storm 消息队列 日志 Apache 数据处理 数据仓库 可扩展性 spark 离线分析 流计算

区块链项目生态系统

过去5年,互联网行业任何领域的技术类公司发展都很快,现在区块链技术、加密货币、代币销售非常火爆,在2012-2016年创始人和VC们主要关注中心化交易、私有区块链解决方案、电子钱包等,这些流行的区块链项目主导市场。

加密 数据仓库 存储 区域链

4月12日云栖精选夜读:阿里云黄海宇:窄带高清2.0——让直播更惊艳的魔术

 2018年4月11-12日,2018亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖论坛、电视云论坛、短视频论坛、视频云论坛、新技术论坛、运营商论坛、国际云论坛等7大部分组成。在视频云论坛上,阿里云视频云高级算法专家黄海宇作了题为《窄带高清2.0——让直播更惊艳的魔术》的主题致辞。

深度学习 算法 mysql 人工智能 数据仓库 集群 cdn 对象存储 e-mapreduce Hive 高性能 神经网络

数据蒋堂 | 存储和计算技术的选择

前一阵子公司有个售前来沟通某个用户的情况:数据量比较大,又涉及很多复杂的关联计算,在数据库中用SQL计算性能很差。本来这种场景是比较适合集算器的集文件(集算器特有的压缩二进制格式)存储并计算,但据说这个用户的历史数据还会经常变动,而集文件目前没有提供改写能力(为了保证压缩率和性能),也就不容易直接用。

云栖社区 大数据 算法 NOSQL 性能 数据库 数据仓库 数据结构 存储

4月11日云栖精选夜读:阿里云朱照远:AI打开新视界 8K时代已来!

2018年4月11-12日,2018亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖论坛、电视云论坛、短视频论坛、视频云论坛、新技术论坛、运营商论坛、国际云论坛等7大部分组成。在亚太CDN领袖峰会上,阿里视频云总经理朱照远(叔度)作了题为《享见未来 开启新视界》的主题演讲。

深度学习 数据仓库 cdn 对象存储 高性能 机器人 MaxCompute

4月10日云栖精选夜读:阿里巴巴高杰:3年风雨路,阿里巴巴自然语音交互的探索与经验教训

随着语音交互、自然语言处理、多模态等技术的发展,人机交互方式已经变得越来越简单,目前人机交互已经成为行业最热的研究方向之一。那么,未来人机交互的发展趋势什么呢?阿里巴巴智能语音交互专家高杰在《云栖大讲堂第三期|未来人机交互技术沙龙》上为大家分享了在阿里巴巴智能个人助理构建过程中所积累的经验和教训。

分布式 mysql 数据库 人工智能 数据仓库 中间件 电商 自然语言处理 表空间 客服 智能语音

DataWorks+Maxcompute在云数据仓库上,获全球第二

本文基于Now Tech: Cloud Data Warehouse, Q1 2018 (Published: by Noel Yuhanna, March 13, 2018)进行了分析,文中内容仅代表个人观点。

云栖社区 大数据 安全 架构 公有云 数据流 数据仓库 数据安全 MaxCompute 数据集成 DataWorks Forrester 数据质量

Hive和HBase区别

1. 两者分别是什么?    Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。

大数据 hbase hadoop SQL Apache 基础设施 数据仓库 Hive schema facebook Mapreduce 存储

4月9日云栖精选夜读:当数据库遇见FPGA:X-DB异构计算如何实现百万级TPS?

 前言 X-Engine 是集团数据库事业部研发的新一代存储引擎,是新一代分布式数据库X-DB的根基。为了达到10倍MySQL性能,1/10存储成本的目标,X-DB从一开始就使用了软硬件结合的设计思路, 以充分发挥当前软件和硬件领域最前沿的技术优势。

飞天 数据库 人工智能 数据仓库 SaaS 数据挖掘 分布式数据库 存储 MaxCompute

Flume+Hadoop+Hive的离线分析系统基本架构

   最近在学习大数据的离线分析技术,所以在这里通过做一个简单的网站点击流数据分析离线系统来和大家一起梳理一下离线分析系统的架构模型。当然这个架构模型只能是离线分析技术的一个简单的入门级架构,实际生产环境中的大数据离线分析技术还涉及到很多细节的处理和高可用的架构。

大数据 架构 服务器 hadoop 日志 高可用 数据仓库 脚本 Hive 离线分析 Mapreduce 存储 流数据

记录配置HDFS HA后,hive抛错Wrong FS

1.问题: 在CDH5.x或者Apache环境下,配置了NameNode的HA后,Hive无正常查询数据了。 Hive查询会出现如下异常: 点击(此处)折叠或打开 ...

java hdfs hadoop Apache 数据库 配置 数据仓库 Hive update

4月8日云栖精选夜读:阿里巴巴与清华大学成立联合实验室 机器将有五感、懂感情

说起智能机器人,大家或许不会忘记电影《钢铁侠》中如真人大管家一样的贾维斯,或者《超能陆战队》中情感丰富的大白。它们都体现了人类对未来人机交互的想象。 如今,科幻电影中的场景正加速走入现实。 2018年4月3日,清华大学与阿里巴巴宣布达成战略合作,共同成立清华大学- 阿里巴巴自然交互体验联合实验室,探索“下一代人机自然交互”的未来。

算法 飞天 数据仓库

【云周刊】第163期:中国唯一,阿里云进入Forrester大数据服务榜单

中国唯一,阿里云进入Forrester大数据服务榜单,阿里云东南亚第三个大区开服,建成亚洲最大云计算平台,2018深圳云栖拉开帷幕,飞天技术汇五大专场邀你参加~,知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?...更多精彩内容,尽在云周刊!

深度学习 大数据 飞天 程序员 公有云 数据仓库 云周刊 运营 云服务 知识图谱

102
GO