阿里云存储服务 + 关注
手机版

史上最全“大数据”学习资源整理

史上最全“大数据”学习资源整理 2016-05-17 Hadoop技术博文   当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它...

分布式 大数据 mysql hbase SQL Apache 数据库 数据仓库 集群 spark google 分布式文件系统 高性能 分布式数据库 bigdata

使用Kafka Connect 同步Kafka数据到日志服务

使用Kafka Connect 同步Kafka数据到日志服务 简介 Kafka作为最流行的消息队列,在业界有这非常广泛的使用。不少用户把日志投递到Kafka之后,再使用其他的软件如ElasticSearch进行分析。

大数据 日志 日志服务 Apache 配置 测试 同步 控制台 aliyun string PUT 插件 kafka 日志分析 Kafkaconnect

[函数计算] Serverless 微服务实践-移动应用包分发服务

移动应用的打包和分发呈现明显的峰谷效用,用户常常需要短时间内准备大量资源保障分发的实时性,完成分发后又需要及时释放资源,降低成本。本次分享将介绍如何通过函数计算构建 Serverless 架构的包分发服务,在开发运维效率,性能和成本间取得良...

移动开发与客户端 java OSS 函数 Apache 微服务 Maven Image aliyun string test cmd serverless 函数计算

使用Fluentd读写OSS

前言 Fluentd是一个实时开源的数据收集器,基于CRuby实现,td-agent是其商业化版本,由Treasure Data公司维护。本文将介绍如何使Fluentd能够读写OSS。 安装 首先下载并安装td-agent,笔者使用的是t...

云栖社区 分布式 大数据 实时系统 MNS OSS Apache events path 配置 aliyun plugin type github

Apache Hadoop 2.7如何支持读写OSS

背景 2017.12.13日Apache Hadoop 3.0.0正式版本发布,默认支持阿里云OSS对象存储系统,作为Hadoop兼容的文件系统,后续版本号大于等于Hadoop 2.9.x系列也支持OSS。

大数据 分布式系统与计算 OSS hdfs hadoop Apache 配置 reduce file read Mapreduce

Spark读写OSS并使用OSS Select来加速查询

Spark读写OSS 基于这篇文章搭建的CDH6以及配置,我们来使Spark能够读写OSS(其他版本的Spark都是类似的做法,不再赘述)。 由于默认Spark并没有将OSS的支持包放到它的CLASSPATH里面,所以我们需要执行如下命...

云栖社区 分布式 大数据 分布式系统与计算 OSS SQL Apache spark scala aliyun string schema Access csv input

使用Apache Impala(CDH6)查询OSS的数据

CDH6 目前CDH的最新版本是6.0.1,支持Hadoop 3.0.0,本文将介绍如何使CDH6的相关组件(Hadoop/Hive/Spark/Impala等)能够读写OSS。CDH5对OSS的支持在这篇文章介绍。

云栖社区 分布式 大数据 分布式系统与计算 OSS hadoop SQL Apache 配置 集群 aliyun string replication

日志服务-一站式配置采集Apache访问日志

日志服务推出了数据接入向导(Wizard)功能以来,不断优化接入向导的功能,支持各种数据的采集、存储、分析、离线投递, 降低用户使用日志服务门槛。本文介绍数据接入向导一站式配置采集Apache日志与设置索引,同时还可以通过默认仪表盘与查询分...

服务器 日志 Apache 配置 Image cdn 索引 Group 访问日志

1
GO
更多>
日志 aliyun 日志服务 存储 配置 OSS Image 数据存储与数据库 云栖社区 控制台 表格存储 SLS html 架构 对象存储 大数据 函数 LOG 日志分析 服务器 索引 TableStore 监控 云存储 Logtail 安全 分布式系统与计算 性能 SQL 分布式 数据库 阿里云 阿里技术协会 python 云存储技术 数据存储 HTTPS 集群 同步 java string 数据加工 ots ECS 解决方案 NOSQL Json 钉钉 报表 容器 高可用 windows 流计算 文件存储服务 etl 数据迁移 安全与风控 日志采集 云存储网关 mysql kubernetes 算法 NAS 加密 互联网产品及应用 数据采集 云盘 nginx sdk 文件存储 负载均衡 k8s linux Group cdn 运营 正则表达式 消息服务 数据处理 容灾 MNS API 数据中心 request Server 数据同步 电商 高性能 日志处理 数据分析 域名 最佳实践 云栖大会 系统研发与运维 物联网 数据备份 http 数组 数据安全 github 消息系统 备份 index 测试 工单 插件 数据管理 消息队列 docker 模块 对象存储OSS 线程 service RAM 分布式存储 loghub spark shell 前端与交互设计 syslog 安全问道 海量数据 高并发 移动开发与客户端 hbase 镜像 serverless 混合云存储 MaxCompute 带宽 stream 浏览器 type 帮助 性能优化 机器学习 云服务 可视化 基础设施 磁盘 hadoop 公共云 BY workshop NFS web 数据类型 TSDB 数据仓库 IOT timestamp 多线程 schema 互联网 js 弹性伸缩 test hdfs 脚本 csv faq Apache 系统软件 身份认证 微服务 弹性扩展 VPC url 用户体验 主机 分布式文件系统 异地 kafka 访问日志 按量付费 CLI 排序 Java核心技术 IIS 查询分析 logger Blink DDOS php Elasticsearch 常见问题 devOps google 公共云 source 深度学习 发布 DNS 混合云备份 归档存储 混合云 demo 网络安全 slb 分布式系统 离线分析 飞天 android ATA 表达式 STS trace VMWare 大数据分析 兼容性 Bash Access 函数计算 根目录 时序 EMR file RDS logstash 实时系统 系统盘 采集 Office 序列 多元索引 挂载OSS ossimport 大数据安全 云服务器ECS logging 态势感知 数据盘 轨迹 flink 人工智能 网络与数据通信 smb 客服 big OSS挂载 Feed流 data 日志收集 im 持续集成 分析 云原生 金融云