阿里云存储服务 + 关注
手机版

Fivetran:自动化数仓集成服务

Fivetran提供SaaS服务,它连接到业务关键数据源,提取并处理所有数据,然后将其转储到仓库中,以进行SQL访问和必要的进一步转换。

函数 加密 数据仓库 Image 同步 对象存储 schema 存储

Tablestore入门手册--表(Table)管理

表管理接口概述 API 描述 createTable 创建表 deleteTable 删除表 listTable 列出实例下的所有表 updateTable 更新表(在表被创建之后,动态的更改表的配置或预留吞吐量) ...

数据存储与数据库 java TableStore 配置 request aliyun 索引 void schema 表格存储 创建表 表管理 自增主键

Netflix Media Database - 架构设计和实现

前言 前面一文主要讲了NMDB的起源、业务场景以及Media Document数据模型,而本节主要讲述NMDB的系统架构、核心模块以及底层技术。在深入了解其架构之前,我们先要明确NMDB的定位和功能设计目标,先看下Netflix内部视频处...

大数据 架构 算法 TableStore 人工智能 索引 Cassandra 数据节点 Elasticsearch schema 表格存储 database service 存储 数据存储

Netflix Media Database - 起源和数据模型

前言 Netflix(美国最大的PGC视频内容商)在18年下半年陆续发了几篇文章来讲述他们内部的NMDB系统的设计和实现,NMDB的全称是Netflix Media Database,用于解决Netflix内部视频结构化数据的统一存储和分...

大数据 算法 NOSQL TableStore 人工智能 个性化推荐 用户体验 索引 schema 表格存储 database 存储 数据存储 工作流 字幕

Spark读写OSS并使用OSS Select来加速查询

Spark读写OSS 基于这篇文章搭建的CDH6以及配置,我们来使Spark能够读写OSS(其他版本的Spark都是类似的做法,不再赘述)。 由于默认Spark并没有将OSS的支持包放到它的CLASSPATH里面,所以我们需要执行如下命...

云栖社区 分布式 大数据 分布式系统与计算 OSS SQL Apache spark scala aliyun string schema Access csv input

基于OSS+DataLakeAnalytics+QuickBI的Serverless的查询分析和可视化BI

数据存储在OSS后,可以有多种方式查询分析OSS数据,如自建Spark/Presto/Impala(阿里云EMR以及Hadoop社区官方已支持OSS), 使用MaxCompute、DataLakeAnalytics等。

OSS 数据库 Image 控制台 aliyun string schema 报表 存储 big data 查询分析 Ad-hoc BI分析

Severless SQL on OSS 实验

数据存储在OSS后,可以有多种方式查询分析OSS数据,如自建Spark/Presto/Impala(阿里云EMR以及Hadoop社区官方已支持OSS), 使用MaxCompute、DataLakeAnalytics等。

OSS SQL Image 同步 控制台 aliyun string schema Create big data serverless DataLakeAnalytics

Logtail从入门到精通(四):正则表达式Java日志采集实战

为简化日志接入门槛,我们提供了极简模式的日志解析方式(如[开启日志采集之旅]()中的介绍)。为了更好的对日志进行分析,我们还提供了其他解析方式,例如:分隔符模式、完整正则模式、JSON模式等。本文将为大家介绍如何使用完整正则解析模式。

云栖社区 java 日志 配置 Image Logtail 正则表达式 aliyun JDBC schema html 存储 采集

OSS访问域名使用规则

OSS域名构成规则 针对OSS的网络请求,除了GetService这个API以外,其他所有请求的域名都是带有指定Bucket信息的三级域名组成的。 访问域名规则:BucketName.Endpoint。

阿里云 OSS 域名 ECS 云服务器 http sdk 配置 string url 数据中心 schema

1
GO
更多>
日志 aliyun 日志服务 存储 配置 OSS Image 数据存储与数据库 云栖社区 控制台 表格存储 SLS html 架构 对象存储 大数据 函数 LOG 日志分析 服务器 索引 TableStore 云存储 监控 Logtail 安全 性能 分布式系统与计算 SQL 分布式 数据库 阿里云 阿里技术协会 python 云存储技术 数据存储 HTTPS 集群 同步 java string 数据加工 ots 解决方案 ECS NOSQL Json 钉钉 报表 容器 高可用 windows 流计算 文件存储服务 etl 数据迁移 安全与风控 日志采集 云存储网关 mysql kubernetes 算法 云盘 NAS 加密 互联网产品及应用 数据采集 nginx sdk Group 文件存储 负载均衡 k8s linux cdn 运营 正则表达式 消息服务 数据处理 容灾 高性能 MNS API 数据中心 request Server 数据同步 电商 日志处理 数据分析 域名 最佳实践 云栖大会 系统研发与运维 物联网 数据备份 http 数组 数据安全 github 消息系统 备份 index 测试 工单 插件 数据管理 消息队列 分布式存储 docker 模块 对象存储OSS 线程 service RAM loghub spark shell 前端与交互设计 syslog 安全问道 海量数据 高并发 移动开发与客户端 hbase 镜像 基础设施 serverless 混合云存储 MaxCompute BY 带宽 stream 浏览器 type 帮助 性能优化 机器学习 云服务 可视化 磁盘 hadoop 公共云 workshop NFS web 数据类型 TSDB 数据仓库 IOT timestamp 多线程 用户体验 schema 互联网 js 弹性伸缩 test hdfs 脚本 csv faq Apache 系统软件 身份认证 微服务 弹性扩展 VPC url 主机 分布式文件系统 异地 kafka 访问日志 source 按量付费 CLI 排序 Java核心技术 IIS 查询分析 logger Blink 飞天 DDOS php Elasticsearch 常见问题 devOps google 公共云 深度学习 发布 RDS DNS 混合云备份 归档存储 混合云 demo 网络安全 slb 分布式系统 离线分析 android ATA 表达式 STS trace VMWare 大数据分析 兼容性 Bash Access 函数计算 根目录 时序 EMR file logstash 实时系统 系统盘 采集 Office 序列 多元索引 挂载OSS ossimport 大数据安全 云服务器ECS logging 态势感知 数据盘 轨迹 flink 人工智能 网络与数据通信 smb 客服 big OSS挂载 Feed流 data 日志收集 im 持续集成 分析 云原生 金融云