1. 云栖社区>
  2. 全部标签>
  3. #数据流#
数据流

#数据流#

已有0人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

浅析Cassandra扩容

前言 Cassandra是一款非常优秀的分布式数据库,可以灵活的在线扩容,满足业务水平扩展的需求。本文将会详细阐述扩容中可能遇到的问题,帮助Cassandra用户更好的管理Cassandra。 扩容原理 Cassandra采用一致性Hash算法对数据进行分区打散。

算法 java 数据流 配置 集群 数据迁移 钉钉 Cassandra 分布式数据库 bootstrap 一致性Hash

如何建设数据安全体系?

数据安全是实现隐私保护的最重要手段之一

大数据 数据流 数据安全 身份认证 传统企业 业务安全

数据中台构建产品Dataphin到底能支持哪些数据源?

作者:王腾业务数据存储是业务系统最基本的构成,构建数据中台,就是要将这些数据集中起来放到一个有更强算力的地方集中处理,所以对于数据集成的能力是构建数据中台最基本要求;从存储的发展历程来看,由于不同的业务场景需求,带来了数据存储的不同发展路径,在企业发展中随着业务规模的变化,也会选择不同的存储来支撑.

大数据 Oracle 数据流 配置 Image 数据分析 数据同步 存储 数据存储

夯实Java基础系列16:一文读懂Java IO流和常见面试题

本系列文章将整理到我在GitHub上的《Java面试指南》仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下Star哈 文章首发于我的个人博客: www.how2playlife.com 本文参考 并发编程网 – ifeve.com IO概述 在这一小节,我会试着给出Java IO(java.io)包下所有类的概述。

编程语言 Java核心技术 java 线程 数据流 面试题 磁盘 数组

阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点

笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapReduce Job 做 ETL ,用 Hive 做 Ad hocquery,用 Tableau 做数据可视化,用 R 做数据分析)。

云栖社区 大数据 数据可视化 公共云 数据流 数据分析

基于Flink和规则引擎的实时风控解决方案

对一个互联网产品来说,典型的风控场景包括:注册风控、登陆风控、交易风控、活动风控等,而风控的最佳效果是防患于未然,所以事前事中和事后三种实现方案中,又以事前预警和事中控制最好。 这要求风控系统一定要有实时性。

数据流 解决方案 运营 规则引擎

探寻流式计算

流计算的出现拓宽了应对复杂实时计算需求能力。Storm作为流计算的利器,极大方便了应用。

分布式 大数据 storm 性能 数据处理 数据流 数据仓库 集群 流式计算 html 存储 数据存储 流计算 流数据

敏捷AI | NLP技术在宜信业务中的实践【构建用户画像篇】

在业务中如何运用NLP技术构建客户画像。

算法 数据流 Image 数据存储 NLP 用户画像

Apache Flink 进阶入门(二):Time 深度解析

Flink 的 API 大体上可以划分为三个层次:处于最底层的 ProcessFunction、中间一层的 DataStream API 和最上层的 SQL/Table API,这三层中的每一层都非常依赖于时间属性。

大数据 Apache 数据处理 数据流 Processing API timestamp 流计算 实时计算 ApacheFlink

【译】Hadoop发生了什么?我们该如何做?

原文:https://insidebigdata.com/2019/08/10/what-happened-to-hadoop-and-where-do-we-go-from-here/ Apache Hadoop出现在IT领域是在2006年,它可以支持使用廉价的商用硬件来存储海量数据。

大数据 hadoop Apache 人工智能 数据流 集群 数据分析 存储 数据存储 海量数据 开源计算 数据湖 数据集市

cassandra启动过程介绍

cassandra启动流程 整个启动流程会启动前端cql server用来接收客户端cql请求,启动node互相通信用的MessageService。这个都是常规操作,就不花费篇幅赘述了。cassandra启动过程对于新节点加入还是正常启动还是有区分的,新节点会造成数据重分布,所以需要先执行bootstrap。

算法 日志 数据流 配置 集群 Image 数据迁移 node Server Cassandra bootstrap 启动

Flink 网络传输优化技术

5万人关注的大数据成神之路,不来了解一下吗? 5万人关注的大数据成神之路,真的不来了解一下吗? 5万人关注的大数据成神之路,确定真的不来了解一下吗? 作为工业级的流计算框架,Flink 被设计为可以每天处理 TB 甚至 PB 级别的数据,所以如何高吞吐低延迟并且可靠地在算子间传输数据是一个非常重要的课题。

大数据 性能 线程 数据流 Image Server 序列 netty 数组 network flink

Flink/Spark 如何实现动态更新作业配置

由于实时场景对可用性十分敏感,实时作业通常需要避免频繁重启,因此动态加载作业配置(变量)是实时计算里十分常见的需求,比如通常复杂事件处理 (CEP) 的规则或者在线机器学习的模型。尽管常见,实现起来却并没有那么简单,其中最难点在于如何确保节点状态在变更期间的一致性。

数据流 配置 spark Driver stream flink

如何最大限度地减少DDOS攻击的危害

如何最大限度地保护企业服务器?如果我们无法阻止这种攻击,可以采取哪些措施?分布式拒绝服务(DDoS)是一种完全不同的攻击,你阻止不了黑客对你这么做,除非您主动断开与互联网的连接,否则它会对你的网站发起DDoS攻击。

服务器 DDOS 互联网 数据流 路由器

区块链跟物联网结合的意义在哪里?

我们对自动化、人工智能(AI)和物联网(IoT)等技术感到兴奋,但现实是,数十亿笔交易发生在仍然没有很好集成的系统之间。 如果您的组织在使用人工智能,那么您可能只是在使用它优化客户服务。或者你只是将物联网应用于你的运营,而不是你的营销。

人工智能 数据流 解决方案 物联网 区块链

Java基础17:Java IO流总结

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/a724888/article/details/80201802 这位大侠,这是我的公众号:程序员江湖。

java 线程 数据流 磁盘 数组

Apache NiFi之Kafka流数据到HBase

一.说明 在大数据平台的业务场景中,处理实时kafka数据流数据,以成为必要的能力;此篇将尝试通过Apache NiFi来接入Kafka数据然后处理后存储之HBase 二.开拔 Ⅰ).配置ConsumeKafka_0_10 测试使用了kafka0.

大数据 hbase Apache 数据流 配置 表空间 zookeeper kafka 流数据 NiFi

Apache NiFi之MySQL数据同步

一.简述 Apache NiFi是一个易用、强大、可靠的数据处理与分发系统,Apache NiFi的设计目标是自动化管理系统间的数据流Apache NiFi是美国国家安全局(NSA)开发和使用了8年的一个可视化、可定制的数据集产品。

mysql Apache 数据流 配置 数据同步 database 数据存储 MySQL数据同步 NiFi

116
GO