1. 云栖社区>
  2. 全部标签>
  3. #分布式计算#
分布式计算

#分布式计算#

已有1人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

大数据时代的混沌思维

随着几本书的热销,整个科技领域貌似被带入了一个新时代,叫做"大数据时代"。从事数据相关的人员,特别是分布式计算的工程师,庆幸自己赶上了开往大数据时代的轮船,回头一望,看到身后大量饥民正奔涌而来...... 有些精明的人,趁机办起了“大数据”技术培训班,教授hadoop,hive等带有大数据标签的技术。

大数据 分布式计算 数据采集 海量数据

世界是平的,真的是吗?

描述大千万物的信息,也可以被整齐的平铺吗?我们太习惯于用平面表结构去组织、存储和处理信息。当我们面对一张机票,会把航班起飞降落时间,地点,班次,机型等等一系列预定义好的信息作为一个个字段,平铺到一张整齐的表格里,字段们会因为业务而越变越多,表格也越来越臃肿而稀疏,但是,始终不会有空余的字段去记录我们因为航班延误而暴躁的情绪。

云栖社区 大数据 数据库 分布式计算

恐怖的奇点——论机器进化

我相信奇点,但是采用一种预测(prediction)的态度,而非预报(forecasting),言之凿凿说2029或2045有点那个了。看人的智慧形成,也存在个奇点,在那之后加速进化,我看人的生理结构,DNA编码,脑和神经系统,那么精密,常常有种错觉人就是过了奇点的机器。

云栖社区 深度学习 大数据 算法 人工智能 分布式计算 机器人 网络攻击 存储 神经网络

大数据相关术语(1)

1.大数据:英文:big data,mega data大数据指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 2.大数据的4V:英文:4V [volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)] 3. HDFS(Hadoop Distributed FileSystem):Hadoop

深度学习 大数据 算法 服务器 高可用 数据库 人工智能 数据仓库 负载均衡 数据挖掘 分布式计算 并行计算 存储 神经网络

云栖大会 · 南京峰会 | 通往智能之路上的新技术

时隔一年,云栖大会又来到了南京。一大早,从江苏各地赶来的开发者、创新者、创业者已经齐聚一堂。今年的大会又是盛况空前,不仅有各种活动和演讲,而且也有很多首次露面的新的技术。那么下面就跟随小编的步伐去一探究竟吧!

大数据 阿里云 服务器 云栖大会 互联网 人工智能 阿里巴巴 数据仓库 持续交付 分布式计算

持续创新和改进,为用户创造最大价值,阿里云数加MaxCompute获得C-Tech Awards 2016年度“最具技术创新奖”

“C-Tech Awards 2016最具价值大奖评选”活动已经正式结束。从2016年12月22日线上征集至今,活动获得各大技术行业企业的高度关注,现已有来自国内外的近400家企业参与到了本次评选活动中,并提交了全面的产品简介和创新点解析。

大数据 安全 阿里云 SQL 阿里巴巴 数据安全 弹性伸缩 数加 沙箱 分布式计算 物联网 专有云 自建机房 离线分析 MaxCompute

阿里“NASA”首个重磅武器亮相:机器学习平台PAI2.0

3月29日,阿里云在云栖大会深圳峰会上正式发布机器学习平台PAI2.0。

深度学习 算法 阿里云 服务器 人工智能 阿里巴巴 电商 分布式计算

阿里云机器学习——让人工智能触手可及

近期,阿里云计划将旗下机器学习平台正式商业化发布,这不禁人们马上就联想到了刷脸支付、人机智能交互、商品智能推荐等场景,机器学习算法就是助力这些人工智能应用的底层算法。本文中将详细描述阿里是如何构建自己的人工智能平台,这个平台的特性和支持的算法,以及能够解决的问题。

深度学习 分布式 架构 算法 阿里云 服务器 人工智能 数据挖掘 分布式计算 推荐系统

学生党如何从零开始,成为云计算牛人,步入IT大厂或成就个人事业?

这是一篇纯干货分享帖,不谈个人经验,只搬运牛人的技术“方案”。 第一步,你要深入的了解云计算是什么? 云计算从入门到实践之视频课程 贴上此课程的前几章,也许你能更好的了解从何学起。

分布式 大数据 架构 算法 服务器 互联网 配置 集群 操作系统 阿里云服务器 分布式计算 分布式系统 分布式数据库 分布式存储 学生机

用大白话聊聊分布式系统

一提起“分布式系统”,大家的第一感觉就是好高大上啊,深不可测,看各类大牛关于分布式系统的演讲或者书籍,也大多是一脸懵逼。本文期望用浅显易懂的大白话来就什么是分布式系统、分布式系统有哪些优势、分布式系统会面临哪里挑战、如何来设计分布式等方面的话题来展开讨论。

RPC 分布式 分布式系统与计算 Apache 集群 可扩展性 中间件 主机 分布式计算 分布式系统

开源大数据周刊-第43期

阿里云E-MapReduce动态 E-MapReduce发布新版本,可以在控制台管理meta表结构。 资讯 人脸识别,要靠哪些技术支撑,是否会泄露个人隐私? 本文介绍人脸识别用到哪些技术,讨论如何保护用户隐私 一图看懂AI阵营:学习AI 站错队可导致自取灭亡 本文介绍现在AI技术阵营,对AI各流派进行细分,梳理了17种方法,并用 图直观展现。

深度学习 大数据 阿里云 hbase HTTPS http 钉钉 开源大数据 e-mapreduce 分布式计算 物联网 分布式系统 html zookeeper 云数据库RDS

【Spark Summit East 2017】使用Spark, Kafka和Elastic Search的大规模预测

本讲义出自Jorg Schad在Spark Summit East 2017上的演讲,主要介绍了使用Spark, Kafka和Elastic Search的大规模预测的方法以及案例,并分享了分布式计算以及数据分析预测应用的架构设计思想。

云栖社区 大数据 架构 HTTPS odps 数据分析 spark aliyun 分布式计算 大数据分析 MaxCompute

【Spark Summit East 2017】Sparkler:Spark上的爬虫

本讲义出自Karanjeet Singh与Thamme Gowda Narayanaswamy在Spark Summit East 2017上的演讲,主要介绍了利用了分布式计算和信息检索领域的最新发展技术并且组合了像Spark, Kafka, Lucene/Solr, Tika, 和Felix等各种Apache项目的爬虫程序——Sparkler,Sparkler是一个具有高性能、高扩展性以及高性能的网络爬虫程序,并且是运行在Spark上Apache Nutch的进化。

云栖社区 大数据 HTTPS Apache spark aliyun 分布式计算 高性能 lucene 大数据分析 MaxCompute

59
GO