1. 云栖社区>
  2. 全部标签>
  3. #大数据#
大数据

#大数据#

已有133人关注此标签

内容分类:
博客 | 问答 | 视频 |

《大数据架构和算法实现之路:电商系统的技术实战》——1.7 更多的思考

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.7节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.7 更多的思考 上面几节中讲述了分类这种机器学习方法的基本知识,及其系统实现。

云栖社区 大数据 架构 算法 HTTPS 用户体验 电商 ScreenShot

《大数据架构和算法实现之路:电商系统的技术实战》——1.6 案例实践

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.6节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.6 案例实践 1.6.1 实验环境设置 帮助读者熟悉理论知识并不是本书的最终目的。

大数据 架构 算法 函数 HTTPS 电商 string

百倍增长,数据驱动——【云栖实录】面对正在崛起的移动支付,如何做好数据运营

阿里云数加提供的不仅仅是BI工具,更是背后一整套的阿里云体系化的服务,只有用起来才真的会感受到云BI的威力。

大数据 阿里云 数加 运营 报表

《大数据架构和算法实现之路:电商系统的技术实战》——1.5 相关软件:R和Mahout

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.5节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 相关软件:R和Mahout 了解了机器学习和分类的基本知识之后,你会发现相关算法本身的实现也是需要大量的专业知识的,开发的门槛也比较高。

分布式 大数据 架构 算法 hdfs hadoop Apache 数据处理 集群 电商 数据挖掘 分布式文件系统 分布式存储 Mapreduce 存储

《大数据架构和算法实现之路:电商系统的技术实战》——1.4 分类效果评估

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.4节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.4 分类效果评估 到了这一步,你可能会产生几个疑问:机器的分类准确吗?是否会存在错误?不同的分类算法相比较,孰优孰劣呢?这是个很好的问题,确实,我们无法保证分类算法都是准确有效的。

云栖社区 大数据 架构 算法 HTTPS 电商 测试 ScreenShot

《大数据架构和算法实现之路:电商系统的技术实战》——1.3 算法:朴素贝叶斯和K最近邻

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.3节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3 算法:朴素贝叶斯和K最近邻 1.3.1 朴素贝叶斯 朴素贝叶斯(Naive Bayes)分类是一种实用性很高的分类方法,在理解它之前,我们先来复习一下贝叶斯理论。

云栖社区 大数据 架构 算法 HTTPS 电商 knn ScreenShot

《大数据架构和算法实现之路:电商系统的技术实战》——1.2 分类任务的处理流程

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.2节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 分类任务的处理流程 给出分类问题的基本概念之后,下面就来理解分类的关键要素和流程。

云栖社区 大数据 架构 算法 电商 测试

《大数据架构和算法实现之路:电商系统的技术实战》——第1章 方案设计和技术选型:分类 1.1 分类的基本概念

本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.1节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第1章 方案设计和技术选型:分类 听完大宝关于第一点的描述,小明很肯定地说:“你们的商家应该是需要这样的一个功能:在他们发布商品的时候,系统会自动地为其推荐合适的商品分类,其界面示意图如图1-1所示。

大数据 架构 算法 人工智能 电商

《深入理解Hadoop(原书第2版)》——导读

前  言 Hadoop已经进入Apache社区发展五年多了,使用Hadoop系统进行开发的工作仍然富于挑战但收获丰厚。本书第1版在若干年前就已经出版了,在这期间,Hadoop系统已经被越来越多的企业使用,自身也得到了飞速发展。

分布式 大数据 hdfs hadoop HTTPS 数据处理 数据库 配置 集群 aliyun Mapreduce 海量数据

《数据驱动安全:数据安全分析、可视化和仪表盘》一3.3 读入数据

本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第3章 ,第3.1节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

云栖社区 大数据 安全 函数 HTTPS Json 数据安全 Image pandas read csv

《深入理解Hadoop(原书第2版)》——第3章 初识Hadoop框架 3.1 安装类型

本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第3章,第3.1节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

linux 分布式 大数据 服务器 hadoop windows 配置 集群 开发环境 EMR 存储

《大数据算法》一3.5 寻找频繁元素的随机算法

本节书摘来华章计算机《大数据算法》一书中的第3章 ,第3.5节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.5 寻找频繁元素的随机算法 本节重新研究3.3节中讨论的问题,提出寻找频繁元素的随机算法。

大数据 算法 函数 HTTPS 数据流 Image 数据结构

《大数据算法》一3.4 估算不同元素的数量

本节书摘来华章计算机《大数据算法》一书中的第3章 ,第3.3节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.4 估算不同元素的数量 顾名思义,估算不同元素的数量就是看数据流中出现了多少不同的元素。

大数据 算法 函数 HTTPS 数据流 Image

《大数据算法》一3.3 寻找频繁元素的非随机算法

本节书摘来华章计算机《大数据算法》一书中的第3章 ,第3.3节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 寻找频繁元素的非随机算法 上面讲的是一个简单的例子,接下来讲一个复杂的例子——频繁元素。

云栖社区 大数据 算法 javascript 数据流 伪代码

《大数据算法》一3.2 水库抽样

本节书摘来华章计算机《大数据算法》一书中的第3章 ,第3.2节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 水库抽样 本节介绍一个简单的空间亚线性算法,即水库抽样。问题定义如下。

云栖社区 大数据 算法 HTTPS Image 数组

《大数据算法》一3.1 空间亚线性算法概述

本节书摘来华章计算机《大数据算法》一书中的第3章 ,第3.1节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第3章 空间亚线性算法 3.1 空间亚线性算法概述 空间亚线性算法指的是在算法运行过程中需要的空间小于数据量的实际存储空间,在一些情况下,空间亚线性算法也叫作数据流算法。

大数据 算法 函数 HTTPS 数据流 Image

《大数据算法》一2.5 串相等判定算法

本节书摘来华章计算机《大数据算法》一书中的第2章 ,第2.5节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.5 串相等判定算法 本节讨论一个通信亚线性算法问题,因为在很多情况下,数据传输时间和数据量大致成正比,因而将通信亚线性算法归到本章讨论。

云栖社区 大数据 算法 数据库 序列 数组

《大数据算法》一2.4 数组有序的判定算法

本节书摘来华章计算机《大数据算法》一书中的第2章 ,第2.4节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4 数组有序的判定算法 本节讨论数组有序的判定问题的判定算法。 1.问题的定义 数组有序的判定问题 输入:包含n个数的数组A。

云栖社区 大数据 算法 javascript 索引 序列 数组

《大数据算法》一2.3 时间亚线性判定算法概述

本节书摘来华章计算机《大数据算法》一书中的第2章 ,第2.3节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3 时间亚线性判定算法概述 本节将介绍时间亚线性判定算法。顾名思义,时间亚线性判定算法指的是在输入的亚线性时间完成判定任务的算法。

云栖社区 大数据 算法 伪代码 数组

《大数据算法》一2.2 最小生成树代价估计

本节书摘来华章计算机《大数据算法》一书中的第2章 ,第2.1节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 最小生成树代价估计 本节讨论最小生成树问题的亚线性算法,首先介绍连通分量个数估计算法,接下来基于此基础算法设计最小生成树代价估计算法。

云栖社区 大数据 算法 HTTPS Image

217
GO