citibank + 关注

提升树与梯度提升树算法

发布时间:2018-11-09 15:56:52 浏览:2946 评论 :0

我们对Boosting家族的Adaboost算法做了总结,本文就对Boosting家族中另一个重要的算法梯度提升树(Gradient Boosting Decison Tree, 以下简称GBDT)做一个总结。

算法

Adaboost算法

发布时间:2018-11-09 11:12:11 浏览:2308 评论 :0

之前的博客中讲到了集成学习按照个体学习器之间是否存在依赖关系可以分为两类,第一个是个体学习器之间存在强依赖关系,另一类是个体学习器之间不存在强依赖关系。前者的代表算法就是是boosting系列算法。在boosting系列算法中, Adaboost是最著名的算法之一。

算法 函数 性能 Image

centos7安装Cloudera Manager

发布时间:2018-09-11 18:55:27 浏览:3774 评论 :0

第一部分:准备工作一,修改hostname $vim /etc/sysconfig/network $source /etc/sysconfig/network 例如: NETWORKING=yes HOSTNAME=spark01 reboot重启服务器 二,关闭selinux查看SELin.

服务器 mysql 配置 js 主机 同步 spark Server service

怎么使用pipenv管理你的python项目

发布时间:2018-08-31 11:09:33 浏览:2425 评论 :0

python js lock 开发环境 ruby 单元测试 存储

linux统计文件数量

发布时间:2018-08-30 16:06:11 浏览:1267 评论 :0

linux Image

非极大值抑制(non-maximum suppression)的理解

发布时间:2018-08-14 10:42:28 浏览:2271 评论 :0

排序 Image 人脸检测

Python中*和**的使用

发布时间:2018-08-05 14:39:39 浏览:1043 评论 :0

python 函数 序列 test

hive权限控制

发布时间:2018-07-31 21:42:12 浏览:1395 评论 :0

<property> <name>hive.server2.authentication</name> <value>CUSTOM</value> </property> <property> <name>hive.

hadoop Apache spark Hive class Security service

hive使用指南

发布时间:2018-07-25 15:02:20 浏览:1351 评论 :0

创建库:create database base_name; 创建内/外部表: CREATE EXTERNAL TABLE t_lxw1234 ( id INT, ip STRING COMMENT ‘访问者IP’, avg_view_depth DECIMAL(5,1), ...

大数据 hdfs js BY string Hive 分区表 Create 存储

Spark性能优化:数据倾斜调优

发布时间:2018-07-19 16:04:32 浏览:1562 评论 :0

性能优化 spark 解决方案 string static exception Hive

Spark性能优化:资源调优篇

发布时间:2018-07-18 12:21:15 浏览:1445 评论 :0

在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。

性能优化 性能 线程 集群 spark Core Driver CPU 磁盘

linux下查看CPU、内存、磁盘信息

发布时间:2018-07-17 17:29:52 浏览:1679 评论 :0

linux 性能 线程 CPU 磁盘

spark submit参数及调优

发布时间:2018-07-17 12:26:35 浏览:2893 评论 :0

spark submit参数介绍你可以通过spark-submit --help或者spark-shell --help来查看这些参数。使用格式: ./bin/spark-submit \ --class \ --master \ --deploy-mode \ --conf = \ .

性能 线程 Apache cluster 集群 spark Core Driver class CPU 磁盘

K-Means聚类算法原理

发布时间:2018-07-12 20:28:14 浏览:1057 评论 :0

算法 表达式

SVM中的核函数

发布时间:2018-07-12 16:47:28 浏览:4862 评论 :0

算法 函数 kernel 表达式

pandas使用总结(持续更新。。。。。。)

发布时间:2018-07-10 17:33:39 浏览:1041 评论 :0

nunique()返回不同方向中不同的观察值的个数,返回Series

Image pandas

精确率与召回率,RoC曲线与PR曲线

发布时间:2018-07-07 21:25:43 浏览:2710 评论 :1

算法

搭建模型第一步:你需要预习的NumPy基础都在这了

发布时间:2018-07-03 09:45:53 浏览:1098 评论 :0

python 函数 random js 索引 序列 数组

gensim函数库的Word2Vec的参数说明

发布时间:2018-07-02 11:40:24 浏览:1949 评论 :0

算法 函数 配置 HASH

Python中通过csv的writerow输出的内容有多余的空行

发布时间:2018-06-30 13:18:20 浏览:1112 评论 :0

python Image csv

5