python小能手 + 关注
Python小能手是python进阶学习的管理员,我会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关python的问题及回答。

【资料下载】Python第四讲——使用IPython/Jupyter Notebook与日志服务玩转超大规模数据分析与可视化

发布时间:2019-02-20 14:10:24 浏览:4253 评论 :0

IPython/Jupyter Notebook非常流行,但随着数据量越来越大(例如几百亿条电商平台访问日志),如何继续保持灵活的交互式分析,是一个挑战。阿里云日志服务作为阿里商业操作系统的智能运维平台,无需开发就能快捷完成海量日志数据的采集、消费、投递以及查询分析等功能。

python 函数 日志 c++ 电商 数据分析 操作系统 DataFrame IPython 工作流 大数据分析 海量数据

【理论+案例实战】Python数据分析之逻辑回归(logistic regression)

发布时间:2019-02-20 13:56:09 浏览:1101 评论 :0

本文来自云栖社区官方钉群“Python技术进阶”,了解相关信息可以关注“Python技术进阶”。 逻辑回归是分类当中极为常用的手段,它属于概率型非线性回归,分为二分类和多分类的回归模型。对于二分类的logistic回归,因变量y只有“是”和“否”两个取值,记为1和0。

云栖社区 python 函数 Image 数据分析

小姐姐玩 [吃鸡], 通过数据可视化发现了游戏秘密竟然是?

发布时间:2019-02-19 16:43:15 浏览:3288 评论 :1

本文来自云栖社区官方钉群“Python技术进阶”,了解相关信息可以关注“Python技术进阶”。 大吉大利,今晚吃鸡~ 今天跟朋友玩了几把吃鸡,经历了各种死法,还被嘲笑说论女生吃鸡的100种死法,比如被拳头抡死、跳伞落到房顶边缘摔死 、把吃鸡玩成飞车被车技秀死、被队友用燃烧瓶烧死的。

python 数据可视化 Image aggregate index

【资料下载】Python 第三讲——正则表达式爬取糗事百科数据

发布时间:2019-02-15 09:29:35 浏览:1689 评论 :0

直播时间:2月20日 直播讲师:罗攀——林学研究生《从零开始学Python网络爬虫》作者《从零开始学Python数据分析》作者。擅长网络爬虫、数据分析,在web开发,数据库,机器学习等领域有所涉猎 随着Internet的飞速发展,互联网每天都会产生大量的非结构化数据。

python 互联网 数据分析 正则表达式

情人节,给妹子讲python-S01E01好用的列表

发布时间:2019-02-14 17:17:59 浏览:968 评论 :0

今天开始学python啦,不过我们从哪里开始学起呢? Python中有一种被称之为“容器”的数据类型,专门用来存放其他类型的对象,就好比小时候用的文具盒,里面放着铅笔、尺子、橡皮等等。很多人刚刚使用Python的时候,往往最先接触的就是这种容器对象,比如列表、字典、元组等等。

python js 排序 容器 索引 序列 数据类型

【翻译】Sklearn与TensorFlow机器学习实用指南 —— 附录 C、SVM 对偶问题

发布时间:2019-02-14 17:16:07 浏览:930 评论 :0

为了理解对偶性,你首先得理解拉格朗日乘子法。它基本思想是将一个有约束优化问题转化为一个无约束优化问题,其方法是将约束条件移动到目标函数中去。让我们看一个简单的例子,例如要找到合适的 x 和 y 使得函数 最小化,且其约束条件是一个等式约束。

云栖社区 python 函数 Image

【翻译】Sklearn与TensorFlow机器学习实用指南 —— 第16章 强化学习(上)

发布时间:2019-02-14 17:12:54 浏览:688 评论 :0

评价行为:信用分配问题 如果我们知道每一步的最佳动作,我们可以像通常一样训练神经网络,通过最小化估计概率和目标概率之间的交叉熵。这只是通常的监督学习。然而,在强化学习中,智能体获得的指导的唯一途径是通过奖励,奖励通常是稀疏的和延迟的。

python 算法 函数 神经网络

【翻译】Sklearn与TensorFlow机器学习实用指南 —— 第16章 强化学习(下)

发布时间:2019-02-14 17:11:44 浏览:1151 评论 :0

时间差分学习与 Q 学习 具有离散动作的强化学习问题通常可以被建模为马尔可夫决策过程,但是智能体最初不知道转移概率是什么(它不知道T),并且它不知道奖励会是什么(它不知道R)。它必须经历每一个状态和每一次转变并且至少知道一次奖励,并且如果要对转移概率进行合理的估计,就必须经历多次。

python 算法 函数 scope variables

【翻译】Sklearn与TensorFlow机器学习实用指南 —— 第15章 自编码器

发布时间:2019-02-14 17:10:20 浏览:681 评论 :0

关联权重 当自编码器整齐地对称时,就像我们刚刚构建的那样,一种常用技术是将解码器层的权重与编码器层的权重相关联。 这样减少了模型中的权重数量,加快了训练速度,并限制了过度拟合的风险。 不幸的是,使用fully_connected()函数在 TensorFlow 中实现相关权重有点麻烦;手动定义层实际上更容易。

python Image 神经网络

sklearn调包侠之逻辑回归

发布时间:2019-02-14 17:08:32 浏览:680 评论 :0

本系列教程为《机器学习实战》的读书笔记。首先,讲讲写本系列教程的原因: 第一,《机器学习实战》的代码由Python2编写,有些代码在Python3上运行已会报错,本教程基于Python3进行代码的修订. 第二:之前看了一些机器学习的书籍,没有进行记录,很快就忘记掉了,通过编写教程也是一种复习的过程. 第三,机器学习相对于爬虫和数据分析而言,学习难度更大,希望通过本系列文字教程,让读者在学习机器学习的路上少走弯路。

云栖社区 python 算法 函数 Image

Scrapy框架的使用之Spider的用法

发布时间:2019-02-14 17:06:27 浏览:599 评论 :0

在Scrapy中,要抓取网站的链接配置、抓取逻辑、解析逻辑里其实都是在Spider中配置的。在前一节实例中,我们发现抓取逻辑也是在Spider中完成的。本节我们就来专门了解一下Spider的基本用法。

云栖社区 python 函数 配置 request pipeline scrapy

“水泊梁山“互联网有限公司一百单八将内部社交网络

发布时间:2019-02-14 17:04:33 浏览:514 评论 :0

最近看到了一些社交网络分析的文章,对此产生了兴趣,也开始进行相关的学习。本次文章我们将水浒传这一名著与互联网公司组织架构相结合,用Python+Gephi完成本次的分析,让大家能够以一种不同的视角了解社交网络以及社群发现。

python 互联网 Image

计科专业大一学生一枚,如何提高编程能力?

发布时间:2019-02-14 15:32:32 浏览:721 评论 :0

先简单介绍一下我的情况:大概去年的这个时候从学校毕业,二本A软件工程,现在在北上广深之一的某卫星城从事互联网相关工作,月薪勉强养活自己。看上去一份很没说服力的简历,希望我下面的话,不会让你有这个感觉。

python 算法 c++ 用户体验 Image 编程

【翻译】Sklearn与TensorFlow机器学习实用指南 ——第12章 设备和服务器上的分布式TensorFlow(上)

发布时间:2019-02-14 15:29:13 浏览:725 评论 :0

在第 11 章,我们讨论了几种可以明显加速训练的技术:更好的权重初始化,批量标准化,复杂的优化器等等。 但是,即使采用了所有这些技术,在具有单个 CPU 的单台机器上训练大型神经网络可能需要几天甚至几周的时间。

python 分布式 算法 服务器 CPU GPU 神经网络

【翻译】Sklearn与TensorFlow机器学习实用指南 ——第12章 设备和服务器上的分布式TensorFlow(下)

发布时间:2019-02-14 15:27:54 浏览:519 评论 :0

并行运行 当 TensorFlow 运行图时,它首先找出需要求值的节点列表,然后计算每个节点有多少依赖关系。 然后 TensorFlow 开始求值具有零依赖关系的节点(即源节点)。 如果这些节点被放置在不同的设备上,它们显然会被并行求值。

python 分布式 服务器 线程 集群 索引 GPU

App爬虫神器mitmproxy和mitmdump的使用

发布时间:2019-02-14 15:24:25 浏览:836 评论 :0

mitmproxy是一个支持HTTP和HTTPS的抓包程序,有类似Fiddler、Charles的功能,只不过它是一个控制台的形式操作。 mitmproxy还有两个关联组件。一个是mitmdump,它是mitmproxy的命令行接口,利用它我们可以对接Python脚本,用Python实现监听后的处理。

python request 控制台 脚本 charles

【翻译】Sklearn 与 TensorFlow 机器学习实用指南 —— 第11章 训练深层神经网络(上)

发布时间:2019-02-14 15:19:37 浏览:521 评论 :0

第 10 章介绍了人工神经网络,并训练了我们的第一个深度神经网络。 但它是一个非常浅的 DNN,只有两个隐藏层。 如果你需要解决非常复杂的问题,例如检测高分辨率图像中的数百种类型的对象,该怎么办? 你可能需要训练更深的 DNN,也许有 10 层,每层包含数百个神经元,通过数十万个连接来连接。

python 函数 神经网络

【翻译】Sklearn 与 TensorFlow 机器学习实用指南 —— 第11章 训练深层神经网络(中)

发布时间:2019-02-14 14:28:14 浏览:689 评论 :0

梯度裁剪 减少梯度爆炸问题的一种常用技术是在反向传播过程中简单地剪切梯度,使它们不超过某个阈值(这对于递归神经网络是非常有用的;参见第 14 章)。 这就是所谓的梯度裁剪。一般来说,人们更喜欢批量标准化,但了解梯度裁剪以及如何实现它仍然是有用的。

python 算法 函数 神经网络

【翻译】Sklearn 与 TensorFlow 机器学习实用指南 —— 第11章 训练深层神经网络(下)

发布时间:2019-02-14 14:06:29 浏览:558 评论 :0

训练稀疏模型 所有刚刚提出的优化算法都会产生密集的模型,这意味着大多数参数都是非零的。 如果你在运行时需要一个非常快速的模型,或者如果你需要它占用较少的内存,你可能更喜欢用一个稀疏模型来代替。 实现这一点的一个微不足道的方法是像平常一样训练模型,然后摆脱微小的权重(将它们设置为 0)。

python 函数 神经网络

滑动宫格验证码都给碰上了?没事儿,看完此文分分钟拿下

发布时间:2019-02-14 14:01:24 浏览:651 评论 :0

本节我们将介绍新浪微博宫格验证码的识别。微博宫格验证码是一种新型交互式验证码,每个宫格之间会有一条指示连线,指示了应该的滑动轨迹。我们要按照滑动轨迹依次从起始宫格滑动到终止宫格,才可以完成验证,如下图所示。

python Image selenium index ScreenShot webdriver

3