1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. P>
  5. Python代码行数统计

当前主题:Python代码行数统计

Python代码行数统计相关的博客

Coding and Paper Letter(六十九)

资源整理。 1 Coding: 1.基于Python和Matplotlib的日历热图。 calendar heatmap 2.这是一个独立的(Python / Flask)和基于Lambda的动态控件,用于S3托管的GeoTIFF。 它也是一组用于转码和以其

阅读全文

Kafka 原理和实战

本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/bV8AhqAjQp4a_iXRfobkCQ作者简介:郑志彬,毕业于华南理工大学计算机科学与技术(双语班)。先后从事过电子商务、开放平台、移动浏览器、推荐广告和

阅读全文

【Python数据科学手册】专题:特征工程

本节将介绍特征工程的一些常见示例:表示分类数据的特征、表示文本的特征和表示图像的特征。另外,还会介绍提高模型复杂度的衍生特征和处理缺失数据的填充方法。这个过程通常被称为向量化,因为它把任意格式的数据转换成具有良好特性的向量形式。 1、分类数据 一种常见的非数

阅读全文

Coding and Paper Letter(六十六)

资源整理。 1 Coding: 1.mars是一种基于张量的统一框架,用于大规模数据计算。 mars 2.SVGD是一种通用的变分推理算法,它形成梯度下降的自然对应物以进行优化。 SVGD通过应用一种最小化KL散度的函数梯度下降形式,迭代地传输一组粒子以匹配

阅读全文

Python实现性能自动化测试竟然如此简单

Python实现性能自动化测试竟然如此简单 一、思考 1.什么是性能自动化测试? 性能 系统负载能力 超负荷运行下的稳定性 系统瓶颈 自动化测试 使用程序代替手工 提升测试效率 性能自动化 使用代码模拟大批量用户 让用户并发请求 多页面多用户并发请求 采集参

阅读全文

怎样用PCA技术简化数据,你造吗?

文章转载自ApacheCN 作者:片刻 1、降维技术 一 场景 我们正通过电视观看体育比赛,在电视的显示器上有一个球。 显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。 人们实时的将显示器上的百万像素转换成为一个三维图像,

阅读全文

最常使用的数据挖掘算法——决策树

决策树(Decision Tree)算法主要用来处理分类问题,是最经常使用的数据挖掘算法之一。 一、决策树 场景 一个叫做 "二十个问题" 的游戏,游戏的规则很简单:参与游戏的一方在脑海中想某个事物,其他参与者向他提问,只允许提 20 个问题,问题的答案也只

阅读全文

即将发版!Apache Flink 1.9 版本有哪些新特性?

2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基础设施云化、数据库、云原生、物联网等领域的技术干货,共同探讨前沿科技趋势。本文整理自开源大数据专场中阿里巴巴高级技术专家杨克特(鲁尼)先生的精彩演讲,主

阅读全文

程序员技术练级攻略

月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章

阅读全文

图数据库 Nebula Graph 在 HBaseCon Asia2019 的分享实录

Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。 本篇导读 HBaseCon Asia

阅读全文

【译】使用Spark SQL 运行大规模基因组工作流

原文链接: https://databricks.com/blog/2019/06/26/scaling-genomic-workflows-with-spark-sql-bgen-and-vcf-readers.html 编译: 诚历,阿里巴巴计算平台事业

阅读全文

机器学习工程师第一年的12点体会

机器学习和数据科学都是广义上的术语,它们涉及超级多的领域以及知识,一位数据科学家所做的事情可能与另一位有很大的不同,机器学习工程师也是如此。通常使用过去(数据)来理解或预测(构建模型)未来。 为了将上面刚刚提到的要点融入上下文中,我必须要解释我的角色是什么。

阅读全文

Python对我下手了!学会这几个知识点可以救命!

Python 难学吗?作为初学者该如何入门呢?本文选自**Python 之父Guido van Rossum先生力荐的《零基础轻松学Python》**一书,读的不尽兴的话,欢迎在本书中了解更多。 不要害怕这件事情,写代码,其实和写作文一样,首先需要有一个题目

阅读全文

【译】使用Spark SQL 运行大规模基因组工作流

https://databricks.com/blog/2019/06/26/scaling-genomic-workflows-with-spark-sql-bgen-and-vcf-readers.html 编译:诚历,阿里巴巴计算平台事业部 EMR 技

阅读全文

大数据产品日志服务问题排查思路

1.使用Nginx配置要和服务器的的Nginx的配置一致。 2.数据投递到maxCompute丢失,考虑下日志服务中是否包含了/,会被maxCompute丢弃 3.需要把group by order by的字段设置成索引。 4.默认查询的时候,分钟级别数据一

阅读全文

自制小工具大大加速MySQL SQL语句优化(附源码)

引言 优化SQL,是DBA常见的工作之一。如何高效、快速地优化一条语句,是每个DBA经常要面对的一个问题。在日常的优化工作中,我发现有很多操作是在优化过程中必不可少的步骤。然而这些步骤重复性的执行,又会耗费DBA很多精力。于是萌发了自己编写小工具,提高优化效

阅读全文

2019 Python 面试 必备!100 问,你会几道?

来源商业新知网,原标题:2019 Python 面试 100 问,你会几道? 0 遇到过得反爬虫策略以及解决方法? 1.通过headers反爬虫 2.基于用户行为的发爬虫:(同一IP短时间内访问的频率) 3.动态网页反爬虫(通过ajax请求数据,或者通过Ja

阅读全文

Spark入门介绍

前言 Spark自从2014年1.2版本发布以来,已成为大数据计算的通用组件。网上介绍Spark的资源也非常多,但是不利于用户快速入门,所以本文主要通从用户的角度来介绍Spark,让用户能快速的认识Spark,知道Spark是什么、能做什么、怎么去做。 具体

阅读全文

开源分布式工作流任务调度系统EasyScheduler使用详解

使用手册 登录 输入http://192.168.xx.xx:8888/view/login/index.html 网址,输入用户名:admin,密码:escheduler123 登录 登录之后每个页面的右上角都有用户的身份标识。点击下拉箭头包含用户信息和退

阅读全文

从遇见到信任 | Apache Dubbo 的毕业之旅

所谓信任,就是多一次机会。 2018年2月16日,Apache Dubbo 加入 Apache 基金会孵化器。 ... 2019年5月16日,Apache 软件基金会董事会决议通过了 Apache Dubbo 的毕业申请,这意味着 Apache Dubbo

阅读全文

56