北京房租大涨?6个维度,数万条数据帮你揭穿

简介:

点击关注 异步图书,置顶公众号

每天与你分享 IT好书 技术干货 职场知识

7056db5d17e41f149065e95d9e23950b

转载自/恋习Python

参与文末话题,得异步新书

昨天还幻想海边别墅的年轻人,今天可能开始对房租绝望了。

8月初,有网友在“水木论坛”发帖控诉长租公寓加价抢房引起关注。据说,一名业主打算出租自己位于天通苑的三居室,预期租金7500元/月,结果被二方中介互相抬价,硬生生抬到了10800。

过去一个月,全国热点城市的房租如脱缰野马。一线的房租同比涨了近20%。一夜醒来,无产青年连一块立锥之地都悬了。

从2018下半年开始,租金海啸汹汹来袭,资本狂欢,官方默然,房东纠结,租客尖叫。

这不是一方的过错,而更像是一场全社会的“集体谋杀作品”。最令人不安的是,过去房地产的那套玩法和上涨逻辑,今天正在转移到房租上。

房租暴涨的不只是北京。有数据显示,7月份北京、上海、广州、深圳、天津、武汉、重庆、南京、杭州和成都十大城市租金环比均有所上涨。其中北京、上海、深圳的租金涨幅最猛,北京7月份房租同比上涨3.1%,有小区甚至涨幅超过30%。

4a948800f451dd9d2449e510368045fb

图自“21世纪经济报道”《最新房租数据出炉,你一个月要交多少钱?(附房租地图)》一文

接下来,恋习Python通过Python大法通过获取某网数万条北京租房数据,给大家说说真实的房租情况。

还是老规矩,老套路(是不是有股熟悉的味道),恋习Python常用的三部曲:数据获取、数据清洗预览、数据分析可视化,与你一起探究最近房租的状况。

数据获取

恋习Python今日就把目前市场占有率最高的房屋中介公司为目标,来获取北京、上海两大城市的租房信息。

0fdaa9dff2eec47e25ac0329b2bed32f

整体思路是:

先爬取每个区域的url和名称,跟主url拼接成一个完整的url,循环url列表,依次爬取每个区域的租房信息。

在爬每个区域的租房信息时,找到最大的页码,遍历页码,依次爬取每一页的二手房信息。

post代码之前简单讲一下这里用到的几个爬虫Python包:

requests: 就是用来请求对链家网进行访问的包。

lxml: 解析网页,用xpath表达式与正则表达式一起来获取网页信息,相比bs4速度更快。

详细代码如下:

006aYAbngy1fupbc6ibskj30f40pcmyn.jpg

006aYAbngy1fupbcf7u68j30f30pfgn4.jpg

数据清洗预览

90d3e4f038d6dfe43b59242c6f81c7e2

​数据共14038条,10个维度,由上图可看出北京房源均价为9590元/月,中位数为7000。一半的房源价格在7000以下,所有房源的价格区间为[1000,250000],价格极差过大。

数据分析可视化

四维度-北京房租均价

接下来,恋习Python将北京各区域、各路段、各楼盘房屋数量、均价分布放在同一张图上,更直观地来看待房租。

fba82e0d52008c880ffaf225f773cf50

​从图中可看出,最近,北京市各区域的房租均在6000元/月以上,其中最高区域为东城,均价达12463元/月。不过,由于房源信息过多过杂,房屋位置、面积、楼层、朝向等对价格均有较大影响,因此,价格这个维度需要进一步分析。

4a79278e9af3232a6d55bc1be45d1bc4

​由上图可得,各路段的均价基本都在6000以上,其中海淀北部新区的房源数最多,但均价最低,为3308元/月,这或许与海淀北部生态科技新区作为高新技术产业的承载区、原始创新策源地的研发基地,以及科技园集聚区,目前已入驻华为、联想、百度、腾讯、IBM、Oracle等近2000家国内外知名的科技创新型企业有关。

另一方面,海淀紫竹桥的房价竟一起冲天,其附近以博物馆、体育场馆为特色,交通便利,配套设施完善,均价较高也是情理之中。

1403a900648c1934a18c10151457f263

​可以看出,不同楼盘的均价浮动很大,但都在6000/月以上。最高的甚至达到17516/月。由于每个楼盘户型差别较大,地理位置也较为分散,因此均价波动很大。每个楼盘具体情况还需具体分析。

附详情代码:

006aYAbngy1fupbuj8j90j30fa0h1wff.jpg

61734c829d6233c2e27a9d1841303f60

由上图可以看出,均价在8000-10000之间的房屋数量最多,同时1500-2000这个价位之间房屋数少的可怜。

据北京市统计局的数据,2017年全市居民月人均可支配收入为4769元。另据58同城和赶集网发布的报告,2017年北京人均月租金为2795元。

北京租房者的房租收入比,惊人地接近60%。很多人一半的收入,都花在了租房上,人生就这样被锁定在贫困线上。

统计数据也表明,北京租房人群收入整体偏低。47%的租房人,年薪在10万以下。在北京,能够负担得起每月5000元左右房租的群体,就算得上是中高收入人群。就这样,第一批90后扛过了离婚、秃头、出家和生育,终于还是倒在了房租面前。

附详情代码:

006aYAbngy1fupbwjxo0dj30f40c8gm3.jpg

面积&租金分布呈阶梯性

5b48c7f42c96030f478905bc8d77dead

上图可以看出,80%的房源面积集中在0-90平方米之间,也符合租客单租与合租情况,大面积的房屋很少。

07d395cde8098a551dfb204e4648468b

面积&租金分布呈阶梯性,比较符合常理。租房主力军就是上班族了,一般对房子面积要求较低,基本集中在30平。

附详情代码:

006aYAbngy1fupbxtclvaj30f30q8jso.jpg

006aYAbngy1fupbyexf8ij30f508n3ys.jpg

大多数房屋年龄在10年以上

ea60c0a9503d7c8b414b55359b1ae157

由上图看出,房屋年龄大多集中在10-20年、25年以上,而5年以下的不到2%;不过,别看这些都是老房子,最近房租变得这么猖狂?原因其中之一就是资本圈地。

3d545a2c5b76bd8bce8a0710c9918ca0

这条网贴立马点燃了大众的情绪:“好啊,原来是这些长租平台烧钱圈地,一心只想要垄断市场房源,哄抬租金,企图赚取暴利差价!”

后记

拿自如举例,表面上看跟中介公司没啥两样,收了各种散盘,然后集中装修、出租、管理,因为运营成本和住房质量提高,房租肯定有所上涨。

但更关键的事情在背后。自如把项目打包起来搞起了资产证券化,以租金收益权为基础资产做担保,投放到金融市场上发行国内首单租房市场消费分期类ABS,让各路资金来认购,每年给大家搞点分红。

大量资本都在赌租房这个风口,而前期谁的规模越大、资源越多,以后的定价权就越大,利润空间就越不可想象。

这次恋习Python一共从链家网上爬取14038条数据,而那就是大概一周前,8月17日北京住建委约谈了几家中介公司。最终的结果是自如、相寓和蛋壳承诺将拿出12万间房子投入市场其中,自如将拿出8万间(链家、自如、贝壳找房,他们的实际控制人是同一个人--链家老板左晖)。

ee7cdf5775da6dd5171f0a68dc9542c9

也就是说,平常的时候,链家网+自如一共在网上待租的也就是1万多套房子,但是一被约谈他们就一口气拿出了8万套房子增援??怎么增?继续收房,让房源更加供不应求?

昨天买不起房,今天租不起房,如果连这样的生活也要因为市场的不规范而被逼迫、被夺走,真的会让人对一个城市失去希望。

文章转载自恋习Python公众号

利用数据的方式分析住房有没有很过瘾,

很多骚年们是不是还不知道如何操作,

小编为你送上新鲜出炉的异步新书,

记得往下看哦!

006aYAbngy1fufxrpfxxdj306y08o3zk.jpg

《程序员学Python》

裘宗燕 著

本书是程序设计领域学者裘宗燕教授的潜心力作,程序员的Python入门和进阶指南。书中全面介绍了Python语言的各方面特征和应用技术,讨论了准确理解Python、正确使用Python语言开发程序所需要的深入概念和情况,还介绍了用Python开发较大型或较复杂程序时应该了解的一些高级功能,如程序的模块组织和导入系统,生成器、闭包和装饰器,基本的和高级的面向对象编程机制和技术,以及作为Python最新扩展的协程和异步编程等。

此外,本书还提供完整的进阶内容和对应案例,让读者全面深入地了解深度学习的知识和技巧,达到学以致用的目的。

2d3a41ce14395f21f8506a44f6fb2b7b

《用Python写网络爬虫 第2版》

[德]凯瑟琳 雅姆尔(Katharine Jarmul)著

本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用Scrapy爬虫框架进行快速的并行抓取,以及使用Portia的Web界面构建网路爬虫。

006aYAbngy1fupc5f8dq3j306y08841v.jpg

《“笨办法学”Python3》

Zed Shaw 著

本书是基于Python 3.6版本编写的。百万粉丝程序员带你轻松入门Python语言!5小时的完整视频教程,纯美式发音,搭配中文字幕,边看边练两不误;52个精心设计的编程习题,拒绝拖沓,提供项目案例,学以致用不务虚。

本书是一本Python入门书籍,适合对计算机了解不多,没有学过编程,但对编程感兴趣的读者学习使用。这本书以习题的方式引导读者一步一步学习编程,从简单的打印一直讲到完整项目的实现,让初学者从基础的编程技术入手,最终体验到软件开发的基本过程。

今日互动

你最想用哪本书学Python?为什么?截止9月6日17时,留言+转本活动到朋友圈,小编将抽奖选出2名读者赠送纸书1本(参与活动直达微信端北京房租大涨?6个维度,数万条数据帮你揭穿

fa1043d105336ba768735469f3bfdcd1

长按二维码,可以关注我们哟

每天与你分享IT好文。

在“异步图书”后台回复“关注”,即可免费获得2000门在线视频课程

点击阅读原文,直接购买《程序员学Python

阅读原文​​​​

相关文章
|
8月前
|
数据可视化 Python
可视化 | 中国历届夏季奥运会奖牌数据(树图)
可视化 | 中国历届夏季奥运会奖牌数据(树图)
|
新零售
从“江浙沪包邮”到“三公里理想生活区”:天猫决战北京
8月6日,天猫宣布加码北京,启动北京中心战略——开启北京专享城市平台,包括盒马生鲜、苏宁、银泰、易果生鲜以及众多品牌合作伙伴,在北京率先启动“三公里理想生活区”计划。
从“江浙沪包邮”到“三公里理想生活区”:天猫决战北京
|
安全 图形学 云计算
2014沪港黑客马拉松,48小时的挑战等你来 :沪港通行 请走码路
这是一个无科技,不痛快的年份。 2014年,2月28日-3月2日,创智天地联合香港数码港将一起举办“2014沪港黑客马拉松”活动。活动以 "智慧生活 SMARTER LIFE" 为主题,力图创造出让我们的生活更加方便更智能的产品,颠覆有时侯就在热烈的几十小时中诞生!这是SegmentFault 团队在2014年参与联合主办的第一场黑客马拉松活动!
117 0
2014沪港黑客马拉松,48小时的挑战等你来 :沪港通行 请走码路
|
传感器 机器人
日本街头惊现18米巨型高达!全身24处可动,东京大学参与研发
日本街头惊现18米巨型高达!全身24处可动,东京大学参与研发
280 0
泰国:推第三个疫情纾困计划,规模580亿美元
泰国财政部长Uttama Savanayana表示,泰国内阁已于4月7日批准了一个规模为1.9万亿泰铢(578.7亿美元)的一揽子经济纾困计划,以减疫情造成的影响。
羽顺壁挂炉连续三年荣获广东省守合同重信用企业称号
诚信是人类社会普遍的道德要求,是个人立身处世的基本规范,更是企业存续发展的重要基石。近日,2018年度“广东省守合同重信用企业”名单正式公布,中山市羽顺热能技术设备有限公司(下文称“中山羽顺”)顺利通过广东省工商行政管理局的最终评审,连续三年获评“广东省守合同重信用企业”荣誉称号。
899 0
|
监控 Java 大数据
8月27日云栖精选夜读 | 北京房租大涨?6个维度,数万条数据帮你揭穿
昨天还幻想海边别墅的年轻人,今天可能开始对房租绝望了。 8月初,有网友在“水木论坛”发帖控诉长租公寓加价抢房引起关注。据说,一名业主打算出租自己位于天通苑的三居室,预期租金7500元/月,结果被二方中介互相抬价,硬生生抬到了10800。
2441 0
|
新零售 黑灰产治理
全国首例电商平台诉“刷手”案宣判:阿里打1元官司获胜
淘宝所建立的销量排名、信用排名等评价体系,是消费者选择商品的决策依据之一,“刷单”会对消费者产生严重误导,也损害淘宝的声誉和竞争力,且会污染数据的真实性。
1209 0