从2014年对楼市的普遍唱衰,到2015年的价格回暖,到底发生了怎样的改变?本文就尝试通过大数据来和丰富的图表,为大家展现数据背后的数据。 数据采集采用笔者用C#开发的爬虫工具。 数据清洗ETL采用了笔者开发的工具软件。 数据分析采用ipython noteb
从2014年对楼市的普遍唱衰,到2015年的价格回暖,到底发生了怎样的改变?本文就尝试通过大数据来和丰富的图表,为大家展现数据背后的数据。 数据采集采用笔者用C#开发的爬虫工具。 数据清洗ETL采用了笔者开发的工具软件。 数据分析采用ipython note
上一节我们通过爬虫工具爬取了近七万条二手房数据,那么这一节就对这些数据进行预处理,也就是所谓的ETL(Extract-Transform-Load) 一.ETL工具的必要性 数据分析的前提是数据清洗。不论如何高大上的算法,遇到错误数据,一个异常抛出来,绝对尸
上一节我们通过爬虫工具爬取了近七万条二手房数据,那么这一节就对这些数据进行预处理,也就是所谓的ETL(Extract-Transform-Load) 一.ETL工具的必要性 数据分析的前提是数据清洗。不论如何高大上的算法,遇到错误数据,一个异常抛出来,绝对尸
一. 前言 房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼。正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练。从数据采集,到清洗,分析,和最终可视化和报告的呈现,实现一次完整的流程。一方面可
一. 前言 房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼。正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练。从数据采集,到清洗,分析,和最终可视化和报告的呈现,实
应不少读者的要求,笔者总结北京2014年到2015年涨幅较大的几个区域,并按照涨价百分比(而非绝对涨价值)绘制了如下的北京楼市涨跌地图: 同时,笔者总结了涨价幅度较高的六大区域(凑个吉利数字吧(∩_∩))。 第六名.东城区(东西城合并?平均涨价14%) 东城
最近房价长得确实厉害,不少卖家捂盘惜售,坐等涨价。本文作者获取了某房产交易公司的33万条交易数据,比挂牌价更真实。 因为2011年以后的数据相对完善,所以我们尝试从五年成交数据来分析其内在规律。(编者注:楼市交易变化迅速,所有时间统计以”月“为单位) ◆ ◆