南京的房子有多贵| 分析近20000套二手房的数据(下篇)

字数 1601阅读 443

这是菜鸟学Python的第112篇原创文章

阅读本文大概需要3分钟

前面一篇文章写了如何爬取南京20000多套二手房的信息,算是一个铺垫,今天我们就来深入分析一下这些数据,看看南京房子到底有多贵. 有多少豪宅,多少的富人区,哪些房子,哪些区域比较火比较贵!有没有性价比高的房子可以挑选!这些数据的背后隐藏了什么故事!这次我用可视化来反映数字里的秘密!

南京地图


南京一共有11个区域:浦口区,建邺区,雨花台区,江宁区,鼓楼区,玄武区,秦淮区. 地图最上面有六合区,地图最下面还有一个溧水区,高淳,西边还有一个栖霞区。
由于高淳和溧水房源特别少,那么我们就重点看南京的主要9个区的情况

1.二手房数据总览

上一篇爬取的数据我全部存在一个csv文件中有18000多条数据,我一共抽取了8个维度.(链家上明明写20864套,核对了几遍为啥只有18000不到,我也很奇怪呢)

  • 房子的装修,面积,总价,房子的小区名字,所在区域,单价,房间多少和朝向.
  • 基本这8个特征值,包括了房子的绝大部信息,而且数据我已经清洗过,为我们下一步数据分析做好了准备.



    纵览一下南京二手房:


1).装修情况
精装5105套,简装3011套,毛胚:981套,其他8830套

2).最大/小的面积,最贵和最便宜的二手房
最大的面积有644平米,最小的面积只有22平米,我很想知道这都是什么房子:


最小的是雨花区的一个22平米的叫"明门公寓",也是总价最低的。
最大的是大名鼎鼎的钟山高尔夫别墅,总价最高的5800万,单价近9万
整个二手房平均总价近300万,也就是低于300万很难选到好房子.
3).总价在600万以上的精装修的豪宅

600万以上的豪宅有331套,而且面积都是大户型,富人真多!

4).那个区域的二手房比较多
鼓楼2995,浦口2987,建邺2968,秦淮2863,这四大热门区域很多房子在出售,相信有少投资客在这些区域,后面我们会深入挖掘一下

5).每平米最贵和最便宜
最贵的11万一平米的,最便宜的是1万左右,均价在3万左右,南京的房子相当的贵啊!

6).出售中最多的小区
发现诚品城和江佑铂庭这两个小区出售的最多,为啥呢? 仔细查看发现这两个楼盘一个在南京最东边,一个在最西边。看来投资客很多啊,估计获利不少,准备出货吧.

2.单维度可视化分析

我们分别从总价,面积,均价,区域这些基本维度来可视化看一下南京的二手房.

1).均价


南京房子单价分布图,发现每平方小于2万的房子非常少,均价6.5万以上的房子也非常少.市面上大部分都是是在3万左右二手房.
2).总价

  • 去掉一些特殊的豪宅,南京的房子只有少部分是在2000万以上的,我们重点分析2000万以内的房子的情况
  • 发现200-400万的房子特别多。峰值在200万左右的房子有5000套以上,从600万开始数量慢慢下降.
    3).面积

    南京二手房市场上,小面积的房子特别多,其中80-90的房源非常充足!看来是小户型的比较好卖啊,那小户型的几房几厅的比较多呢

4).房间数


看了市面上以3房的居多,其次是2房的,发现2房一厅和2房2厅的比例大概是7成,而3室1厅的仅有3室2厅的4成. 看来户型里面还是3室2厅的比较好!

3.双维度可视化分析

双维度分析,我们挑几组相关性比较大的维度分析一下:

1).面积和总价

  • 房子的面积和总价的关系图,面积基本集中在50-300平米之间,价格在1000万的。但是发现50平米的房子数据也非常密集,300平以上的房子急剧减少

  • 我们把房价面积和价格分别取平方根和对数,发现50-100平米的房子价格线性关系非常明显

  • 而100-200平米的房子,随着面积的增长价格并没有出现线性变化. 还是小三房比较好卖啊
    2).房子面积和所在区域

  • 看来面积比较大的房子集中在南京江宁区,秦淮区和浦口区。而建邺区箱体长度非常大,而六合区因为数据非常少,箱体非常小.

  • 而房间面积分布比较均匀的是,鼓楼区和玄武区,基本都差不多,集中在50-100之间,说明小面积的房子主要分布在鼓楼和玄武两个地方.
    3).房子均价和区域

  • 看来是建邺区和鼓楼区的均价最高,建邺区的均价在38000左右,鼓楼在35000左右 ,看来富人都云集在这两个区域.浦口和江宁均价相对低一些,而且箱体长度很小,说明价格分布比较均匀.

  • 另外鼓楼区和玄武区的异常值非常多,尤其是鼓楼区可以看出6万到9万多的数据异常很多,说明鼓楼区的投资非常旺盛。因为学区房非常集中在鼓楼,而异常值最少的江宁区,江宁的学区看来不行。

4.多维度可视化分析

一个好的二手房地段,面积,价格和装修,这4个要素之间分布关系是怎么样的呢,我们来看一下:

  • 很明显红色区域非常集中,红色区域是鼓楼区的房子大部分都是精装,面积在100左右,而总价在500万左右的数据量很大
  • 而1000万左右的房子出现在绿色区也就是建邺区,面积在200-300平米
  • 1500万的房子出现在栖霞区。看了真正的豪宅还是在栖霞区,而且毛胚居多.
    本篇已经用了13个图片,限于篇幅大小,多维度我就不再展开了。

结论:

南京的房子真心不便宜啊,还有很多深入的数据我没有来得及写上去。以后我会再出一篇深入的地产数据分析报告给大家.如果哪个中介公司看到这份数据有兴趣可以交流。希望能有更细致和准确的数据集挖掘一下,屌丝希望能找出最佳性价比的二手房.

关注微信公众号“菜鸟学python”,获得更多免费电子书和源码资料

推荐阅读更多精彩内容