在楼盘现场,我们可以看到销售用的密密麻麻的销控表,每一套房子的单价和总价都可以在上面找到,不同户型单价自然也不一样。定价因素一般由开发商所设定,各有各家规则。一般来说,决定房价单价高低的因子有:
楼层,如果高层景观好,那么高层的单价会高于低层;反之如果是没有电梯的洋房,那么低层可能会高过高层。
朝向,按照国人习惯,肯定是东南向价格高于西北向。
边单元还是中单元,边单元的价格可能会高于中单元。
户型,看当地客户需求,三房的单价可能贵过二房的,也可能正好相反。
.......
因此,销控表上的价格每一套都可能会不同,一看就让人头晕那种,但暗中应该遵循一定的规律。我一直比较好奇各家的售价规则如何制定。前两天参观杭州某个楼盘的时候,记录了该楼盘的销控表,如果我有个钉子,那么我会想找个锤子——R语言就是我新近获得的锤子,所以利用初步的R语言来分析看看吧。
这个楼盘位于远郊,容积率较低。特征是:
是五层高的小板楼;
户型基本只有两种,2房和3房,全部南北通透;
一幢楼是两个单元,一梯两户,就是1221分布。
总之,这个楼盘户型分布比较简单,朝向完全一样,作为练手的分析还是挺合适的。
首先代入excel表
install.packages("ggplot2");library(ggplot2)
setwd("F://")#设置工作区间
data4 = read.table("sales.csv",header=T, sep=",")
原来的销控表只有房号,所以为了分析,利用substr语句,将room这个房号变量拆解为楼层和房号,例如,102的1拆解为floor,2拆解为房号room2。
#生成楼层
data4$floor<-substr(data4$room,1,1)
#生成房间名
data4$room2<-substr(data4$room,3,3)
可以看出多了两列,楼层和房间名:
因为R语言本身的绘图功能就很强大,试着用最简单的打印方法来看看:
#房间与价格
plot(data4$room2,data4$price)
可以看出,因为楼盘是一梯两户的1221分布,所以房号1和房号2的价格基本上是均匀分布的,大多数集中在22000-24000的区间。房号1稍微高一些。
然后试试功能更为强大的ggplot2包。
#楼层与价格
ggplot(data=data4,group=room2,aes(x=floor,y=price)+geom_point()
或者:gqplot(floor,price,data=data4,color=unit)
可以看出,2楼和3楼的定价较低,1楼最高,而且分布也较为均匀。这大概跟作为远郊盘,1楼没有干扰,风景较好甚或赠送花园面积有关。
#编号与价格
ggplot(data=data4,group=room2,aes(x=code,y=price))+geom_point()
因为编号集中在26,28,32,37,60,61,62,63,65这几个,所以散点图也集中在此几处。房号26,37的最便宜,其次是61,62的。编号60的单位较多且价格差异较大。
然后又用了一招,利用频率多边形freqpoly,这是比较复杂形势的一维连续性分布直方图。
ggplot(data4,aes(price))+geom_freqpoly(aes(y=..density..,colour=floor),binwidth=0.1)
再度分析楼层和价格的关系:
因为不同楼层被分配了不同的颜色(colour=floor),所以可以看出:
红色的1楼集中在22500-25000的价位,分布密度也最为分散;
黄色的2楼则最为左偏,处于便宜的价格区间;
绿色的3楼价格集中度较高,特别在22000左右的价位。
蓝色的4楼在22500有所集中,但也有高价单位;
紫色的5楼价格分布密度基本与2楼相同,但价格更高。
最后做了个线性分析,ms第2层和第5层跟价格的相关较大。
理论上,如果我们能够知道对方的定价规则,那我们可以:1
a. 借鉴对方的定价规则
b. 在茫茫的数字中抓住规律,为我所用。
这次分析仍未能让我看出明确的定价规则,学习之路仍然漫漫。日后找到合适的资料,再度练习!
谢谢观看,欢迎意见。