经常在社区里看到网友在谈论某某平台的车价更低等,想要寻找更实惠的价格。但大多数帖子是针对的是某辆车,或某车型车系,从感觉上或是以孤立的数据给出的结论,而没有效的数据支持。从统计上讲,单车或车系并不能代表平台的情况,想要对比平台的价格,唯有在同一纬度上进行抽样或全量数据分析,才能得出正确结论。
这里仅对车价进行研究。那么,究竟怎样才算平台的价格低呢?网上其实有很多不靠谱的结论,例如日本人比中国人身高低,也许山东大汉去日本看的确会有之样的结论,但是如果从全国抽取一批人计算平均值,特别是加上南方后,我们的结论是相反的。其实相当一部分地区的营养和锻炼还是跟不上的。回到二手车,网上车辆千差万别,豪车、跑车的价格跟微面完全不是一个级别,但从统计或大数据角度看,同一年限的车,我们比较平均的折价,才算是比较合适的口径。
有的平台用的是含税价,这里为保持统一会进行转换,车辆指导价=含税价*1.17/1.27,有兴趣的童鞋可以研究一下税率。
上架价格不等于最终成交价,成交价才是最好的依据,但成交价的数据暂时获取不到,不过,从网上评论看,8万的车辆砍价三五千是没问题的。由于各个平台其实都可以砍价,我们暂且认为砍价的幅度相似,可以以上架价格为准,上架价格后续调整的为少数,不影响我们最终结论,予以忽略。
数据准备主要是用数据爬虫爬取各大交易平台的交易价格,由于时间,这里只选择人人车、瓜-子二手车,优-信二手车这三个成交量大并且具有代表性的平台,来获得一批车辆交易信息,做为抽样数据。
最终抽取的有效数据量为人人车2756条、优-信7704条、瓜-子25894条。为啥有的多有的少?这是由于网站的分页策略不同,人人车的分页若要抓取更多数据的话需要更多分类去穷尽(好吧,是由于楼主比较懒没有去处理更多分页)。
三个平台的数据量并不相同,但若都随机抽取2756条,与我们使用全量数据得到成新率趋势其实是一样的。
数据中有部分诡异数据,例如某辆20万的车上架价1万,某辆22万的车上架价25万。对该部分数据清理后仅对部分数据点有影响,在大数据的大浪淘沙下,这些离群值对趋势基本没有神马影响,翻不起浪来。
计算出各个年限的成新率并画出图形。下面是各个平台成新率趋势的展示:横坐标是按月计算使用年限,纵坐标是折价(成新率)。
从数据范围看,人人车只卖5年内的车辆,优-信的在7年以内,至于瓜-子兄则是来者不拒呀,12年多系不系接近报废呀。
虽然我们也能经常看到准新车跟新车一个价,但从平均来看,还是新车即打8折,年限越多折价越多,基本是线性的。
基于车商的优-信的价格是最高的,车商也要赚钱嘛,而且的车辆基本上都该补的补该修的修,也是有成本的。
推荐:
网友评论 ()条 查看