您的位置:网站首页 > Java工具 > 正文

以大数据名义:到底那个平台的车价更低?

类别:Java工具 日期:2017-8-19 20:44:07 人气: 来源:

  经常在社区里看到网友在谈论某某平台的车价更低等,想要寻找更实惠的价格。但大多数帖子是针对的是某辆车,或某车型车系,从感觉上或是以孤立的数据给出的结论,而没有效的数据支持。从统计上讲,单车或车系并不能代表平台的情况,想要对比平台的价格,唯有在同一纬度上进行抽样或全量数据分析,才能得出正确结论。

  这里仅对车价进行研究。那么,究竟怎样才算平台的价格低呢?网上其实有很多不靠谱的结论,例如日本人比中国人身高低,也许山东大汉去日本看的确会有之样的结论,但是如果从全国抽取一批人计算平均值,特别是加上南方后,我们的结论是相反的。其实相当一部分地区的营养和锻炼还是跟不上的。回到二手车,网上车辆千差万别,豪车、跑车的价格跟微面完全不是一个级别,但从统计或大数据角度看,同一年限的车,我们比较平均的折价,才算是比较合适的口径。

  有的平台用的是含税价,这里为保持统一会进行转换,车辆指导价=含税价*1.17/1.27,有兴趣的童鞋可以研究一下税率。

  上架价格不等于最终成交价,成交价才是最好的依据,但成交价的数据暂时获取不到,不过,从网上评论看,8万的车辆砍价三五千是没问题的。由于各个平台其实都可以砍价,我们暂且认为砍价的幅度相似,可以以上架价格为准,上架价格后续调整的为少数,不影响我们最终结论,予以忽略。

  数据准备主要是用数据爬虫爬取各大交易平台的交易价格,由于时间,这里只选择人人车、瓜-子二手车,优-信二手车这三个成交量大并且具有代表性的平台,来获得一批车辆交易信息,做为抽样数据。

  最终抽取的有效数据量为人人车2756条、优-信7704条、瓜-子25894条。为啥有的多有的少?这是由于网站的分页策略不同,人人车的分页若要抓取更多数据的话需要更多分类去穷尽(好吧,是由于楼主比较懒没有去处理更多分页)。

  三个平台的数据量并不相同,但若都随机抽取2756条,与我们使用全量数据得到成新率趋势其实是一样的。

  数据中有部分诡异数据,例如某辆20万的车上架价1万,某辆22万的车上架价25万。对该部分数据清理后仅对部分数据点有影响,在大数据的大浪淘沙下,这些离群值对趋势基本没有神马影响,翻不起浪来。

  计算出各个年限的成新率并画出图形。下面是各个平台成新率趋势的展示:横坐标是按月计算使用年限,纵坐标是折价(成新率)。

  从数据范围看,人人车只卖5年内的车辆,优-信的在7年以内,至于瓜-子兄则是来者不拒呀,12年多系不系接近报废呀。

  虽然我们也能经常看到准新车跟新车一个价,但从平均来看,还是新车即打8折,年限越多折价越多,基本是线性的。

  基于车商的优-信的价格是最高的,车商也要赚钱嘛,而且的车辆基本上都该补的补该修的修,也是有成本的。

  推荐:

  

关键词:分页工具使用
0
0
0
0
0
0
0
0
下一篇:没有资料

相关阅读

网友评论 ()条 查看

姓名: 验证码: 看不清楚,换一个

推荐文章更多

热门图文更多

最新文章更多

关于联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助

郑重声明:本站资源来源网络 如果侵犯了你的利益请联系站长删除

CopyRight 2010-2012 技术支持 FXT All Rights Reserved